28 aprile 2009

OLAP e Statistical Databases: similarità nella terminologia

Veramente interessante questo articolo di Arie Shoshani sulle similarità (e differenze) esistenti tra le terminologie tipiche della Statistica, da un lato, e del Data Mining , dall'altro (...quest'ultimo inteso in senso molto generale...). Anche se di una decina di anni fa, l'articolo è sicuramente attuale per chi lavora in ambito "analitico". Chi infatti ha una formazione "statistica" e si trova a lavorare con i database, rifletterà sicuramente sulle analogie esistenti tra i termini normalmente utilizzati nei testi di Statistica e quelli molto utilizzati dai produttori di software per il Data Mining e la Business Intelligence. L'esempio più evidente è l'analogia tra multidimensional space e data cube. Direi che di grande significatività è la tabella dell'articolo sulle corrispondenze tra le due differenti terminologie:





02 aprile 2009

Le novità di R(D)COM: statconnDCOM

Da un po' aspettavo questo aggiornamento e devo dire che le cose sono cambiate abbastanza! Non solo è cambiato il sito, ma anche le modalità di installazione, configurazione e download. Diventa anche più evidente la relazione tra il progetto rcom e la statconn di Thomas Baier ed Erich Neuwirth (e quindi i relativi corsi di formazione).
La novità più evidente è la possibilità di scaricare RAndFriendsLight, ossia un pacchetto che contemporaneamente installa e configura tutto il necessario:
R 2.8.1
rscproxy 1.0-12
rcom 2.xx
RExcel 3.0-11 .
Credo comunque che la situazione più frequente sia quella in cui lo sviluppatore disponga già di R sulla propria macchina. In tale caso (considerando che è obbligatoria una versione >= 2.7.2) sarà necessario optare per le altre modalità indicate nell'area downolad.
La procedura di configurazione, comunque, è chiaramente descritta qui.
Ovviamente con questa nuova struttura del progetto si sottolinea (giustamente!!!) che la redistribuzione del prodotto in altre soluzioni necessità di una licenza commerciale...