30 settembre 2008

Gestire i Missing Value in R

La visualizzazione e l'imputazione dei "dati mancanti" in un'indagine , in particolare nella Statistica Ufficiale, è sicuramente la fase più importante per garantire la qualità del dato statistico . La letteratura sull'argomento è matura e ben fornita, e i software commerciali non prevedono, a mio parere, un modulo "completo" (ovviamente in ognuno di questi ci sono possibilità di sviluppare grafici ad-hoc e applicare un qualsivoglia test).
In particolare l'ISTAT ha sviluppato in SAS il software
CONCORD per il controllo e la correzione dei dati, strumento potentissimo e liberamente scaricabile, ma che appunto necessita del SAS.
In R esiste la possibilità di lavorare con
VIM, che sta appunto per Visualization and Imputation of Missing values. Come gli stessi autori sottolineano, il cuore del pacchetto sta nell'insieme dei possibili grafici utili alla scoperta e alla gestione dei missing values.
In realtà, analogamente a quanto ho già scritto per
Rcmdr, un altro grande aspetto è la possibilità di ricorrere all'interfaccia grafica (sviluppata mediante il pacchetto tcltk). Non dimentichiamo, infine, le possibilità di integrazione di R con il pacchetto office e la possibilità si sviluppo in maniera estremamente immediata delle interfacce grafiche (ad esempio via Access).
Concludo osservando che l'ISTAT ha già espresso
parere sostanzialmente postivo per l'utilizzo di R ed ha avviato un processo di migrazione a tale strumento...quindi R anche nella statistica ufficiale.

09 settembre 2008

RExcel su Wikipedia

Su Wikipedia c'è ora una breve descrizione di RExcel; molto interessanti i link riportati nelle References.