Presentazione di TaLTaC2

TALTAC sta per Trattamento Automatico Lessicale e Testuale per l'Analisi del Contenuto.

Taltac:

Con la versione 2.0 del programma, rilasciata nel novembre 2005, l'acronimo si è arricchito di una seconda C - TaLTaC2 - che intende sottolineare un'ulteriore finalità di ricerca: l'analisi del Corpus in quanto tale, ovvero lo studio di alcune sue caratteristiche, a prescindere dal contenuto.
Il trattamento automatico, secondo un approccio lessicometrico, permette infatti di scoprire alcune costanti di un testo, una sorta di Dna del corpus.
Alla fine del 2007 il software è presente in Italia in oltre 50 dipartimenti universitari, in più di 20 centri di ricerca e istituzioni di interesse nazionale, nonché in alcune università straniere.

TaLTaC2 è composto da un insieme di strumenti che consentono lo studio di qualsiasi tipo di dati di natura linguistica, raccolti in forma di collezione di testi come un unico Corpus, utilizzando le tecniche della "statistica testuale" (*). Questo approccio consente di studiare informazioni non strutturate presenti in una base documentale di ampie dimensioni (centinaia o migliaia di pagine, o file anche di 100MB), unitamente a informazioni strutturate (variabili quantitative o qualitative) contenute in un database ad essa associato.

TaLTaC2 è predisposto sia nell'input che nell'output per l'utilizzo di altri software di text analysis e text mining, in particolare quelli tipici dell'approccio lessicometrico, quali Alceste, Hyperbase, Lexico, Spad, Sphinx, T-Lab, Tropes. (Links)

In generale, l'analisi svolta in Taltac2 permette di selezionare ed estrarre l'informazione più significativa dal corpus di testi analizzato (linguaggio peculiare, linguaggio rilevante, linguaggio specifico) e di operare secondo i principi del text mining mediante ricerche per parole chiave o per concetti.

I risultati ottenuti in Taltac possono interagire direttamente con altri software linguistici (Tree Tagger, Nooj-Intex, Lexical Studio) e statistici (Spad, Spss, Sas).

La conoscenza del programma è facilitata dalla consultazione di una Guida on-line, di tipo ipertestuale, con consultazione "in context" (l'help si posiziona sull'argomento che si sta trattando).

Dall'uscita della seconda release vengono periodicamente organizzati corsi di formazione per un uso completo del programma. Tali corsi sono abbinati al rilascio di una licenza. Per iscriversi basta compilare il form nel sito del Dipartimento DSGSSAR della SAPIENZA-Università di Roma

torna su

TaLTaC2 accetta in input

torna su

TaLTaC2 produce in output

torna su

 


(*) Riferimenti bibliografici essenziali:

Bolasco, S. (1997). L'analisi informatica dei testi in Ricolfi, L. (a cura di) La ricerca qualitativa. Roma: NIS.
Bolasco, S. (1999). L'analisi multidimensionale dei dati. Roma: Carocci ed., (cf. Cap. 7: Analisi dei dati testuali, pp. 179-248).
Bolasco S. (2002) Integrazione statistico-linguistica nell'analisi del contenuto, in B. Mazzara (a cura di) Metodi qualitativi in Psicologia Sociale. Prospettive teoriche e strumenti operativi, Carocci Ed. Roma, p. 329-342.
Bolasco S. (2005). Statistica testuale e text mining: alcuni paradigmi applicativi, Quaderni di Statistica, Liguori Ed., 7, p. 17-53.
Cipriani R., Bolasco S. (a cura di), (1995). Ricerca qualitativa e computer, Milano: Franco Angeli.
Lebart, L., Salem, A. (1994). Statistique textuelle. Paris: Dunod.
Lebart, L., Salem, A., Berry J. (1998). Exploring texual data. Dordrecht: Kluwer Academic Publisher

Per altri riferimenti vai a Materiali

torna su

 
true religion cargo shorts, true religion jeans for kids, cheap true religion jeans for women, true religion billy super t, true religion discount, true religion promo code, true religion sweatpants, true religion for babies, true religion joey super t, true religion jean shorts