Seminario Interdipartimentale di Algoritmica
 
 
 

Lunedì 22 aprile 2002  ore 12:00
Compressione dati per la classificazione di sequenze testuali
Dr. Vittorio Loreto
Dipartimento di Fisica, Universita' di Roma La Sapienza

Dipartimento di Informatica e Sistemistica, DIS
via Salaria 113, II piano
Aula C2

Abstract:
In questo seminario sara' presentata un'applicazione della teoria dell'informazione nel campo della linguistica. Illustreremo un metodo generale per l'estrazione di informazione sulla similarita' tra sequenze di caratteri, ad esempio testi, catene di DNA o generiche serie temporali, basato sull'applicazione di tecniche di compressione dati. Saranno presentati i risultati dell'applicazione del metodo ad alcuni problemi di base della linguistica quali ad esempio il riconoscimento della lingua di un testo, attribuzione di paternità, classificazione di lingue e classificazione automatica.