TEXT MINING

Tecnica di Intelligenza Artificiale (AI) che utilizza l'elaborazione del linguaggio naturale (NLP) per trasformare il testo libero, non strutturato, di documenti/database quali pagine web, articoli di giornale, e-mail, agenzie di stampa, post/commenti sui social media ecc. in dati strutturati e normalizzati.

Il TM consente di individuare i principali gruppi tematici di una data serie di documenti; classificare i documenti per categorie predefinite; rilevare nessi tra argomenti, tra autori, tra titoli, etc.; estrarre informazioni specifiche (toponimi, nomi, aggettivi, etc.); addestrare motori di ricerca a compiere azioni determinate; estrarre concetti per la creazione di ontologie (ontology learning).