Credits:
4
Hours:
42
Area:
Big Data Sensing & Procurement
Description:
Il modulo prevede la descrizione della struttura di un motore di ricerca e di strumenti di Text Mining, analizzando le loro caratteristiche e limiti dal punto di vista computazionale, dei parametri precision/recall/F1, e di espressività delle interrogazioni supportate. Il modulo prevede anche una parte hands-on in cui si descriveranno e utilizzeranno alcuni ben noti strumenti open-source Python per il crawling e analisi di pagine web, l’annotazione semantica di testi (TagMe), e l’indicizzazione di collezioni documentali (ElasticSearch).
Technics and tools:
TagMe, Rake, Python