Séminaire Analyse de données et fouille de textes, 11 et 20 mars 2015.
Séminaire Analyse de données et fouille de textes.
Université Sorbonne Nouvelle - Paris 3
Organisateurs
Fanny Georges, Maitre de conférence
Lucien Castex, Ingénieur de recherche
CIM/MCPN (Université Sorbonne Nouvelle)
Deux séances : 11 mars 2015, 20 mars 2015,
Les données textuelles se caractérisent par leur complexité et leur multimodalité. La fouille de texte mobilise à la fois des outils statistiques, informatiques, linguistiques et du traitement automatique des langues.
Ce séminaire composé de deux séances sera consacré d’une part à la constitution d’un corpus, de l’extraction au traitement des données (données du web, des réseaux socionumériques, de la presse) et d’autre part à l’analyse de ce corpus : classification, entités nommées, lemmatisation, indexation, découverte de similarité.
La première matinée sera consacrée à R et à la méthodologie: méthodes statistiques, structures relationnelles, particularité des données non structurées.
Modalités d’inscription : ce séminaire est ouvert aux doctorants et aux chercheurs sur inscription dans la limite des places disponibles (contact@eneid.univ-paris3.fr).
Les participants devront se munir d’un ordinateur portable. Les logiciels et une bibliographie détaillée seront fournis aux participant sur la page du séminaire.