Termin - Detail

Introduction au Text Mining

Buts

Ce cours a pour objectif de faire découvrir une vision d’ensemble des différentes possibilités offertes par le text et data mining, méthode incluse dans le nouveau projet de loi sur le droit d’auteur. Les participants appliqueront également des algorithmes de text mining sur des corpus de leur choix, comme par exemple les données de catalogue de bibliothèque.

Contenu

Suite à une courte présentation théorique les thèmes suivants seront abordés :

  • Les langages formels / Langages naturels
  • L’analyse lexicale, l’analyse syntaxique et l’analyse sémantique
  • L’encodage de caractères, les expressions régulières
  • La segmentation de texte
  • L’indexation et la recherche d’information
  • La reconnaissance d’entités nommées
  • Les ressources linguistiques, WordNet


La seconde partie du cours s’axe sur la prise en main, par le biais d’exercices, de l’outil Python / NLTK et sera conclue par la réalisation d’un mini-projet de text mining, seul ou en groupe.

Public cible

Bibliothécaires scientifiques qui doivent être à l’aise avec les outils informatiques courants.

Divers

Les participants sont priés d’amener un ordinateur portable et idéalement d’avoir préalablement installé le logiciel NLTK (http://www.nltk.org/install.html).

Ouvrage de référence : Perkins, Jacob. Python 3 Text Processing with NLTK 3 Cookbook : over 80 practical recipes on natural language processing techniques using Python's NLTK 3.0. Packt Publishing, 2014

Kategorie

  • Weiterbildung

Datum

31.10.2017

Zeit

09:00–17:00

Ort

BCUL site Unithèque
Bibliothèque cantonale et universitaire, Campus de Dorigny, Lausanne, Schweiz

Plan d'accès (PDF)

Referierende

Dr. Mathieu Vonlanthen

Ingénieur EPF, Développeur logiciel, Université de Genève et formateur et consultant dans le domaine des technologies numériques

Sprache

Français

Prix:

CS 2 (voir prix et conditions)

Veranstalter

BIS

Freie Plätze

ausgebucht


Zur Übersicht