Formation

La formation consiste en 4,5 jours de cours magistraux et de travaux pratiques (50% cours, 50% TP) articulés autour des thèmes prioritaires: linguistique de corpus, phonétique et phonologie de corpus, outils et méthodes de traitement automatique de la parole à l’usage des linguistes, fondements de l’apprentissage automatique pour l’analyse de corpus linguistiques, méthodes et outils pour la recherche d’information, questions épistémologiques liées à l’utilisation de méthodes quantitatives en linguistique.
Les travaux pratiques (essentiellement à l’aide des toolkits Kaldi, Weka, R, Praat) seront réalisés sur des corpus fournis par les organisateurs. Nous proposons aux participants qui souhaitent travailler sur leurs propres données de prendre contact avec les organisateurs afin de vérifier la faisabilité de leur projet d’étude.

Une plateforme avec les contenus des cours et d’autres informations utiles est actuellement en train d’être mise en place ici.

Parmi les intervenants pressentis et/ou confirmés:

Alexandre Allauzen, LIMSI, Université Paris-Saclay
Nicolas Audibert, LPP, Université Paris 3
Bruno Bachimont, Sorbonne Université / UTC Compiègne
Laurent Besacier, LIG, Université UGA Grenoble
Maud Ehrmann, EPFL, Lausanne
Yannick Estève, LIUM, Université du Maine, Le Mans
Cédric Gendrot, LPP, Université Paris 3
Mark Liberman, UPenn, Philadelphia
Margaret Renwick, Oxford University