Présentation

Dates : 9 – 13 juillet 2018
Lieu : Centre de Conférences de la Station Biologique de Roscoff

Thématique :

L’école vise à présenter une sélection d’approches, méthodes et outils du traitement automatique de la parole et de la langue, pouvant être utiles au linguiste travaillant sur la parole dans des domaines aussi divers que la phonétique, la phonologie, la dialectologie, la typologie, l’acquisition, l’apprentissage des langues, la sociophonétique, les pathologies de la parole. . .

Ainsi, un alignement forcé automatique entre signal de parole et transcription manuelle permet d’accélérer de nombreuses étapes de mesure et d’analyse linguistique proprement dite ; des applications mobiles d’enregistrement telles que LIG-Aikuma permettent d’accélérer la collecte de corpus du linguiste de terrain ; les grands corpus collectés pour le traitement automatique et reflétant l’usage de la langue parlée à un moment donné peuvent étre précieux pour les linguistes afin de tester des hypothèses et théories à plus grande échelle, de quantifier des phénomènes connus ou de découvrir des phénomènes ignorés jusque-là.

Il s’agit, en particulier, de fournir les bases nécessaires à la compréhension des méthodes bayésiennes et neuronales, et de leur intérêt pour répondre à des questionnements scientifiques relatifs à la linguistique de corpus. Les questions épistémologiques liées à ces approches seront également abordées.

Public :

L’école s’adresse prioritairement à des chercheur·e·s, en début de carrière ou confirmé·e·s, utilisant des corpus oraux, intéressé·e·s par l’exploitation numérique de leurs données ou souhaitant étendre leurs approches et hypothèses à de données de taille importante nécessitant un traitement automatique. En fonction des places diponibles, des étudiant·e·s en doctorat et/ou en master sont également encouragé·e·s à s’inscrire. Les formations s’adressent prioritairement à des participants du domaine SHS de la linguistique de corpus oraux, mais des participants issus du domaine INS2I du traitement automatique des données orales sont également les bienvenus dans la mesure où leurs travaux nécessitent une meilleure prise en compte des enjeux linguistiques liés à la modélisation des données orales.