Présentation de l'option
« Ingénierie de la langue »
(finalité professionnelle)

Département d'Informatique
U.F.R. Sciences de Luminy
Université de la Méditerranée

Présentation et objectifs

Description :

Le Traitement Automatique du Langage Naturel se définit comme l'ensemble des méthodes et techniques d'analyses en vue d'une utilisation et d'un traitement de la langue par les machines. C'est un domaine qui accompagne l'informatique depuis ses débuts. Dès l'apparition des premiers calculateurs électroniques, quelques chercheurs eurent l'idée que ces machines pouvaient traiter des mots aussi bien que des nombres. La recherche fondamentale dans ce domaine est à l'origine de la création d'outils pour la recherche elle-même ou en vue d'applications industrielles qui sont nombreuses et diverses.

L'objectif de cette option est d'amener des étudiants issus de la licence d'Informatique à poursuivre une solide formation d'informaticien et à bénéficier d'une compétence en Traitement Automatique de la Langue (TAL) et plus généralement en intelligence artificielle. En s'appuyant sur les compétences des linguistes du laboratoire, l'objectif de cette formation est de transmettre aux étudiants les bases essentielles en linguistique pour les utiliser dans des cadres applicatifs. Par rapport aux formations existantes en France de type Bac+5 destinées surtout à des étudiants de sciences humaines, nous pensons que nous offrons aux étudiants la possibilité d'être rapidement opérationnel dans un contexte industriel.

Les membres de l'équipe pédagogique ont un expérience importante tant dans l'enseignement dans le domaine du TAL que dans le développement d'applications et la mise en place de projets. La plupart des cours spécifiques de cette option ont déjà été proposés aux étudiants dans le cadre des diplômes actuels (option TAL en Maîtrise d'Informatique, DESS I et DEA). Des supports de cours existent (polycopiés, transparents, etc.) ainsi que des logiciels.

Dans notre option, nous introduisons les principaux formalismes du TAL, nous abordons le traitement de la langue sous ses différents aspects : lexical, syntaxique, sémantique, pragmatique ainsi que morpho-dérivationnel et transformationnel. Nous parachevons la formation informatique des étudiants avec des cours sur les langages de programmation les plus utilisés en ingénierie de la langues (PROLOG, PERL, JAVA). Nous formons les étudiants à la manipulations d'outils de la recherche (analyseurs, taggers, transducteurs, etc.) pour les intégrer dans des applications.

Un grand nombre de débouchés s'offre aux étudiants ayant suivi cette formation. Dans le domaine spécifique du TAL, il faut citer la correction orthographique (intégrée dans des traitements de texte ou des système d'OCR), la traduction automatique, la communication homme/machine en langage naturel, le web sémantique, les systèmes faisant intervenir la parole (dictée automatique, système de guidage automobile), les systèmes de recherche d'information, de mémoire d'entreprise, etc. Les domaines dont une compétence TAL peut être un plus sont tous ceux qui touchent à l'édition traditionnelle et électronique, la construction de dictionnaires, la gestion électronique de documents, etc.

Responsable : Alexis Nasr

Effectif prévu : 20 étudiant(s)

Programme des enseignements

Programme du semestre S3 :

Programme du semestre S4 :