Avec Revirada traduire (en) languedocien et gascon en tenant compte des infra dialectes


Le Congrès permanent de la langue occitane a rendu public son nouvel outil traducteur automatique, pour les gascon et languedocien. Un projet européen transfrontalier décidé fin 2020 a permis de financer l'opération.



Le principe pratique de Revirada, et les divers moyens de télécharger ou installer l'application

Le Congrès permanent de la langue occitane préparait l’affaire depuis2020, et courant octobre il a enfin été présenté. Les linguistes et informaticiens du congrès ont du prendre leur temps pour, dit le dossier de presse fourni, respecter au maximum la diversité dialectale, mais aussi pour « produire une langue moderne, cohérente et de qualité » précise le dossier fournit par le Congrès

Ce sont donc 170 000 mots d’occitan, mais un million une fois les diverses conjugaisons des verbes comptées dans cet outil, jusqu’à présent unique. 125 000 mots français leurs sont associés par le traducteur, soit cinq fois plus que les 26 000 reconnus par le site web du congrès, aujourd’hui communément utilisé par la plupart des rédacteurs de la graphie classique de l’occitan.

400 modèles de conjugaison sont aussi proposés en occitan gascon comme languedocien. Encore faut-il souligner que les terminaisons verbales, souvent différentes d’une variété d’occitan à l’autre, et parfois au sein d’une même variété, sont proposées dans leur diversité ; elles sont 35 000 .
 


Voilà donc un travail monumental, permis par un projet transfrontalier de l’Union Européenne Poctefa Linguatec, ainsi financé à hauteur de 1,227 M€ avec d’autres projets en Aragon et Euskadi.

Pour quel résultat ? Les traducteurs automatiques, nous le savons tous, n’apportent pas une réponse parfaite à qui les utilise, mais permettent de dégrossir, et de mieux en mieux. Il est possible d’imaginer avec Revirada, demain, une politique de bilinguisation des cartes de ville ou des signalisations, ou des textes courts d’information muséale ou à l’inverse la mise à disposition de résumés français de textes rédigés en occitan… par des employés n’ayant qu’une connaissance imparfaite de l’occitan, mais qui s’adresseraient à un correcteur – humain – n’ayant plus qu’une partie du travail à faire.

Un outil facilitateur de politiques en faveurs de la langue occitane, donc.

La perfection n’étant pas de ce monde les retours d’utilisateurs seront bienvenus, l’équipe du Congrès s’en servira pour améliorer l’outil. Et, on peut seulement le conjecturer, en ferait son miel pour élargir le spectre des variétés d’occitan proposées dans le futur. Le provençal et le nord occitan n’ayant pas été la priorité en la matière, comme d’habitude serait-on tenté d’ajouter. Cependant, là-dessus nous ne pouvons rien affirmer encore, le dossier de presse fourni ne propose pas de perspectives. 


Lundi 24 Octobre 2022
Michel Neumuller