La traduction automatique et le traitement des caractères chinois

L’incapacité de Google Traduction, Bing Traduction, Baidu Fanyi, et d’autres services de traduction automatique à traduire correctement jī nián dàjí 鸡年大吉 (“Que l’année du coq soit de bon augure”) en plusieurs langues soulève un point vital dont nous avons longtemps voulu parler. Il semble qu’aujourd’hui soit le moment opportun pour le faire.

Vous ne pouvez pas vous attendre à ce que ces services de traduction traitent le cantonais, le shanghaïen, le taïwanais, etc. à moins qu’ils n’aient été programmés spécifiquement et séparément pour le faire, il ne faut donc pas s’attendre à ce qu’ils soient capables de gérer des variations telles que le Sinitique Littéraire* / Chinois Classique** (SL / CC), etc.

 

Traduction automatique, caractères chinois, traduction des caractères chinois

Tout comme le cerveau humain les différentes langues et les différents logiciels de traduction électronique ne peuvent pas être programmés et entraînés de manière à pouvoir traduire simultanément des documents provenant de langues différentes.

La seule exception est lorsque des fragments de ces autres langues ont été intégrés ici et là dans le mandarin moderne standard*** (MMS) et régularisés de telle sorte qu’ils sont utilisés dans le vocabulaire et font partie du MMS, par exemple, mǎidān 买单 / máidān 埋单 埋单 / màidān 卖单 (“payer l’addition”) qui vient du cantonais máidān 埋单 (“demander l’addition / la note”).

Notez que, même si la version MMS de mǎidān 买单 / máidān 埋单 / màidān 卖单 (“payer l’addition”) s’écrit de trois manières différentes, avec trois prononciations distinctes, le logiciel peut les traiter car on peut les trouver en mandarin moderne standard avec une fréquence suffisamment élevée pour être reconnues comme une partie intégrante et naturalisée du vocabulaire du mandarin.

 

Traduction automatique, caractères chinois, traduction des caractères chinois

La traduction automatique continue également de progresser dans la conversion des caractères chinois simplifiés en caractères chinois traditionnels. Il est maintenant possible de convertir un texte en chinois simplifié en chinois traditionnel à l’aide d’une nouvelle fonction et ce grâce à diverses applications qu’on peut ajouter à Microsoft Word. Cependant, il est fortement recommandé de faire vérifier le texte par un locuteur natif de la langue cible. La technologie peut détecter et convertir correctement le caractère, mais la structure de la phrase et le vocabulaire utilisé ne pourraient pas convenir au public cible, et il faudra sans doute apporter des modifications pour rendre le texte culturellement pertinent.

Définitions :

*Les langues sinitiques sont les langues sino-tibétaines dont font parties les différents dialectes de chinois.

**Le Chinois Classique, également connu sous le nom de Chinois Littéraire, est la langue de la littérature classique de la fin de la période des Printemps et Automnes jusqu’à la fin de la dynastie Han, et donc une forme écrite du vieux chinois. Le Chinois Classique est un style traditionnel de chinois écrit qui a évolué à partir de la langue classique, ce qui le rend différent de toute forme moderne parlée de chinois.

***Le chinois standard, aussi connu sous le nom de mandarin standard moderne, mandarin standard ou simplement mandarin, est une variété standard de chinois qui est la seule langue officielle de Chine et de Taiwan, et également l’une des quatre langues officielles de Singapour. Sa prononciation est basée sur le dialecte de Pékin, son vocabulaire sur les dialectes du mandarin, et sa grammaire est basée sur le chinois vernaculaire écrit. 

Kate CHERNAVINALa traduction automatique et le traitement des caractères chinois