Stratégies de prompting pour la traduction automatique : ce qui fonctionne avec différents LLM
* Les prompts simples conviennent pour une compréhension générale ; les prompts de type workflow augmentent la complexité pour des gains limités.
* Conclusion : la spécificité l’emporte sur la complexité, et la révision humaine reste indispensable.
Il est difficile d’échapper au flot constant de titres annonçant qu’un LLM surpasse un autre. Les comparaisons, les classements et les captures d’écran défilent sur les réseaux sociaux, et les différents modèles se tirent la bourre. Mais si votre organisation utilise un seul système, la vraie question n’est pas de savoir quel modèle utiliser, mais comment exploiter au mieux celui dont vous disposez.
Dans cet article, nous examinons trois stratégies de prompting pour la traduction automatique avec trois LLM commerciaux – ChatGPT 5.2, Microsoft 365 Copilot et Claude Sonnet 4.5 – afin de voir quelle stratégie donne les meilleurs résultats. L’objectif n’est pas de mettre les modèles en concurrence, ils servent de bancs d’essai. Le véritable protagoniste est le prompt.
Stratégies de prompting pour la traduction automatique : texte du test et approche
Texte du test
Pour cette expérience, nous travaillons avec un court extrait d’un manuel d’utilisation d’un outil électrique, idéal pour tester des stratégies de prompting pour la traduction automatique en raison du caractère critique pour la sécurité et des contraintes importantes du texte. Le langage est concis et contrôlé, mais suffisamment varié pour révéler les faiblesses potentielles de la traduction automatique.
Pour ce qui est de la méthode de traduction, ce type de texte nécessite une approche fonctionnelle. L’objectif principal de ce genre de document est de fournir des instructions claires étape par étape et d’éviter les blessures et les erreurs d’utilisation. Un traducteur se concentrerait généralement sur les points suivants :
- Clarté des instructions. Les étapes ne doivent pas être ambigües et être faciles à suivre, ce qui peut vouloir dire de restructurer des phrases ou de diviser de longues phrases en anglais en phrases plus courtes en français.
- Style et conventions. La documentation technique suit des conventions et des règles très spécifiques. Le texte doit être clair et ne pas utiliser de structures grammaticales complexes qui pourraient induire en erreur ou distraire le lecteur. La tendance de l’IA à paraphraser et à ajouter des fioritures peut être un inconvénient à cet égard.
- Terminologie cohérente. Les noms des composants et les termes techniques doivent être les mêmes tout au long du texte, que le système les déduise du contexte ou qu’il exploite un glossaire fourni.
- Variante linguistique. L’orthographe, la grammaire et les formulations doivent correspondre à la langue cible indiquée.
- Communication précise des risques. Les avertissements et les mises en garde doivent conserver leur force d’origine, sans être atténués ou exagérés.
Ces points serviront également de critères d’évaluation des traductions automatiques. Ils nous permettront d’évaluer dans quelle mesure chaque stratégie de prompting guide les modèles sur ce type de texte.
Prompts
Voici davantage d’informations sur les trois stratégies de prompting pour la traduction automatique que nous avons testées :
Prompt simple. Il s’agit de la version la plus basique du prompt, dans laquelle nous demandons au système de traduire le texte d’une langue vers une autre. Cette configuration très simple permet de montrer le comportement « par défaut » de chaque modèle face à cette tâche, sans instructions détaillées. Le prompt ne contient encore aucune indication sur le ton, la terminologie ou le style. Ici, notre seule modification consiste à spécifier la variante linguistique cible : le français de Suisse.
« Traduis le texte joint de l’anglais au français (variante Suisse). »
Prompt riche en instructions. Dans ce prompt, nous donnons un rôle au système (un traducteur professionnel de l’anglais vers le français [variante Suisse]) et des instructions claires sur la base du type de texte.
« Tu es traducteur professionnel de l’anglais vers le français (variante suisse) spécialisé dans le domaine de la construction mécanique. Traduis le manuel d’instructions ci-joint en français (variante suisse). Utilise l’infinitif pour toutes les instructions et étapes procédurales. Évite de t’adresser au lecteur. Décris les actions comme des procédures et non comme des ordres. Conserve la terminologie technique telle qu’elle figure dans le glossaire ci-joint. La cohérence terminologique est une priorité. Respecte la formulation standard du français suisse. Divise les phrases anglaises complexes en unités plus petites. Veille à ce que l’ordre des actions reste strictement chronologique. »
Prompt basé sur le processus. Une récente étude de Google s’attache à la décomposition du processus de traduction et pose la question suivante : que se passerait-il si nous demandions à un LLM de traduire comme le ferait un traducteur humain, c’est-à-dire étape par étape ? Au lieu d’un simple prompt « Traduis ceci. », l’étude se penche sur un processus en quatre étapes pour les textes longs :
- une phase de recherche préalable à la traduction, au cours de laquelle le modèle analyse d’abord le texte source et met en évidence les phrases difficiles ;
- une phase de rédaction axée sur la transmission du sens ;
- une phase de raffinement qui peaufine la fluidité et la lisibilité ;
- et une relecture finale pour corriger les problèmes restants.
Pour les besoins de l’expérience, nous n’avons pas apporté de modifications majeures aux prompts utilisés dans l’étude de Google. Le prompt en plusieurs étapes que nous testons ici est une sorte d’utilisation « agentique » des LLM, dans laquelle nous décrivons explicitement les étapes au lieu de laisser un agent les décider de manière autonome.
Résultats du test 1 : stratégie de prompting simple
Le premier test de prompting ne comprend que les informations relatives à la langue cible et à ses variantes. Les trois modèles ont respecté les conventions du français de Suisse, même si l’on peut relever que Claude a utilisé des apostrophes droites à la place d’apostrophes courbes.
Les instructions sont claires et correctement indiquées. Notre texte source contient deux phrases composées qui pourraient être légèrement restructurées en français afin d’être encore plus faciles à suivre.
Nous disposons d’un glossaire prédéfini contenant les termes traduits pour ce texte, qui ne sera fourni aux modèles que lors du test 2. Bien que les termes choisis par les modèles lors du test simple ne correspondaient pas toujours à la terminologie du glossaire, les modèles ont choisi des termes adaptés au type de texte et les ont appliqués de manière cohérente tout au long des traductions.
Quant au style, tous les modèles ont opté pour une formulation formelle. Tous les modèles ont structuré les phrases en s’adressant directement au lecteur avec un registre formel (vouvoiement), en formulant les instructions à l’impératif. Bien que cela ne soit pas incorrect, nous préférerions que le modèle évite cela. L’accent doit être mis sur une communication efficace et rapide. Ce que nous aimerions que l’IA fasse ici, c’est opter pour une forme impersonnelle qui évite de s’adresser directement au lecteur. Nous essaierons d’intégrer cet élément dans le prompt du test 2.
Dans l’ensemble, les trois modèles ont fourni des pré-traductions de bonne qualité. Les aspects permettant de réduire le travail de post-édition sont l’intégration d’une terminologie pré-approuvée et une définition plus précise du style. Il en va de même pour la simplification de la structure des phrases sources composées afin de rendre le texte plus lisible. C’est ce que nous allons essayer de faire dans le test 2.
Résultats du test 2 : stratégie de prompting riche en instructions
La deuxième stratégie de prompting utilise des instructions spécifiquement adaptées à notre texte. Ce genre de prompt nécessite d’analyser le texte en détail. Cependant, cela en vaut la peine si vous travaillez avec des documents standardisés qui suivent des règles de style et de terminologie claires. Une fois que vous avez conçu votre prompt, vous pouvez le réutiliser pour toutes vos traductions automatiques.
Dans ce test, nous avons ajouté un glossaire contenant des termes prédéfinis. Le glossaire comprend un terme délibérément ambigu afin que nous puissions voir si les modèles peuvent le clarifier à partir du contexte. Tous les modèles ont utilisé correctement ce terme, ChatGPT et Copilot utilisant la version longue systématiquement et Claude utilisant les versions longue et courte indiquées dans le glossaire. Toutefois, Copilot n’a pas traduit un autre terme de façon cohérente.
L’information d’utiliser des phrases infinitives pour les instructions (1) a encore amélioré le résultat de deux des trois modèles. ChatGPT et Copilot ont compris la tâche et ont fourni le style et la structure que nous recherchions ; Claude seulement partiellement, car le modèle a généré des phrases passives au lieu d’infinitives à certains endroits.
- Utilise l’infinitif pour toutes les instructions et étapes procédurales. Évite de t’adresser au lecteur.
Donner un exemple (2) de la structure de traduction désirée a amélioré le produit de Claude.
- Utilise l’infinitif pour toutes les instructions et étapes procédurales (exemple : Mount the inner flange onto the spindle à Monter la flasque intérieure sur l’axe.). Évite de t’adresser au lecteur.
En revanche, Copilot a trop pris au pied de la lettre l’utilisation de l’infinitif et a généré des phrases grammaticalement fausses :
- Le poids de la machine fournir une pression suffisante.
Les trois modèles ont livré de bons résultats dans la restructuration des phrases complexes en anglais. Ils ont décomposé une phrase complexe en unités plus petites tout en conservant l’ordre chronologique des actions.
Toutefois, ChatGPT ne respecte pas les conventions typographiques du français du Suisse en utilisation des guillemets anglais, et Claude utilise encore des apostrophes droites.
Résultats du test 3 : stratégie de prompting basée sur le processus
Le test 3 concerne la stratégie de prompting la plus élaborée, à savoir une traduction automatique en plusieurs étapes. Les trois modèles ont produit une pré-traduction assez standard et comparable. Ils ont signalé les ambiguïtés dans la source, proposé des traductions pour les termes clés et mis en évidence les phrases potentiellement problématiques. Il est intéressant de noter que tous les modèles ont utilisé par défaut un registre formel (ChatGPT avec l’infinitif ; Claude et Copilot avec le vouvoiement), même si ce n’était pas précisé.
Une fois à l’étape de la traduction, les modèles ont toutefois eu tendance à ignorer leurs propres analyses préalables. Les normes typographiques suisses ont été partiellement respectées, Claude ayant par exemple remplacé les guillemets français qu’il avait correctement utilisés lors du test 2 par des guillemets anglais.
Dans l’ensemble, la phase de raffinement a empiré la qualité des textes, particulièrement les modifications opérées par Claude et Copilot. ChatGPT a mal géré le terme ambigu dans le glossaire, contrairement au test 2, et a produit une fausse traduction (Un effort de 113 au lieu de Un tiers de l’effort). De plus, sans que cette exigence ait été suggérée lors des analyses des modèles, ces derniers n’ont pas décomposé les structures de phrases complexes en unités plus courtes et plus lisibles dans la langue cible.
Les étapes de raffinement et de relecture ont ajouté étonnamment peu de valeur. Lors de l’étape de « post-édition » et en particulier lors de la relecture finale, il y avait très peu de modifications, et celles opérées étaient superficielles. Elles ne proposaient pas d’améliorations significatives. Aucun modèle n’a introduit de changements substantiels qui amélioraient clairement la précision, la fluidité ou la cohérence par rapport à son propre brouillon. Dans l’ensemble, les traductions finales du test 3 étaient moins bonnes que celles produites avec le prompt riche en instructions du test 2.
Le principal avantage de la stratégie basée sur le processus semble résider dans la phase d’analyse, qui peut être utile pour mettre en évidence les difficultés et les formulations ambiguës. Au-delà, les étapes de raffinement ne se sont avérées utiles que lorsque les prompts contenaient des exigences de style, de registre et de terminologie très spécifiques et concrètes à chaque étape. Un prompt détaillé et riche en instructions a déjà permis d’obtenir de meilleurs résultats au stade de la rédaction, et ce avec moins de latence et moins d’étapes que l’approche complète du processus.
L’IA donnera toujours une réponse
Les trois stratégies de prompting sont viables et peuvent être appliquées en fonction du cas d’utilisation. Le prompt simple de traduction convient parfaitement lorsque vous avez besoin de comprendre un texte de façon superficielle. Il est rapide et généralement suffisant pour saisir l’essentiel d’un texte. Mais sans indications sur le registre, le type de texte ou les contraintes, les modèles font beaucoup de choix qui peuvent ne pas convenir à votre texte.
C’est avec un prompt riche en instructions que les trois systèmes ont obtenu les meilleurs résultats. Avec un rôle, un public, un registre, une orthographe et une terminologie donnés, les traductions sont nettement plus fluides et cohérentes. Un seul prompt bien conçu, qui encode vos exigences dès le départ, s’est avéré être la stratégie la plus fiable.
Le prompt basé sur le processus a montré son intérêt dans la phase d’analyse, où les modèles peuvent signaler les difficultés et les ambiguïtés potentielles. Au-delà, sans instructions concrètes à chaque étape, les étapes de raffinement et de relecture n’ont apporté que des modifications mineures et cosmétiques plutôt que des améliorations significatives. Un plus grand nombre d’étapes n’est pas synonyme d’une meilleure traduction.
L’IA donnera toujours une réponse. La question est de savoir si ses suggestions sont cohérentes, nécessaires et adaptées à vos contraintes. L’intervention humaine reste indispensable, en particulier lorsque la clarté et la sécurité sont en jeu.
La spécificité l’emporte sur la complexité
Pour les organisations qui travaillent sérieusement sur des stratégies de prompting pour la traduction automatique, la conclusion est claire : la spécificité l’emporte sur la complexité.
Si vous souhaitez que l’IA réponde à vos besoins, SwissGlobal peut vous aider à construire des prompts robustes et réutilisables adaptés à vos textes. Et grâce à notre plateforme de traduction KITT::Hub, qui intègre l’IA, vous pouvez combiner des processus basés sur l’IA agentique avec l’expertise humaine. Contactez-nous pour découvrir comment déployer cette configuration dans votre organisation.
-
Copilot
Stratégies de prompting pour la traduction automatique
traduction automatique