Chargement...
 

Tutoriel sur l'extracteur de termes de

 

MultiTrans PRISM, niveau I

 


Autres tutoriels sur des extracteurs de termes

Autres tutoriels sur MultiTrans


 

Les dépouilleurs terminologiques sont des outils informatiques qui analysent des textes de format électronique et qui relèvent des candidats-termes (c.-à-d. des unités lexicales qui semblent être des termes dans un domaine précis). Les dépouilleurs terminologiques utilisent une variété de méthodes pour trouver ces candidats-termes, toutes établies selon des critères formels, comme l’analyse de la fréquence de chaines de caractères ou les structures de combinaisons de mots.

 

Notez que ce type de logiciel automatisé ne produit pas de résultats parfaits. Certains termes contenus dans les textes peuvent passer inaperçus, alors que certains candidats qui ne sont pas de vrais termes sont proposés en tant que termes. Les résultats d’un dépouilleur terminologique doivent donc être vérifiés par un langagier. SDL Trados MultiTerm Extract et TermoStat sont des exemples de dépouilleurs terminologiques. Des environnements de traduction comme MultiTrans, LogiTerm et Fusion Translate offrent aussi des fonctions de dépouillement. 

 

 

I. Introduction


 

Dans MultiTrans, vous pouvez choisir de créer un dossier de dépouillement terminologique. Lorsque cette option est sélectionnée, MultiTrans crée automatiquement une liste des groupes de deux ou de plusieurs mots graphiques (potentiellement des unités complexes) apparaissant au moins deux fois dans votre base TextBase. Ensuite, lorsque vous ouvrez une TextBase dans MultiTrans (expliqué dans le Tutoriel sur l'assembleur TextBase de MultiTrans, niveau I), l'onglet Liste de termes, qui par défaut est vide, affichera ces candidats-termes complexes ainsi que leur fréquence dans votre base TextBase.

 

Pour voir où l'extracteur de termes se situe dans le processus de traduction de MultiTrans, consultez le diagramme du flux de travail de MultiTrans

 

Pour en savoir davantage sur MultiTrans, vous pouvez consulter le site Web de MultiCorpora à http://www.multicorpora.com. Il est aussi possible, une fois dans MultiTrans, de lire sur les différentes fonctions du logiciel en allant dans le menu Aide et en choisissant Aide MultiTrans.

 

II. Préparation


  1. Localisez les fichiers dont vous aurez besoin pour ce tutoriel.

    1. Si vous avez complété le Tutoriel sur l'Assembleur TextBase de MultiTrans, niveau I, votre base TextBase et votre base TermBase auront été sauvegardées dans leur dossier respectif sur le lecteur Home (H:), dans le dossier MultiTrans.

    2. Si vous n'avez pas encore créé de TextBase et de TermBase, créez, sur le lecteur Home (H:), un sous-répertoire appelé Extraction de termes MultiTrans (ou tout autre nom que vous vouliez lui donner). (Pour des instructions à ce sujet, consultez Créer un sous-répertoire dans Windows.)

    3. Téléchargez le dossier Bases pour l'extracteur de termes et le Gestionnaire TermBase de MultiTrans et extrayez son contenu dans le sous-répertoire que vous venez de créer. (Pour des instructions, consultez le fichier Extraire des fichiers d’un dossier compressé dans Windows.)

       

  2. Lancez MultiTrans.
  1. Lorsque MultiTrans s'ouvrira, il vous demandera d'entrer un nom d’utilisateur. Entrez le nom de votre choix puis cliquez sur Démarrer.
  2. La page principale que vous voyez est l'Écran initial. Cette page affiche des icônes de plusieurs fonctions de MultiTrans (p. ex., Commencer une sessionAnalyser) et vous permet de naviguer entre elles. (Voir la note 1.)

 

III. Activation de l'extracteur de termes



  1. À partir de l'Écran initial, cliquez sur l'icône Gérer TMs.
  2. La fenêtre Gestionnaire MT apparait alors. Dans cette fenêtre, cochez la case à gauche du nom de la base TextBase que vous utiliserez pour ce tutoriel, puis cliquez sur le bouton Extraire la terminologie. (Si votre base TextBase n'apparait pas dans la liste, cliquez sur le bouton Ajouter..., localisez votre base TextBase, puis cliquez sur Ouvrir. Votre base TextBase se trouvera soit dans le dossier H:\MultiTrans\TextBases, soit dans le sous-répertoire que vous avez créé au début de ce tutoriel.)
  3. La boite de dialogue Extraire la terminologie s'ouvre alors, offrant diverses options d'extraction..
    1. À droite de Nom de la TextBase, vous verrez le nom de la base TextBase que vous avez choisi.
    2. Longueur max. vous permet de choisir la longueur maximale des candidats-termes à extraire. La limite par défaut est de 25 mots, mais vous pouvez changer cette limite peut être changée. Pour l'instant, nous laisserons ce réglage tel qu'il est.
    3. La case Utiliser la liste d'exclusion vous donne la possibilité d'utiliser une liste spécifiant les mots-graphiques à exclure de l'extraction (c.-à.-d. des mots qui ne seront pas retenus pour commencer ou terminer les candidats-termes). Cette liste contient des mots communs, comme le, et, ce, sur, dans, etc. Assurez-vous de cocher cette case.
    4. Dans le boitier Langues: sont affichées les langues associées à votre base TextBase et aux listes de candidats-termes que vous allez créer. Assurez-vous que français et anglais y apparaissent, et que les cases à côté de ces langues soient cochées.
  4. Cliquez sur Planifier.
  5. La boite de dialogue Planification d'une opération s'ouvre alors. Cette boite vous permet de choisir quand l'extraction aura lieu. Si vous désiriez que MultiTrans effectue l'extraction plus tard, vous pourriez cocher la case Exécution planifiée et spécifier la date et l'heure de l'extraction. Pour ce tutoriel, cochez la case Exécution immédiate, puis cliquez sur OK.
  6. Un message apparait alors pour vous dire que l'extraction a été planifiée avec succès. Cliquez sur OK.
  7. De retour dans la fenêtre Gestionnaire MT, cliquez sur Fermer.

 

IV. Visualisation de la liste de dépouillement terminologique créée par MultiTrans



  1. Ouvrez votre base TextBase et votre base TermBase. (Pour des instructions à ce sujet, voir Ouvrir une TextBase et une TermBase dans MultiTrans.)
  2. De la fenêtre Recherche TextBase, cliquez sur l'onglet Terminologie.
  3. Les résultats de l'extraction sont affichés dans le sous-onglet Liste de termes (ce sous-onglet se trouve au bas de l'onglet Terminologie). (Voir la note 2.) Cette liste affiche les candidats-termes complexes (identifiés automatiquement par MultiTrans) ainsi que leur fréquence dans la base TextBase. Une icône de trombone indique que ce mot se trouve dans votre base TermBase. Pour l'instant, comme la base TermBase est vide, aucun des mots n'aura d'icône de trombone à côté de lui.
  4. L'onglet Mots uniques affiche une liste de tous les mots apparaissant dans votre base TextBase, ainsi que leur fréquence. Une icône de trombone indique que ce mot se trouve dans votre base TermBase. Pour l'instant, comme la base TermBase est vide, aucun des mots n'aura d'icône de trombone à côté de lui.

V. Évaluation de ce qui a été extrait et analyse de l'utilité de chaque liste


 

  1. Parcourez la base TextBase et trouvez de cinq termes simples dans la langue source (l’anglais) que vous considérez comme pertinents pour faire des recherches terminologiques ou autres.
  2. Cliquez sur Terminologie et étudiez le sous-onglet Mots uniques.
    1. Quels types d’unités sont identifiés (catégories grammaticales, formes, etc.)? Comment ces unités sont-elles organisées?
    2. Cliquez sur les entêtes des colonnes. Que se passe-t-il? Comment cela peut-il vous aider à trouver les mots qui vous intéressent?
    3. Retrouvez-vous tous les mots simples que vous aviez jugés pertinents pour la recherche? Où se trouvent-ils dans les listes?
    4. Dans quelle proportion les mots identifiés pourraient-ils, à votre avis, être utiles pour faire une recherche? Où se trouvent-ils dans les résultats?
  3. Parcourez la base TextBase et identifiez cinq termes complexes dans la langue source (l’anglais) que vous considérez comme pertinents pour faire des recherches terminologiques ou autres.
  4. Étudiez le sous-onglet Liste de termes.
    1. Quels types d’unités (ou de séries de mots graphiques) sont identifiés (catégories grammaticales, structures, etc.)? Comment ces unités sont-elles organisées?
    2. Cliquez sur les entêtes des colonnes. Que se passe-t-il? Comment cela peut-il vous aider à trouver les mots qui vous intéressent?
    3. Retrouvez-vous tous les termes complexes que vous aviez jugés pertinents pour la recherche? Où se trouvent-ils dans les listes?
    4. Dans quelle proportion les candidats-termes identifiés pourraient-ils, à votre avis, être utiles pour faire une recherche? Où se trouvent-ils dans les résultats?
    5. Voyez-vous certaines difficultés relatives à l’identification de ces candidats-termes complexes? Quelles sont ces difficultés?
    6. Voyez-vous certaines difficultés potentielles que MultiTrans a bien gérées? Pourquoi pensez-vous qu’il a pu le faire?
  5. Allez au menu Fichier, et choisissez Fermer la session. Vous serez redirigé vers l'Écran initial de MultiTrans.

 

VI. Dernières étapes



  1. Fermez votre base TextBase et votre base TermBase.
    1. Du menu Fichier, choisissez Fermer la session.
  2. Fermez MultiTrans.
    1. Du menu Fichier, choisissez Quitter.
  3. Faites une copie de sécurité de vos fichiers, ou transférez-les vers un autre ordinateur.
    1. Dans le lecteur Home (H:), créez un sous-répertoire du nom de TextBase_WHO_aaaammjj (en remplaçant la série de lettres à la fin par la date d'aujourd'hui) ou donnez-lui le nom que vous désirez. (Pour des instructions à ce sujet, consultez le fichier Créer un sous-répertoire dans Windows.) 
    2. Copiez votre base TermBase, et collez-la dans le répertoire que vous venez de créer.
  1. Rendez-vous au sous-répertoire H:\MultiTrans\TermBases et trouvez votre base TermBase.
  2. Faites un copier-coller en utilisant Ctrl+C et Ctrl+V, ou en cliquant Copier et Coller du menu contextuel qui apparait lorsque vous faites un clic droit sur un fichier ou un dossier.
  1. Copiez votre dossier TextBase, et collez-le dans le sous-répertoire que vous venez de créer. (Voir l'avertissement 1.)
    1. Rendez-vous au sous-répertoire H:\MultiTrans\TextBases et trouvez votre base TermBase. Elle aura le nom que vous lui avez donné au début de ce tutoriel. 
    2. Faites un copier-coller en utilisant Ctrl+C et Ctrl+V, ou en cliquant Copier et Coller du menu contextuel qui apparait lorsque vous faites un clic droit sur un fichier ou un dossier.
  1. Créez un dossier compressé contenant le sous-répertoire créé à l'étape 3a. (Pour des instructions à ce sujet, consultez Créer un dossier compressé dans Windows 7.)
  2. Copiez le dossier compressé sur une clé USB ou, si le dossier fait moins de 2 Mo, envoyez-le en pièce jointe à votre courriel.

 

 

 

 

NOTE 1 : Vous ne pouvez pas accéder à l'Agent de traduction, à l'Agent TextBase ou à l'Agent TermBase directement de l'Écran initial. Pour apprendre comment accéder à ces outils et vous en servir, veuillez consulter les tutoriels correspondants :

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

NOTE 2: Si vous êtes étrangers à l'interface de la fenêtre Recherche TextBase, vous pouvez vous référer à la section Apprendre à connaitre l'interface de la base TextBase du Tutoriel sur l'assembleur TextBase de MultiTrans, niveau I.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

AVERTISSEMENT 1: Assurez-vous de copier tout ce qui est dans votre dossier TextBase. Cela inclut les sous-répertoires Content et Indexes, ainsi que votre fichier TextBase se terminant en .tcs. Pour rouvrir votre base TextBase, MultiTrans a besoin de tous ces fichiers.

 

VII. Questions de réflexion


  • Au cours de ce tutoriel, quelles ont été vos impressions sur les fonctions et le fonctionnement de MultiTrans?
  • Qu’est-ce que l’extracteur de termes de MultiTrans pourrait vous aider à faire? Dans quels genres de situations?
  • Quels critères peuvent être utilisés afin d’évaluer les extracteurs de termes? (Notez que quelques-uns de ces critères ont été discutés dans les questions posées au cours du tutoriel.)
  • Quels genres de mots-graphiques ont été trouvés par l’extracteur de termes? Ces formes, sont-elles généralement celles qui sont entrées dans des fiches terminologiques? Pourquoi? Pour créer des fiches terminologiques à partir de l’extraction, devrez-vous changer les formes identifiées? Pourquoi? 
  • À votre avis, l’extracteur de termes MultiTrans a-t-il trouvé d’autres mots qui ne sont pas des termes, mais qui pourraient présenter un intérêt pour un traducteur ou pour un terminologue? Si oui, quels types de mots? Comment pourraient-ils être utiles?
  • Comment MultiTrans se compare-t-il aux autres extracteurs que vous connaissez?
  • Que pensez-vous des options d’ajustement du processus d’extraction que MultiTrans offre à un utilisateur? Croyez-vous qu’elles sont utiles? Pourquoi? Essayez d’expérimenter avec ces réglages et de comparer les résultats avec ceux obtenus pendant ce tutoriel.
  • Quels sont quelques-uns des avantages et des inconvénients à utiliser MultiTrans pour extraire des candidats-termes simples et complexes? En comparaison à une approche manuelle? En comparaison à un autre outil?

 

Tutoriel mis à jour par l'équipe de la CERTT (14-10-2012)