Chargement...
 

Tutoriel sur l'extracteur de termes de MultiTrans 4.4, niveau I

 


Autres tutoriels sur des extracteurs de termes

Autres tutoriels sur MultiTrans


 

 

I. Introduction


 

Lorsque vous créez une base TextBase dans MultiTrans (tel que décrit dans le Tutoriel sur l'Assembleur TextBase de MultiTrans, niveau I), vous pouvez choisir de créer automatiquement un dossier de dépouillement terminologique. Lorsque cette option est sélectionnée, MultiTrans crée deux listes d’unités qui se trouvent dans la base TextBase pour chaque langue (soit quatre listes en tout) : une liste qui affiche les mots graphiques accompagnés de leur fréquence dans la base TextBase (semblable à la liste créée par WordList Tools dans WordSmith, comme décrit dans le Tutoriel sur WordSmith Tools WordList, niveau I); l’autre qui affiche les séries de deux ou de plusieurs mots graphiques (potentiellement des unités complexes) qui apparaissent deux fois ou plus dans la base TextBase, accompagnées de leur fréquence.

 

Pour en savoir plus sur MultiTrans, vous pouvez consulter le site Web de MultiCorpora. À l’ouverture du logiciel, en cliquant sur l’icône Aide MultiTrans, vous pouvez aussi lire les fichiers d’information sur la marche à suivre pour accéder aux différentes fonctions de MultiTrans.

 

II. Préparation


  1. Sauvegardez les documents dont vous aurez besoin pour faire les exercices :

    1. Créez un sous-répertoire appelé Extraction de termes MultiTrans (ou tout autre nom que vous vouliez lui donner). (Pour des instructions à ce sujet, consultez Créer un sous-répertoire.)

    2. Copiez ou déplacez vers ce sous-répertoire la base TextBase et la base TermBase que vous avez créées dans le Tutoriel sur l'Assembleur TextBase de MultiTrans, niveau IAssurez-vous de copier ou de déplacer tous les fichiers que MultiTrans a créés pour la base TextBase et la base TermBase. (Pour obtenir une liste de tous les fichiers nécessaires, consultez le Tutoriel sur l'Assembleur TextBase de MultiTrans, niveau I.) (Voir note 1.)

  2. Ouvrez MultiTrans.

 

III. Visualisation des résultats du dépouillement terminologique effectué par MultiTrans



  1. Ouvrez votre TextBase ou la TextBase que vous avez téléchargée à votre dossier au début de ce tutoriel. (Pour plus d'information, consultez Ouvrir une TextBase et une TermBase dans MultiTrans.)
  2. La base TextBase s’ouvre dans la fenêtre intitulée Recherche TextBase. La fenêtre de la base TextBase est séparée en trois sections (en plus de la Barre des fonctions qui se trouve dans la partie gauche de l’écran, sauf si vous avez choisi de la cacher).
    1. La partie droite de l’écran est divisée en deux. La partie de gauche contient le texte source (anglais) et la partie de droite contient le texte cible (français). Vous remarquerez différentes couleurs de texte qui servent à différencier les segments dans les textes.
    2. Le panneau situé à gauche contient trois onglets : Recherche, TextBases et Terminologie. Le bas de l’onglet TextBases est divisé en deux sous-onglets : Fichiers et Alignements. Le bas de l’onglet Terminologie est aussi divisé en deux sous-onglets : Mots uniques et Liste de termes.
    3. Le sous-onglet Mots uniques affiche une liste de mots graphiques de la base TextBase ainsi que leur fréquence. Si une icône en forme de trombone apparait à côté d’un de ces mots-formes, cela indique qu’il y a une fiche pour ce mot-forme dans la base TermBase.
    4. Le sous-onglet Liste de termes affiche les candidats-termes complexes identifiés de façon automatique ainsi que leur fréquence dans la base TextBase. Si une icône en forme de trombone apparait à côté d’un de ces candidats-termes, cela indique qu’il y a une fiche pour ce terme dans la base TermBase. (Voir note 2.)

 

IV. Évaluation des listes de dépouillement terminologique et analyse de l'utilité de chaque liste



  1. Parcourez la base TextBase et identifiez de cinq à dix termes simples et complexes dans la langue source (l’anglais) que vous considérez comme pertinents pour faire des recherches terminologiques ou autres.
  2. Cliquez sur Terminologie et observez le sous-onglet Mots uniques.
    1. Quels types d’unités sont identifiés (catégories grammaticales, formes, etc.)? Comment ces unités sont-elles organisées?
    2. Cliquez sur les entêtes des colonnes. Que se passe-t-il? Comment cela peut-il vous aider à trouver les mots qui vous intéressent?
    3. Retrouvez-vous tous les mots simples que vous aviez jugés pertinents pour la recherche? Où se trouvent-ils dans les listes?
    4. Dans quelle proportion les mots identifiés pourraient, à votre avis, être utiles pour faire une recherche? Où se trouvent-ils dans les résultats?
  3. Observez le sous-onglet Liste de termes.
    1. Quels types d’unités (ou de séries de mots graphiques) sont identifiés (catégories grammaticales, structures, etc.)? Comment ces unités sont-elles organisées?
    2. Cliquez sur les entêtes des colonnes. Que se passe-t-il? Comment cela peut-il vous aider à trouver les mots qui vous intéressent?
    3. Retrouvez-vous tous les termes complexes que vous aviez jugés pertinents pour la recherche? Où se trouvent-ils dans les listes?
    4. Dans quelle proportion les candidats-termes identifiés pourraient, à votre avis, être utiles pour faire une recherche? Où se trouvent-ils dans les résultats?
    5. Voyez-vous certaines difficultés relatives à l’identification de ces candidats-termes complexes? Quelles sont ces difficultés?
    6. Voyez-vous certaines difficultés potentielles que MultiTrans a bien gérées? Pourquoi pensez-vous qu’il a pu le faire?
  4. À partir du menu Fichier, sélectionnez Fermer Recherche TextBase. Vous serez redirigé vers la page de Références générales de MultiTrans.

 

V. Observer les options disponibles pour le dépouillement terminologique dans MultiTrans



  1. Trouvez les fichiers Word que vous avez téléchargés afin de créer votre base TextBase dans le Tutoriel Assembler et aligner une base TermBase, niveau I (WHO-obesityEN.doc et WHO-obesityFR.doc). (Voir note 3.)
  1. Cliquez sur l’option Assembleur TextBase dans la page de Références générales de MultiTrans. Suivez les premières étapes pour créer une nouvelle base TextBase anglais-français comme vous l’avez fait à l’aide du Tutoriel sur l'Assembleur TextBase de MultiTrans, niveau I pour créer une nouvelle base TextBase anglais-français. Arrêtez après l’Étape 3 – Sélection du fichier de sortie.
    1. Lorsque MultiTrans vous le demande, donnez un nom à cette nouvelle base TextBase et enregistrez-la dans le sous-répertoire que vous avez créé pour stocker les fichiers pour cet exercice.
  2. Continuez à suivre les prochaines étapes jusqu'à ce que vous atteigniez l’Étape 6 – Extracteur de termes, assurez-vous que la case Créer un fichier Terminologique est cochée. Cliquez sur Personnaliser à côté de cette option. La boite de dialogue Options de l’Extracteur de termes s’affiche à l’écran.
  3. Le premier onglet qui est affiché est l’onglet Liste d’exclusion. Cet onglet vous permet de spécifier une liste de mots graphiques qui seront exclus de l’extraction. Assurez-vous que la case Utiliser la liste d’exclusion (recommandé) est cochée.
  4. Cliquez sur Parcourir à côté du champ anglais. Trouvez et sélectionnez la liste d’exclusion pour l’anglais : exclude.en. Cliquez sur Ouvrir. Faites la même chose dans le champ français pour la liste d’exclusion pour le français : exclude.fr.
  5. L’onglet Longueur vous permet de spécifier une longueur maximale pour les candidats-termes extraits. En utilisant les flèches, ajustez la longueur à six mots et cochez la case pour cette option.
  6. L’onglet Fréquence vous permet de choisir un nombre d’occurrences minimum que les candidats-termes doivent avoir pour apparaitre dans la liste. En utilisant les flèches, ajustez cette fréquence à 3.
  7. Cliquez sur OK. Vous retournerez à la boite de dialogue de l’étape 6 (Étape 6 – Extracteur de termes).
  8. Suivez le reste des étapes pour créer et ouvrir votre nouvelle base TextBase. (Vous pouvez utiliser de nouveau la base TermBase que vous avez utilisée plus tôt dans cet exercice en la sélectionnant lors de l’ouverture de la base TextBase.)
  9. Évaluez les résultats de l’extraction terminologique. Voyez-vous des différences dans l’extraction de la terminologie si l’on compare avec la base TextBase originale? Si c’est le cas, quelles sont ces différences et comment affectent-elles l’utilité des listes?
  10. Si vous le désirez, essayez de répéter les étapes ci-dessus, mais en changeant les paramètres sélectionnés. Quel est l’effet sur les résultats? (Voir note 4.)

 

VI. Dernières étapes



  1. Fermez la base TextBase (Fichier > Fermer Recherche TextBase), puis MultiTrans (Fichier > Quitter).
  2. Pour faire une copie de sécurité de vos fichiers ou pour les transférer vers un autre ordinateur :
    1. Dans le Poste de travail de Windows ou à partir du menu Démarrer, recherchez le sous-répertoire où vous avez stocké vos fichiers au début de ces exercices.
    2. Créez un dossier compressé qui contient ce sous-répertoire. (Pour des instructions à ce sujet, consultez Créer un dossier compressé.)
    3. Copiez le dossier compressé sur une clé USB ou, si le dossier compressé fait moins de 2 Mo, envoyez-le en pièce jointe à votre courriel.

 

 

 

 

NOTE 1 : Si vous n’avez pas encore fait ce tutoriel ou n’avez pas accès à votre base, vous pouvez télécharger une base déjà prête appelée Bases pour l'extracteur et le Gestionnaire TermBase de MultiTrans dans votre sous-répertoire. (Pour des instructions à ce sujet, consultez Extraire des fichiers d’un dossier compressé.)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

NOTE 2 : Si vous ne voyez rien dans le sous-onglet Terminologie, il se peut que vous ayez oublié de cocher la case Créer un fichier de terminologie lorsque vous avez créé votre base TextBase ou que vous ayez oublié de copier tous les fichiers pour la base TextBase dans votre sous-répertoire. Dans ce cas, vous pouvez télécharger la base TextBase toute faite en suivant les étapes décrites dans la note précédente. Vous pourrez refaire votre base TextBase à un autre moment. 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

NOTE 3 : Si vous ne trouvez pas ces fichiers, vous pouvez télécharger le dossier compressé Fichiers du tutoriel sur l'Assembleur TextBase de MultiTrans, niveau I.

 

 

 

 

 

 

 

 

 

 

 

 

NOTE 4 : Pour faciliter la comparaison des différentes versions de l’extraction, vous pouvez enregistrer la liste des candidats-termes identifiés sous forme d’un fichier texte seulement (.txt). Pour cela, faites un clic droit dans la liste des candidats-termes extraits (sur le sous-onglet Liste de termes sur l’onglet Terminologie), et sélectionnez l’option Enregistrer liste au format texte... à partir du menu contextuel qui apparait. Choisissez l’emplacement désiré pour enregistrer le nouveau fichier, qui peut par la suite être ouvert dans Word ou dans un autre logiciel de traitement de texte ou même dans Excel. 

 

VII. Questions de réflexion


 

  • Au cours de ce tutoriel, quelles ont été vos impressions sur les fonctions et le fonctionnement de MultiTrans?
  • Qu’est-ce que l’extracteur de termes de MultiTrans pourrait vous aider à faire? Dans quels genres de situations?
  • Quels critères peuvent être utilisés afin d’évaluer les extracteurs de termes? (Notez que quelques-uns de ces critères ont été discutés dans les questions posées au cours du tutoriel.)
  • Quels genres de mots-formes ont été identifiés par l’extracteur de termes? Ces formes, sont-elles généralement celles qui sont entrées dans des fiches terminologiques? Pourquoi? Pour créer des fiches terminologiques à partir de l’extraction, devrez-vous changer les formes identifiées? Pourquoi? 
  • À votre avis, l’extracteur de termes MultiTrans a-t-il identifié d’autres mots qui ne sont pas des termes, mais qui pourraient présenter un intérêt pour un traducteur ou pour un terminologue? Si oui, quels types de mots? Comment pourraient-ils être utiles?
  • Comment MultiTrans se compare-t-il aux autres extracteurs que vous connaissez?
  • Que pensez-vous des options d’ajustement du processus d’extraction que MultiTrans offre à un utilisateur? Croyez-vous qu’elles sont utiles? Pourquoi? Essayez d’expérimenter avec ces réglages et de comparer les résultats avec ceux obtenus pendant ce tutoriel.
  • Quels sont quelques-uns des avantages et des inconvénients à utiliser MultiTrans pour extraire des candidats-termes simples et complexes? En comparaison à une approche manuelle? En comparaison à un autre outil?

 

Tutoriel mis à jour par l'équipe de la CERTT. (20-09-2011)