Chargement...
 

Tutoriel sur Concord de WordSmith Tools, niveau II

 


Autres tutoriels sur des concordanciers unilingues

Autres tutoriels sur WordSmith Tools


 

 

I. Introduction


 

WordSmith Tools, conçu par Mike Scott, est un outil d’analyse de corpus qui intègre notamment Concord, un concordancier unilingue qui affiche des occurrences d’une chaine spécifiée en contexte, et ce, en format KWIC (key word in context). (Il propose aussi une série d’autres outils d’analyse de textes qui pourront être explorés en faisant les exercices sur l’outil WordList.) L'interface de WordSmith Tools est en anglais.


Pour en savoir plus sur WordSmith, visitez le site Web de Mike Scott et lisez les fichiers d’aide portant sur Concord. Vous pouvez aussi télécharger une version démo de WordSmith Tools (qui offre toutes les options de la version commerciale, mais qui limite le nombre d’occurrences affichées à 25) à partir du même site.

 

Concord de WordSmith Tools peut traiter des textes en format .html, .xml et .txt. Il offre aussi une variété de fonctions de recherche, de modes d’affichage des résultats et de calculs statistiques des cooccurrences.

 

II. Préparation



  1. Préparez les fichiers dont vous aurez besoin.
    1. Créez un sous-répertoire appelé WordSmith_Concord_II (ou un autre de nom de votre choix). (Pour des instructions à ce sujet, consultez le tutoriel Créer un sous-répertoire dans Windows.)
    2. Téléchargez dans ce sous-répertoire le fichier contenant des décisions de la Cour suprême du Canada en français et en format .txt.
    3. Extrayez les fichiers du dossier compressé dans le sous-répertoire. (Pour des instructions à ce sujet, consultez le tutoriel Extraire des fichiers d'un dossier compressé dans Windows.)
  2. Ouvrez WordSmith Tools.
  3. Lorsque WordSmith vous demande si vous voulez voir uniquement les fonctions de base du logiciel, cliquez sur No. Vous aurez ainsi accès à l’ensemble des fonctions.
    1. Le logiciel s’ouvre avec une fenêtre centrale à partir de laquelle les différentes options offertes sont accessibles (les principales à partir des boutons Concord (C), KeyWords (K) et WordList (W), les autres par le menu Utilities).

 

III. Choix de textes à exploiter



  1. Sélectionnez un ou plusieurs fichiers à traiter.
    1. Dans la fenêtre principale de WordSmith, ouvrez le menu File et choisissez Choose texts.
    2. Dans la fenêtre Choose texts qui apparait, les fichiers à exploiter sont affichés dans la partie droite, et l’arborescence des répertoires, dans la partie gauche.
    3. Un fichier démo fourni avec le logiciel (un chapitre tiré de A Tale of Two Cities de Dickens) apparait dans la liste à la droite. Enlevez-le en le sélectionnant et en appuyant sur Suppr pour ne pas avoir des occurrences provenant de ce fichier dans vos résultats.
    4. Dans le menu déroulant situé au coin supérieur gauche de la fenêtre Choose texts, choisissez le lecteur où vous avez stocké les documents à analyser.
    5. Vous pouvez aussi choisir de voir uniquement des fichiers dans un certain format (p. ex., texte brut ou .txt), en sélectionnant l’option correspondante dans le menu déroulant qui se trouve immédiatement à la droite de la liste des lecteurs. (Voir note 1.)
    6. Dans la partie gauche de la fenêtre, parcourez l’arborescence des répertoires dans le lecteur U: pour trouver les fichiers que vous voulez exploiter. (Double-cliquez sur les icônes des dossiers jaunes pour ouvrir les répertoires.)
    7. Sélectionnez tous les fichiers. (Vous pouvez utiliser la touche Maj pour sélectionner les fichiers en bloc.)
    8. Cliquez ensuite sur le long bouton vertical avec deux flèches bleues pointant vers la droite. Les fichiers apparaissent dans la partie droite de la fenêtre. (Voir note 2.)
  2. Une fois la sélection des fichiers terminée, sortez de la fenêtre Choose texts en cliquant sur le crochet vert.

 

IV. Recherches en respectant la casse



  1. Ouvrez Concord en cliquant sur le bouton qui porte son nom.
  2. À partir du menu File, choisissez New.
  3. Dans la boite de dialogue Getting started qui s’affiche, cliquez sur Search word pour vous assurer qu’il est actif.
  4. Recherchez une chaine spécifiquement avec ou sans majuscules en l'entrant dans le champ Search word et en la faisant précéder et suivre de deux signes égal (==).
    1. Essayez de chercher cour et Cour. Qu’est-ce qui arrive?

    2. Cherchez cour et ==cour==. Évaluez les résultats. Quelle est la différence? Qu’est-ce que cela peut vous indiquer à propos de l’usage de l’unité dans ces textes?

    3. Cherchez cours et == cours==. Évaluez les résultats. Quelle est la différence? Qu’est-ce que cela peut vous indiquer quant à l’usage de l’unité dans ces textes?

    4. Les occurrences de cours sont-elles toutes pertinentes pour la recherche de formes du mot cour? Pourquoi?

    5. Pouvez-vous penser à d’autres difficultés que poserait la recherche de cette unité? Dans quelles conditions?

 

V. Recherches avec troncature



  1. Cherchez une série de chaines qui partagent seulement une partie de leurs caractères en entrant la partie commune de la chaine dans le champ Search word et en entrant, à la place des caractères qui diffèrent, le symbole de troncature qui convient.
    1. Remplacez un caractère en entrant un point d’interrogation (?).
      1. Lancez une recherche pour trouver cour et cours avec une seule requête.
    2. Remplacez plusieurs caractères en entrant un astérisque (*).
      1. Lancez une recherche pour trouver des mots qui commencent avec législ.
      2. Quels mots trouvez-vous?
      3. Lancez une recherche pour trouver des mots qui contiennent la chaine appel.
      4. Quels mots trouvez-vous?
      5. En quoi ce genre de fonction peut-il être utile pour interroger un corpus?

 

VI. Recherches complexes



  1. Combinez des critères avec l’opérateur booléen OU (pour trouver des contextes qui contiennent au moins une des chaines entrées) en entrant les deux chaines dans le champ Search word, séparées par une barre oblique (/). Cliquez sur OK pour lancer la recherche.
    1. Lancez une requête pour trouver à la fois les chaines appel et pourvoi.
    2. Triez les résultats pour séparer les occurrences des deux chaines, en choisissant comme premier critère de tri Centre. (Voir note 3.)
    3. Retriez les résultats pour mettre en évidence les régularités dans les mots qui précèdent ou qui suivent ces deux chaines.
    4. Les cooccurrents et les structures dans lesquelles ces unités se présentent sont-ils les mêmes pour les deux chaines? Est-ce que ce tri met en évidence de l’information utile pour le traducteur ou le terminologue? Pourquoi?
  2. Combinez des critères avec un opérateur de proximité (pour trouver des contextes qui contiennent deux chaines situées à une certaine distance l’une de l’autre).
    1. Entrez la première chaine dans le champ Search word.
    2. Entrez la deuxième chaine dans le champ Context word qui apparait sur l’onglet Advanced. (Voir note 4.)
    3. Choisissez la distance admissible entre les deux chaines en spécifiant le nombre de mots qui peuvent apparaitre entre les deux chaines à la gauche et à la droite de la chaine principale.
    4. Cliquez sur OK pour lancer la recherche. (Voir note 5.)
    5. Essayez une recherche pour les occurrences de cour ou cours avec la chaine instance 3 mots à sa droite.
    6. Quels sont les résultats? Comment ce type de recherche pourrait-il être utile au traducteur ou au terminologue?
  3. Combinez des critères avec l’opérateur booléen SAUF (pour trouver des contextes qui contiennent une chaine mais pas une autre).
    1. Entrez la chaine qui doit être présente dans le champ Search word.
    2. Entrez la chaine qui ne doit pas être présente dans le champ Exclude if context contains sur l’onglet Advanced.
    3. Cliquez sur OK pour lancer la recherche.
    4. Lancez une recherche pour Cour (en respectant la casse).
    5. Répétez la recherche, mais cette fois en excluant les contextes où appel apparait dans un espace de deux mots à la droite de Cour.
    6. Quelle est la différence entre les résultats?
    7. Triez les occurrences pour mettre en évidence les différents types de Cours dont il est question dans les textes.
    8. Comment ce type de recherche peut-il être utile au traducteur ou au terminologue?

 

VII. Aide-mémoire


 

Le tableau ci-dessous résume les fonctions offertes dans WordSmith Tools.

 

Fonction

WordSmith Tools

Requête verbatim (exacte)

chaine1 chaine2

Respecter la casse

==chaine1==

Troncature (un caractère)

chaine?

Troncature (plusieurs caractères)

chaine*

Opérateur booléen OU

chaine1/chaine2

Opérateur booléen SAUF

  • Entrez la chaine principale à rechercher dans le champ Search word.
  • Entrez la forme à exclure dans le champ Exclude if context contains.

Opérateur de proximité

  • Entrez chaine1 dans le champ Search word.
  • Entrez chaine2 dans le champ Context word.
  • Spécifiez le nombre de mots à la gauche ou à la droite de la première chaine.

Opérateur d’adjacence

  • Entrez chaîne1 dans le champ Search word.
  • Entrez chaîne2 dans le champ Context word.
  • Spécifiez 1 mot à gauche et à droite de chaîne1.

 

VIII. Repérage de cooccurrents d'une chaine recherchée



  1. Dans la fenêtre Concord, répétez la recherche pour la chaine cour. (Voir note 6.)
  2. Cliquez sur Clusters pour voir des suites de chaines récurrentes observées parmi les résultats. Celles-ci apparaissent en ordre de fréquence décroissante.
    1. Quelles sont quelques-unes des unités intéressantes repérées par l’outil?
    2. Comment cette fonction peut-elle être utile au traducteur ou au terminologue?
  3. Ajustez les paramètres pour le calcul des groupes (clusters).
    1. Du menu Compute, choisissez Clusters.
    2. Dans la boite de dialogue qui apparait, spécifiez la longueur des suites de mots à repérer. (Il est recommandé d’essayer des groupes de 2 à 4 mots, mais vous pouvez essayer plus ou moins de mots.)
    3. Spécifiez si désiré la fréquence minimale pour l’identification des groupes.
    4. Choisissez les horizons pour le calcul des groupes (c’est-à-dire à l’intérieur de quelle distance du mot recherché les groupes récurrents seront repérés).
    5. Cliquez sur OK pour recalculer les groupes.
    6. Regardez la colonne Related à la droite dans la fenêtre des résultats. Elle affiche des groupes de mots qui partagent une certaine partie des mots avec le groupe indiqué dans les résultats.
  4. Cliquez sur Patterns pour faire afficher les listes de mots qui apparaissent à proximité du mot recherché.
    1. Comment ces renseignements peuvent-ils être utiles au traducteur ou au terminologue?
  5. Cliquez sur Collocates pour identifier des chaines fréquemment observées à proximité de la chaine recherchée.
    1. Les collocatifs de la chaine sont indiqués en ordre décroissant de fréquence dans la colonne à la gauche et leur emplacement par rapport à cette chaine (en mots à la gauche et à la droite), à droite de chaque collocatif. L’emplacement le plus fréquent est indiqué en rouge.
    2. Quels sont quelques-uns des collocatifs intéressants pour cette chaine?
    3. Est-ce que ces résultats mettent en évidence des cooccurrents que vous n’aviez pas encore remarqués? (Voir note 7.)
  6. Faites une recherche pour la chaine législation. Consultez les collocatifs repérés.
    1. Combien des collocatifs que vous avez repérés manuellement au cours des exercices dans le Tutoriel sur Concord de WordSmith Tools, niveau I.

 

IX. Dernières étapes



  1. Faites une copie de sauvegarde de vos fichiers ou transférez-les sur un autre ordinateur.
    1. À partir du Poste de travail de Windows ou le menu Démarrer, ouvrez le U: (Mes documents) et trouvez le sous-répertoire où vous avez stocké vos fichiers.
    2. Créez un dossier compressé qui contient ce sous-répertoire. (Pour des instructions à ce sujet, consultez le tutoriel Créer un dossier compressé dans Windows.)
    3. Copiez le dossier compressé sur une clé USB ou, s’il fait moins de 2 Mo, envoyez-le en pièce jointe à votre adresse courriel.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

NOTE 1 : Par défaut, l’option *.* est sélectionnée dans ce menu; cela signifie que tous les fichiers du répertoire sont affichés, peu importe leur nom ou l’extension qu’ils portent. Si vous sélectionnez *.txt, par exemple, seuls les fichiers qui portent l’extension .txt seront affichés; l’astérisque précédant le point indique cependant que tout nom de fichier sera accepté. 

Capture d'écran à venir.


NOTE 2 : Si vous pensez devoir consulter cet ensemble de fichiers régulièrement, vous pouvez sauvegarder la liste en cliquant sur Save favourites. Vous pouvez même ajouter des commentaires sur ces fichiers dans la partie inférieure de la fenêtre. (Assurez-vous de stocker la liste de fichiers ainsi produite dans le sous-répertoire de votre U: où elle sera disponible la prochaine fois.)
 
Les fichiers pourront alors être ajoutés en bloc la prochaine fois que vous utiliserez Concord en ouvrant la liste à partir de l’icône Get favourites. Le chargement peut prendre un petit moment.

Capture d'écran à venir.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

NOTE 3 : Pour une description des fonctions de tri et de leur usage, consultez le Tutoriel sur Concord de WordSmith Tools, niveau I. 

 

 

 

 

 

 

NOTE 4 : Si vous ne voyez pas l’onglet Advanced, il se peut que, lors de l’ouverture du logiciel, vous ayez sélectionné Yes lorsque WordSmith vous a demandé si vous vouliez voir uniquement les fonctions de base dans le logiciel. Annulez en cliquant sur Cancel. Dans le menu Settings, choisissez Specific to Concord et cliquez sur General. Décochez la case Keep things simple et cliquez sur OK. Relancez la recherche; l’onglet devrait apparaitre. 

 

NOTE 5 : Cette fonction de recherche avec proximité prend la place de l’opérateur booléen ET disponible dans certains autres outils. Elle est cependant plus précise étant donné qu’elle spécifie non seulement la présence de deux chaines dans un contexte, mais aussi leurs positions relatives. 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

NOTE 6 : N’oubliez pas de supprimer les mots contextuels de l’onglet Advanced pour avoir toutes les occurrences de la chaine. 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

NOTE 7 : Le nombre de mots à analyser de chaque côté de la chaine recherchée peut être défini en passant par l’onglet Concord dans les paramètres, et les collocatifs sont recalculés à l’aide de l’option Collocates du menu Compute

 

 

 

X. Questions de réflexion


 

  • Comment ces fonctions de recherche et d’analyse avancées se comparent-elles aux recherches manuelles que vous pouvez faire à l’aide de Concord? Pouvez-vous accomplir plus ou moins les mêmes tâches manuellement? Lesquelles et comment?
  • Quelle option trouvez-vous :
    • la plus rapide?
    • la plus simple?
    • la plus efficace?
  • Pourquoi?
  • Quelles sont les difficultés qui peuvent être résolues au moins en partie par les fonctions avancées décrites ci-dessus? Comment?
  • Y a-t-il des difficultés qui ne peuvent être prises en charge par ces fonctions?

 

Tutoriel mis à jour par l'équipe de la CERTT. (06-07-2009)