Chargement...
 

Tutoriel sur Concord de WordSmith Tools, niveau I

 


Autres tutoriels sur des concordanciers unilingues

Autres tutoriels sur WordSmith Tools


 

 

I. Introduction


 

WordSmith Tools, conçu par Mike Scott, est un outil d’analyse de corpus qui intègre notamment Concord, un concordancier unilingue qui affiche des occurrences d’une chaine spécifiée en contexte, et ce, en format KWIC (key word in context). (Il propose aussi une série d’autres outils d’analyse de textes qui pourront être explorés en faisant les exercices sur l’outil WordList.) L'interface de WordSmith Tools est en anglais.

 

Pour en savoir plus sur WordSmith, visitez le site Web de Mike Scott et lisez les fichiers d’aide portant sur Concord. Vous pouvez aussi télécharger une version démo de WordSmith Tools (qui offre toutes les options de la version commerciale, mais qui limite le nombre d’occurrences affichées à 25) à partir du même site.

 

Concord de WordSmith Tools peut traiter des textes en format .html, .xml et .txt. Il offre de plus une variété de fonctions de recherche, de modes d’affichage des résultats et de calculs statistiques des cooccurrences.

 

II. Préparation



  1. Préparez les fichiers dont vous aurez besoin.
    1. Créez un sous-répertoire appelé WordSmith_Concord_I (ou un autre de nom de votre choix). (Pour des instructions à ce sujet, consultez le tutoriel Créer un sous-répertoire dans Windows.)
    2. Téléchargez dans ce sous-répertoire le fichier contenant des décisions de la Cour suprême du Canada en français et en format txt.
    3. Extrayez les fichiers du dossier compressé dans le sous-répertoire. (Pour des instructions à ce sujet, consultez le tutoriel Extraire des fichiers d'un dossier compressé dans Windows.)
  2. Ouvrez WordSmith Tools.
  3. Lorsque WordSmith vous demande si vous voulez voir uniquement les fonctions de base du logiciel, cliquez sur No. Vous aurez ainsi accès à l’ensemble des fonctions.
    1. Le logiciel s’ouvre avec une fenêtre centrale à partir de laquelle les différentes options offertes sont accessibles (les principales à partir des boutons Concord (C), KeyWords (K) et WordList (W), les autres par le menu Utilities).

 

III. Choix des textes à exploiter



  1. Sélectionnez un ou plusieurs fichiers à traiter.
    1. Dans la fenêtre principale de WordSmith, ouvrez le menu File et cliquez sur Choose texts.
    2. Dans la fenêtre Choose texts qui apparait, les fichiers à exploiter sont affichés dans la partie droite, et l’arborescence des répertoires, dans la partie gauche.
    3. Un fichier démo fourni avec le logiciel (un chapitre tiré de A Tale of Two Cities de Dickens) apparait dans la liste à la droite. Enlevez-le en le sélectionnant et en appuyant sur Suppr pour ne pas avoir des occurrences provenant de ce fichier dans vos résultats.
    4. Dans le menu déroulant situé au coin supérieur gauche de la fenêtre Choose texts, choisissez le lecteur où vous avez stocké les documents à analyser.
    5. Vous pouvez aussi choisir de voir uniquement des fichiers dans un certain format (p. ex., texte brut ou .txt) en sélectionnant l’option correspondante dans le menu déroulant qui se trouve immédiatement à la droite de la liste des lecteurs. (Voir note 1.)
    6. Dans la partie gauche de la fenêtre, sélectionnez tous les fichiers. (Vous pouvez utiliser la touche Maj pour sélectionner les fichiers en bloc.)
    7. Cliquez ensuite sur le long bouton vertical avec deux flèches bleues pointant vers la droite. Les fichiers apparaissent dans la partie droite de la fenêtre. (Voir note 2.)
  2. Une fois la sélection des fichiers terminée, sortez de la fenêtre Choose texts en cliquant sur le crochet vert.

 

IV. Production d'une concordance



  1. Ouvrez Concord en cliquant sur le bouton qui porte son nom.
  2. À partir du menu File, choisissez New.
  3. Dans la boite de dialogue Getting started qui s’affiche, cliquez sur Search word pour vous assurer qu’il est actif. Sur cet onglet, vous verrez un champ de recherche en haut et, dans la partie inférieure de l’onglet, un rappel de quelques-unes des options de recherche offertes. (Voir note 3.)
  4. Tapez législation dans le champ de recherche, puis cliquez sur OK pour lancer l’analyse.
  5. Les résultats apparaissent dans la fenêtre Concord. Chaque occurrence de législation apparait sur une ligne distincte, avec cette chaine alignée au centre de la ligne et indiquée en couleur. La source de chaque occurrence est affichée à la droite dans la colonne File.
  6. Observez les autres statistiques fournies. WordSmith calcule la position de l’occurrence affichée dans la phrase, dans le paragraphe, dans la section et dans le texte, et les exprime en valeurs brutes et en pourcentages. (Par exemple, une occurrence qui apparait à la toute fin d’un texte aurait une position de 100 % dans la phrase, dans le paragraphe, dans la section et dans le texte. Une occurrence au tout début aurait une position de 0 %. Les valeurs brutes varient bien sûr selon le nombre de mots dans la phrase, le paragraphe et le texte.)
    1. Pouvez-vous penser à des informations utiles que ces statistiques pourraient fournir?

 

V. Affichage des résultats



  1. Ajustez la largeur des contextes en plaçant le curseur sur la division entre les colonnes Concordance et Set (il prend alors la forme d’une ligne verticale avec une flèche de chaque côté) et en tirant vers la droite.
  2. Ajustez la hauteur d’une ligne en plaçant le curseur sur la division entre cette ligne et celle d’en dessous et en tirant vers le bas.
  3. Ajustez la hauteur de toutes les lignes de la concordance en ouvrant le menu View et en choisissant les options Grow ou Shrink. (Alternativement, appuyez sur F8 pour augmenter la hauteur de la ligne et sur Ctrl+F8 pour la diminuer.)
  4. Si vous voulez voir uniquement la phrase dans laquelle la chaine recherchée apparait, choisissez Sentence only dans le menu View.
  5. Voyez le texte intégral dont l’occurrence est tirée en double-cliquant sur la ligne en question pour la sélectionner. Le texte est affiché sur l’onglet source text avec l’occurrence du terme surligné. Cliquez de nouveau sur l’onglet concordance pour retourner aux résultats.
  6. Classez certaines occurrences selon des classes que vous aurez vous-mêmes définies. Par exemple, marquez dans les occurrences de législation la présence de cooccurrents potentiellement intéressants de cette unité ou le type de cooccurrents présents. (Voir note 4.)
    1. Dans la fenêtre Concord, placez le curseur sur une ligne dans la colonne Set.
    2. Tapez une lettre qui représentera la classe du cooccurrent que vous trouvez intéressant dans chaque contexte. (Par exemple, vous pouvez utiliser n pour les cooccurrents nominaux, v pour les verbaux et ainsi de suite.) Lorsque vous classez un contexte, le curseur avance à la ligne suivante.
    3. Continuez à classer les occurrences en attribuant une lettre à chaque ligne. (Au no 7, vous verrez comment trier les occurrences en fonction de ces classes.)
  7. Triez les résultats, à partir du menu Edit, en choisissant Resort. (Alternativement, appuyez sur la touche F6.) Les occurrences sont automatiquement triées par ordre alphabétique selon le Set. (Celles sans set apparaissent en premier, suivi de ceux annotés n et de ceux annotés v.)
    1. Est-ce que ce genre de tri peut être utile pour étudier l’usage de l’unité cherchée? Comment?
  8. Sauvegardez les résultats d’une recherche sous forme d’une concordance ouvrable dans WordSmith Tools.
    1. À partir du menu File, choisissez Save.
    2. Dans la boite de dialogue qui apparait, choisissez le lecteur et naviguez à l’emplacement désiré dans l’arborescence de fichiers.
    3. Tapez un nom de fichier dans le champ.
    4. Cliquez sur Enregistrer pour sauvegarder le fichier.
  9. Sauvegardez les résultats d’une recherche sous forme d’une concordance en format Texte brut (.txt) qui pourra être visualisée et éditée dans un traitement de texte ou importée dans une base de données.
    1. À partir du menu File, choisissez Save as… > Plain text.
    2. Cliquez sur le dossier jaune pour choisir le lecteur désiré et naviguez dans le sous-répertoire que vous avez créé pour faire ces exercices.
    3. Tapez un nom de fichier et cliquez sur Ouvrir.
    4. De retour dans la boite de dialogue Save as Plain text, cliquez sur OK pour sauvegarder le fichier. (Voir note 5.)
  10. Triez les occurrences selon un autre critère. (Voir note 6.)
    1. À partir du menu Edit, choisissez Clear set column. Les Set ajoutés disparaissent.
    2. À partir du menu Edit, choisissez Resort. Dans la boite de dialogue Concordance Sort qui apparait, vous pouvez spécifier jusqu’à trois critères de tri en cliquant sur les trois onglets un à un.
      1. File trie les occurrences selon le fichier source des occurrences.
      2. R1 trie les occurrences par ordre alphabétique selon le premier mot à la droite de la chaine recherchée, R2 par le deuxième mot à droite et ainsi de suite.
      3. L1 trie les occurrences par ordre alphabétique selon le premier mot à gauche de la chaine recherchée, L2 par le deuxième mot et ainsi de suite.
    3. La case Case sensitive permet de prendre en compte la casse lors du tri.
  11. Triez les résultats pour mettre en évidence différents cooccurrents de législation. (Voir note 7.)
    1. Triez les occurrences par le premier mot à droite de législation en choisissant R1 et en cliquant sur OK.
      1. Quels cooccurrents repérez-vous dans les contextes?
      2. À quelles catégories grammaticales appartiennent-ils?
      3. Est-ce que cela correspond à l’étiquetage que vous avez fait des cooccurrents dans la colonne Set?
      4. En quoi ces cooccurrents peuvent-ils être utiles au traducteur ou au terminologue?
    2. Triez les occurrences par le troisième mot à gauche de législation.
      1. Quelle option faut-il choisir pour faire ce tri?
      2. Quels cooccurrents repérez-vous dans les contextes?
      3. À quelles catégories grammaticales appartiennent-ils?
      4. Est-ce que cela correspond à l’étiquetage que vous avez fait des cooccurrents dans la colonne Set?
      5. En quoi ces cooccurrents peuvent-ils être utiles au traducteur ou au terminologue?
    3. Avez-vous relevé d’autres cooccurrents pertinents de législation? Pouvez-vous trouver une façon de trier les occurrences pour les mettre en évidence? (Voir note 8.)
  12. Éliminez des résultats non pertinents de la liste.
    1. Cliquez sur la ligne en question pour la sélectionner.
    2. Appuyez sur Suppr pour « désactiver » la ligne. (Si vous changez d’avis par la suite, sélectionnez la ligne et appuyez sur la touche Ins pour la « réactiver ».)
    3. Répétez pour d’autres lignes à supprimer.
    4. Ouvrez le menu Edit et choisissez Zap pour supprimer les lignes désactivées des résultats. (Voir note 9.)
  13. Fermez la concordance sans la sauvegarder en choisissant l’option Close du menu File et en cliquant sur le bouton No lorsque l’outil vous demande si vous voulez enregistrer le fichier. (Voir note 10.)

 

VI. Dernières étapes



  1. Faites une copie de sauvegarde de vos fichiers ou transférez-les sur un autre ordinateur.
    1. À partir du Poste de travail de Windows ou du menu Démarrer, trouvez le sous-répertoire dans lequel vous avez stocké vos fichiers.
    2. Créez un dossier compressé qui contient ce sous-répertoire. (Pour des instructions à ce sujet, consultez le tutoriel Créer un dossier compressé dans Windows.)
    3. Copiez le dossier compressé sur une clé USB. S’il fait moins de 2 Mo, vous pouvez l’envoyer en pièce jointe à votre courriel.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

NOTE 1 : Par défaut, l’option *.* est sélectionnée dans ce menu; cela signifie que tous les fichiers du répertoire sont affichés, peu importe leur nom ou l’extension qu’ils portent. Si vous sélectionnez *.txt, par exemple, seuls les fichiers qui portent l’extension .txt seront affichés; l’astérisque précédant le point indique cependant que tout nom de fichier sera accepté. 

 

Capture d'écran à venir.

 

NOTE 2 : Si vous pensez devoir consulter cet ensemble de fichiers régulièrement, vous pouvez sauvegarder la liste en cliquant sur Save favourites. Vous pouvez même ajouter des commentaires sur ces fichiers dans la partie inférieure de la fenêtre.
 
Les fichiers pourront alors être ajoutés en bloc la prochaine fois que vous utiliserez Concord, en ouvrant la liste à partir de l’icône Get favourites. Le chargement peut prendre un petit moment.

 

Capture d'écran à venir.

 

NOTE 3 : WordSmith offre aussi la possibilité de chercher une série d’unités stockées dans un fichier, mais cette possibilité ne sera pas exploitée dans le cadre de ces exercices. Pour en savoir plus à ce sujet, consultez les fichiers d’aide. 

 

Capture d'écran à venir.

 

 

 

 

 

 

 

 

 

 

 

 

Capture d'écran à venir.

 

 

 

 

 

 

NOTE 4 : Ceci peut être très intéressant pour, par exemple, indiquer les parties du discours pour une chaine qui présente une ambigüité catégorielle ou pour différencier des cas intéressants ou problématiques de ceux qui ne le sont pas. 

 

 

 

 

 

 

Capture d'écran à venir.

 

 

 

 

 

Capture d'écran à venir.

 

 

Capture d'écran à venir.

 

Capture d'écran à venir.

 

NOTE 5 : Si vous enregistrez le fichier en format .txt, vous pouvez délimiter la longueur du contexte à extraire à partir de la fenêtre Concord (menu Settings Specific to Concord > Characters to save (per entry) > OK). 

 

NOTE 6 : Comme vous l'avez vu ci-dessus, lorsque des Set ont été attribués, WordSmith les utilise comme critères de tri par défaut lorsque vous demandez un tri. Pour avoir accès aux autres critères de tri disponibles, commencez en éliminant les Set. (Notez que vous avez sauvegardé une copie de la concordance annotée, donc vous pourrez toujours vous y référer si vous le voulez.) 

 

 

NOTE 7 : N’oubliez pas de cocher la case Activate pour chaque critère que vous voulez utiliser pour trier la concordance.

 

NOTE 8 : Vous auriez intérêt à noter les cooccurrents que vous avez relevés pour cette unité. Vous verrez en effet dans le Tutoriel sur Concord de WordSmith Tools, niveau II une autre façon d’identifier des cooccurrents, cette fois automatiquement.

 

Capture d'écran à venir.

 

NOTE 9 : Vous pouvez aussi accéder à la fonction Zap par le raccourci clavier Ctrl+Z. Vous allez sans doute reconnaitre ce raccourci utilisé par défaut par les applications Microsoft pour annuler une action. Il est important de ne pas l’utiliser dans WordSmith, à moins de vouloir « zapper » les occurrences supprimées. 

 

NOTE 10 : À cette étape, si vous désirez continuer tout de suite avec WordSmith Tools, vous pouvez commencer le Tutoriel sur Concord de WordSmith Tools, niveau II, en sautant les premières sections sur le téléchargement de fichiers et la construction de corpus et en débutant avec les premières recherches suggérées. 

 

VII. Questions de réflexion


 

  • Quelles sont vos premières impressions sur les fonctions et le fonctionnement de Concord de WordSmith Tools? 
  • Que pensez-vous de son interface? Des options de recherche qu’il vous offre? Des options d’affichage et de traitement des résultats?
  • Qu’est-ce que Concord pourrait vous aider à faire? Dans quelles conditions?
  • Quels sont les principaux avantages ou inconvénients liés à l’utilisation de Concord pour interroger des banques de textes? Par rapport à une approche manuelle? Par rapport à l’utilisation d’un autre outil?
  • Quelles sont les principales difficultés qui se posent lorsqu’on utilise un concordancier? Ces difficultés ont-elles une incidence sur la façon de faire les recherches et d’exploiter les résultats?
  • Quels critères pourriez-vous utiliser pour évaluer des concordanciers unilingues?
  • Pouvez-vous comparer Concord à d’autres concordanciers unilingues que vous connaissez?

 

Tutoriel créé par l'équipe de la CERTT (06-07-2009)