![]() |
Moteurs de recherche, Classification sémantique & Analyse | |||
| info@acetic.fr | ||||
|
|
||||
|
|
Accueil |
News |
Références |
Support |
Download Documentation | Espace client | Acheter | Société |
|||
|
Ce guide d'utilisation est périmé Cliquez ici pour consulter le nouveau guide Zoom Si vous êtes un nostalgique de la version 2001, alors vous pouvez encore consulter ceci : |
|
ZOOM
|
Lancer Zoom.

Pour commencer, il suffit d'indiquer le dossier où vous stockez vos textes sur le disque dur.
La première fois, Zoom s'ouvre sur le dossier "textes" du disque dur où est installé le programme. Par la suite, il s'ouvrira sur le dernier dossier utilisé. Zoom analysera l'ensemble des fichiers, d'un même format, contenu dans ce dossier ET dans tous les sous-dossiers qu'il contient. Cette option peut être changée.
Choisir le disque qui contient les documents sur lesquels vous voulez travailler (c'est généralement [ C:\ ]).
Choisir le dossier souhaité dans l'onglet [Fichier]
Appuyer sur le bouton [Indexer une base] : une fenêtre "Indexer une base documentaire (français)" apparaît.

Sélectionnez un format de données textuelles (i.e. Page web, format texte, ...)
Vérifiez que l'option [Créer une base Zoom] est cochée dans l'onglet [Résultats].
Appuyez
sur [Créer] : L'indexation commence.
Les documents contenus dans le(s) dossier(s) choisi(s) sont chargés
pour traitement.

Cette fenêtre donne l'indication du nom du fichier et du défilé des mots analysés.
Résultat : 44 documents ont été indexés, votre base contient 142 538 mots.
Vérifions le en tapant "*" dans la ligne de commande [Chercher].

La totalité de la base vous est présentée. La barre d'état (en bas de la fenêtre du logiciel) indique : [44] "Il y a 44 fichiers 142 538 mots) dans cette base documentaire."
Chaque fichier est précédé d'un indice (facteur de pertinence), suivi de son nom. Ensuite viennent les 2 premières lignes du texte. L'indice est "0000" pour tous les documents puisqu'aucun critère de recherche n'a été demandé.
Options d'analyse lors de l'indexation d'une base ZOOM
Appuyer sur [Indexer une base], la fenêtre correspondante s'affiche. Choisir l'onglet [Options].
![]() |
L'option
[Traiter les sous-dossiers] : si elle est
cochée, Zoom indexe la totalité du dossier, quel que
soit le nombre de sous-dossiers. Sinon, il ne descend pas
l'arborescence et n'indexe que les fichiers de premier
niveau. Les options suivantes : [Type de construction], [Choix de la langue] et [Scénario] sont disponibles dans les versions professionnelles. |
Cliquer sur le bouton [Options d'analyse] :
| Le [Seuil
de détection des classes] permet de choisir à
partir de combien de mots d'un même univers de sens, le
logiciel devra relever que le texte parle
significativement d'une thématique. D'origine, le réglage
est de 3 mots. Cela signifie, par exemple, que la thématique
"élection" ne sera diagnostiquée que si 3
mots, au moins, du vocabulaire de l'élection est relevé
dans le texte. Vous pouvez aussi cocher l'option [Facteur de pertinence] pour utiliser une fréquence d'occurrence pondérée en 10.000ème de mots du texte. |
![]() |
Administration des bases ZOOM
Sous-classer la base
La base Zoom livrée contient 43 fichiers "txt" qu'il est possible de séparer en textes littéraires et textes politiques.
En maintenant enfoncée la touche [Ctrl] (ou [Maj]) pour chaque opération à la souris, sélectionner tous les textes littéraires, un par un (il y a les chapitres de "Madame Bovary" de Flaubert, soit 35 fichiers).
Appuyer sur le
bouton droit de la souris, choisir [Copier] ou appuyer sur le
bouton
à gauche. Une fenêtre [Parcourir à la recherche d'un dossier]
apparaît. Choisissez le dossier [Mes documents] pour la copie et
appuyer sur "OK" : c'est fait !
Supprimer des fichiers
Appuyer
maintenant sur le bouton droit de la souris, choisir [Supprimer]
ou appuyer sur le bouton
à gauche. Un message s'affiche : l'opération
est irréversible, les fichiers ne sont pas stockés dans la
corbeille. Appuyer "OK", 35 fichiers ont été supprimés
et sont signalés comme tels.
Reconstruire l'index
Relancer l'indexation. Taper "*" dans la barre de recherche et [Chercher] : il n'y a plus que 8 fichiers (8907 mots). La base "politique" est nettoyée. Vous pouvez créer une base "littéraire" dans "Mes documents" ou déplacer encore les fichiers dans un autre dossier.
L'administration des bases se fait donc dans le système des fichiers du système d'exploitation de votre ordinateur. C'est la solution la plus simple qui puisse exister ! Avec l'Explorateur Windows, décider des dossiers et sous-dossiers qui vont vous permettre de sous-classer les bases avec des critères de format de documents (un dossier "txt" et un dossier "htm" par exemple), des sous-critères de dates (par exemple une succession de sous-dossiers "communiqués du mois de janvier", puis février, etc...), puis encore d'autres sous-critères à votre convenance comme des critères géographiques, de personnes etc...
ZOOM sera capable de créer une base sur chaque branche et de consolider les résultats à chaque niveau. Chaque base doit être uniforme dans son format de fichiers.
Recherche en langage naturel
Placez-vous sur
le dossier où vous avez créé une base ZOOM.
Le logiciel garde en mémoire la dernière base sur laquelle vous
avez travaillé. Notre base "politique" contient 8
textes [cf. § administration des bases] qui sont les professions
de foi des candidats du premier tour de la dernière élection présidentielle.
![]() |
Taper "je cherche
tout ce qui parle de la protection sociale" dans la ligne de
commande [Chercher]. Après une analyse en temps réel de la ligne de commande, Zoom propose des critères de recherche. Il a éliminé la plupart des opérateurs du langage naturel et propose la locution "protection_sociale" comme appartenant au vocabulaire de la sécurité sociale : la recherche portera sur ce vocabulaire. Lancer la recherche : ZOOM a trouvé un document reprenant le vocabulaire de la sécurité sociale (avec le réglage par défaut de détection des classes qui est 3). Le fichier trouvé affiche un indice (facteur de pertinence) de ".022". Par "facteur de pertinence", on entend une fréquence d'occurrence pondérée en 10 000ème de mots du texte. |
Décocher, à l'aide de la souris, la case [protection sociale] -> [sécurité sociale] et se placer sur la suivante (-> [sécurité sociale]). La recherche va porter sur la protection sociale comme appartenant au vocabulaire de la sécurité sociale en tant que système social. ZOOM trouve 2 textes, parce que le sens du critére de recherche a été "élargi".
Taper "protection sociale" : ZOOM propose le même arbre et les mêmes résultats
Elargir une dernière fois au vocabulaire apparenté au [système social], ZOOM propose 4 textes classés par ordre de pertinence.
ZOOM permet 3 modes de tri des résultats : par nom de fichiers (classement alphabétique), par fréquence d'occurrence (non pondérée : l'indice indique alors le nombre de fois où ZOOM a trouvé ce vocabulaire ; pour obtenir plus de résultats : ré indexer la base avec une option de détection des classes inférieure à 3) et par pertinence.
Pour modifier le tri des résultats, aller dans l'onglet [Options].
Cumuler ou retrancher des critères de recherche
Pour retrancher la notion de "CSG" de la notion de "protection sociale", il suffit d'inscrire le signe moins (-) avant "CSG". Taper "je cherche tout ce qui parle de la protection sociale - csg" ou "protection sociale -csg" (ce qui revient au même). Lancer la recherche à chaque niveau de l'arbre "protection sociale" : il n'y a plus qu'un résultat dans les trois cas, les autres textes ayant été éliminés par le retranchement du critère "csg".
Pour ajouter la notion d' "impôt" à celle de protection sociale, ajouter le signe plus (+) devant "impôt". Taper "je cherche tout ce qui parle de la protection sociale +impôts" ou "protection sociale +impôts".
Cette recherche consiste à trouver les textes qui parlent, à la fois, de protection sociale et d'impôts : il n'y a aucun résultat au premier niveau de "protection sociale" (que nous appellerons "Références utilisées"), un seul résultat au second niveau (que nous appellerons "Univers de références 2") et trois résultats au niveau de recherche le plus large (que nous appellerons "Univers de références 1").
![]() |
Pour trouver les textes qui parlent de "protection sociale" OU "d'impôts", cocher l'option [Ou] en façade de l'onglet [Critères] (à droite). On a donc cumulé tous les textes qui contiennent au moins un des deux critères, ce qui produit forcément plus de résultats (4 résultats au premiers niveaux contre 0 avec l'option [Et]). |
Remarques
Les classifications de ZOOM proposent généralement 3 niveaux pour un même mot. Pour comprendre ce que cela signifie, l'image la plus appropriée est celle de poupées russes qui s'emboîtent les unes dans les autres. "Impôt" est son propre hyperonyme : il existe donc une "référence utilisée", un "univers de référence 2" et un "univers de référence 1" qui ont le même nom "impôt", mais à chaque fois, le vocabulaire correspondant s'élargit.
Quand ZOOM propose une seule branche, cela signifie que le mot est absent des classifications du logiciel et donc qu'il sera cherché en texte intégral (avec un seuil de détection qui est toujours fixé à 3 dans cette base). Taper "Charles", la recherche donne un seul document.
Pour vérifier la pertinence des résultats de la recherche, il faut ouvrir le ou les document(s).
ZOOM permet d'ouvrir les fichiers dans le lecteur Windows d'origine de ceux-ci (ici le Bloc-note ou Wordpad) ou, dans Tropes.
Tropes est le seul logiciel du marché à permettre de lire les informations cherchées et trouvées AU COEUR DU TEXTE. C'est ce que nous allons voir maintenant.
Ouvrir les résultats de ZOOM dans Tropes
Retourner sur l'onglet [Options], cocher [Ouvrir avec Tropes], double-cliquer sur le fichier trouvé dans la recherche "Charles", Tropes s'exécute.
![]() |
Tropes ouvre automatiquement le texte sur les propositions qui contiennent le sens de ma recherche (en rouge). |
Effectuer la recherche au niveau de la "référence utilisée" et ouvrir le résultat en double-cliquant sur le fichier. ZOOM a trouvé dans le texte les 3 seules propositions contenant le sens de ma recherche, Tropes permet de les lire !
![]() |
Pour obtenir le contexte de chacune d'entres elles, placer le pointeur de la souris sur un mot, faire un clic droit, choisir "Contexte" et un fenêtre hypertexte s'affichera. |
Ouvrir plusieurs documents à la fois
Que ce soit avec Tropes ou les logiciels Windows, ZOOM permet d'agréger les documents trouvés et de les ouvrir comme si c'en était un seul.
Tropes s'ouvre désormais sur les 6 propositions contenant le sens cherché.
Effectuer la recherche au niveau de l' "Univers 1", sélectionner tous les fichiers et les ouvrir. Tropes vous permet de lire toutes les propositions disponibles concernant cette recherche d'information.
Sélectionner "Univers de référence 1" dans Tropes. Ca parle de "Politique" (avec indication des propositions contenant le vocabulaire de la politique).
Outre les traditionnels palmarès, Tropes offre une quinzaine d'outils d'analyse, dont une navigation hypertexte, très pratique, par graphe étoilé. Vous pouvez aussi chercher un mot en texte intégral, ce qui est désormais sécurisé du point de vue des ambiguïtés sémantiques.
|
|
|
|
|
Copyright Acetic, tous droits réservés
www.acetic.fr
Tropes est aussi une véritable référence dans le domaine scientifique.
Pour en savoir plus, consultez notre bibliographie.
La version anglaise de Tropes Zoom vous intéresse ? Visitez notre nouveau site: www.semantic- knowledge.com
|
Consultez nos guides d'utilisation : |
|
Voir aussi : |