Page principale Moteurs de recherche, Classification sémantique & Analyse 
  info@acetic.fr 
English
Espanol
Accueil | News | Références | Support | Download
Documentation | Espace client | Acheter | Société 

Traitement de très gros corpus textuels

Cette technique, qui a été conçue pour extraire rapidement de l'information numérique (Text mining, Web mining) à partir de gros corpus de presse ou de contenus issus d'Internet, peut être utilisée à des fins d'Intelligence économique, pour constituer des revues de presse, pour effectuer des études sociologiques, pour générer des mots-clés d'un thésaurus, etc.

Elle n'est exploitable qu'avec les versions professionnelles de Tropes Zoom et Index.

La méthode proposée est la suivante :

1 - Récupérer le plus grand nombre possible de textes traitant du même thème (abonnement à des services télématiques, récupération l'information sur Internet, exportation du contenu d'un cédérom, ...)

2 - Regrouper et/ou organiser, autant que possible, les textes dans des fichiers ou des répertoires en fonction des informations disponibles (chronologie, zone géographique, secteur d'activité, ...).

3 - Indexer une base documentaire avec Zoom.

4 - Effectuer une recherche documentaire en utilisant un critère suffisamment large pour garantir l'exhaustivité du résultat (extraire un échantillon représentatif du corpus).

5 - Construire un scénario sémantique regroupant les principales références, en analysant a posteriori cet échantillon, qui peut comprendre plusieurs centaines de pages.

6 - Utiliser le scénario comme grille d'analyse pour mesurer le taux de référencement des thèmes qu'il contient sur l'ensemble du corpus.

7 - Analyser le résultat avec un tableur, un gestionnaire de base de données ou un logiciel de statistiques.

8 - Repérer des irrégularités dans les données obtenues et analyser les textes correspondants avec Tropes. Si nécessaire, retourner à l'étape 3, perfectionner le scénario et recommencer le processus d'analyse jusqu'à ce qu'on ait trouvé les textes ayant la meilleur valeur explicative du corpus observé.

Cliquez-moi


Début Précédent Suivant Fin

Copyright Acetic, tous droits réservés
www.acetic.fr


La version anglaise de Tropes Zoom vous intéresse ?
Visitez :

semantic-knowledge.com

www.semantic- knowledge.com

 


Voir aussi :

Nos bibliographies scientifiques

Les enjeux de l'analyse sémantique


Téléchargez
gratuitement
Tropes Zoom V7 Tropes Zoom
Edition Spéciale