INTRODUCTION A L'INDEXATION
Alexandre Serres
URFIST Bretagne-Pays de Loire
 
 
 
 

3. Les langages documentaires

3.1 Retour sur la problématique de l'indexation documentaire

3.2 Définition d'un langage documentaire

3.3. Typologies des langages documentaires

3.4. Les classifications

3.5 Les listes de vedettes-matières

3.6. Les thesaurus








3.1 Retour sur la problématique de l'indexation documentaire

 

3.2 Définition d'un langage documentaire

Trois points importants :
- langages artificiels
- ensembles de termes, liés entre eux par des relations analytiques ou syntaxiques, permettant de rendre compte des concepts contenus dans le document.
- instruments d’analyse conçus spécialement pour le traitement de l’information.
 
 


3.3. Typologies des langages documentaires


Variété de langages documentaires et distinctions possibles selon plusieurs critères :
- principe de classement : hiérarchie, grille conçue a priori, ou organisation selon points de vue, l'usage...
- domaine couvert : encyclopédique ou spécialisé
- types de mots employés : mots simples (unitermes), mots composés du langage naturel, ou des vedettes-matières...
- relations ou non entre les termes : tous les termes équivalents, ou relations hiérarchiques...
- organisation interne du langage : systématique, alphabétique, décimal, mixte...
- notation des termes : numériques, alphabétiques, alphanumériques
 

Qu'est-ce qui les distingue ? 
Deux grands critères  de typologie, donnant lieu à deux sortes de regroupement des familles de langages :
3.3.1. Les deux grands types de langages documentaires selon leur structure

Deux grandes méthodes pour réaliser une indexation  :
    - démarche synthétique de l’esprit : du général au spécifique
    - démarche analytique : décomposition des concepts et combinaison

A ces deux démarches correspondent deux familles de langages documentaires et deux grands types d’indexation :
    - démarche synthétique > indexation systématique
            >> langages à structure hiérarchique :
                          classifications

    - démarche analytique > indexation analytique ou alphabétique
               >> langages à structure analytique ou combinatoire :
                            listes de vedettes-matières, thésaurus
 
 

                - Ex. de l’or : > chimie, minéralogie, bijouterie, numismatique
                - la mer : > géologie, écologie, zoologie, pêche, économie, transport...
                  - Ex. de l’or : regroupé selon les différents points de vue, mais isolés des autres métaux
                    précieux
Inconvénients complétés par des palliatifs :
- classifications complétées par des index alphabétiques
- listes alphabétiques enrichies par des procédés de mise en relation (renvois...)
 


3.3.2. Notion de langages pré-coordonnées ou post-coordonnés

Distinction entre langages hiérarchiques et combinatoires remplacée par un autre critère de différenciation, plus important avec la RDI (Recherche Documentaire Informatisée) :
            la pré- ou la post-coordination des concepts.


3.4. Les classifications

Exemple :
Classification Dewey Classification agronomique
6 Techniques
63 Agronomie
634 Arboriculture
634.9 Sylviculture
634.97 Espèces d’arbres en forêt
634.972 Dicotylédones employés en charpente
634.972.1 Chêne
A Sciences
AC Sciences naturelles
ACD Botanique
ACDC Botanique appliquée
ACDC4 Sylviculture
ACDC41 Espèces d’arbres des forêts
ACDC415 Chêne

 

Classifier un document :
- identifier le sujet principal
- affecter la rubrique du plan de classement qui traduit le mieux le sujet

Quels inconvénients ?
système rigide et figé (relations hiérarchiques pré-établies)

Quelles utilisations ?
- classement des bibliothèques et centres de doc
- classement des notices bibliographiques dans certaines bibliographies, dans un bulletin signalétique...
- annuaires sur Internet : utilisation de la Dewey, principe même des annuaires type Yahoo
 

-

3.4.1 Les principales classifications

Les plus anciens des langages documentaires ; apparus fin 19ème-début 20ème
 

- Classifications très datées historiquement ;
- liées au développement des sciences et techniques de la fin 19e ; précèdent l’explosion documentaire.
- actuellement presque plus utilisées pour l'indexation ; applications spécifiques : classement, bibliographies...
- mais triomphe des principes classificatoires sur le web (annuaires) ; développement désordonné des classifications
 

3.5 Les listes de vedettes-matières

Langages à structure analytique, apparus au début du siècle.
Important développement depuis plusieurs décennies.

 


3.6. Les thesaurus



Avec les thésaurus, indexation s’effectue au niveau de chaque concept élémentaire, chacun de ces concepts étant représentés par un terme, appelé descripteur.

Notion est définie par l’intersection de concepts indépendants :
Exemple :
Document sur la démographie en France entre 1914 et 1939 :
    France
    démographie
    1914-1939
> pas d'ordre de classement des descripteurs
 
TABLEAU DES RELATIONS ET SYMBOLES
DANS UN THESAURUS



 

TYPES DE RELATIONS
SENS DES RELATIONS
TERMINOLOGIE
FORMES en Français (Norme AFNOR)
FORMES en Anglais (Norme ISO) 
A/ RELATIONS

d’EQUIVALENCE ou de SYNONYMIE

1/ Du non-descripteur vers le descripteur
EMPLOYER
E ou EM

voiture E automobile

USE
  2/ Du descripteur vers le non-descripteur
EMPLOYE POUR
EP

automobile EP voiture

UF (Used For)
B/ RELATIONS 

HIERARCHIQUES

1/ Du terme spécifique au terme générique
TERME GENERIQUE
TG

automobile TG véhicule terrestre

BT

(Broader Term)

  2/ Du terme générique au terme spécifique
TERME SPECIFIQUE
TS

véhicule terrestre TS automobile

NT

(Narrower Term)

C/ RELATIONS

ASSOCIATIVES

ou de 

VOISINAGE

D’un descripteur vers un autre descripteur 

(analogies de signification...)

TERME ASSOCIE
TA

automobile TA course automobile

RT

(Related Term)

NOTES  Elimination de la polysémie d’un descripteur

 

NOTE D’APPLICATION
NA

Mémoire NA 

Informatique

Mémoire NA Psychologie

SN (Scope Note)

  Différents types de présentation des thésaurus, généralement combinés. Présentation claire mais limitée, car ne permet qu’une vue partielle de la hiérarchie entre les termes.
 
Champs sémantiques appelés micro-thésaurus, ou terminogrammes
 
 

3.7 Comparaison des langages documentaires

 

> Voir Document Word TABLEAU COMPARATIF DES PRINCIPAUX LANGAGES DOCUMENTAIRES

 


Dernière mise à jour :
Septembre 2003.
Ce support de cours peut être librement exploité, sous réserve de citer son origine.

  © URFIST Bretagne-Pays de Loire, Janvier 2002