Evaluation de l'information sur Internet

Ce support de formation a été élaboré par Alexandre Serres,
co-responsable de l'URFIST de Rennes, en vue d'un stage de l'URFIST. 

  • Objectifs du stage et du support :
Il vise deux objectifs, réflexif et pratique :
- pointer quelques uns des enjeux de l'évaluation de l'information à l'heure du "déluge informationnel" et essayer de cerner les questions, théoriques et méthodologiques, liées à cette problématique ;
- proposer une démarche en deux étapes et recenser les critères d'évaluation et les questionnements nécessaires à une validation de l'information sur Internet.
  • Publics visés :

    Ce support de formation vise prioritairement les professionnels de l'information (bibliothécaires, documentalistes) et les enseignants, impliqués dans la formation des usagers. Mais il intéressera également les étudiants, désireux d'acquérir une méthodologie d'évaluation des ressources du web.
  • Pré-requis :

- connaissance et pratique d'Internet
- connaissance de la recherche d'information sur Internet : outils, méthodologies

 

 

 


Ce support est référencé sur :

- Infothèque francophone
- FORMIST
- Doc pour Docs
- FOURMI et CERISE (URFIST de Paris)
- Signets de la BNF
- Le Point du FLE
 

 

Fichiers attachésTaille
Office presentation icon Evaluation_info_11-2009.ppt1 byte
Type de formation: 
Stages
Auteur(s): 
Alexandre Serres
Thème: 
Recherche d'information
Public: 
Tous publics Urfist
Date de création: 
01/01/2002
Date de modification: 
03/03/2011
Tags: 
License: 

Contexte et enjeux de l'évaluation de l'information sur Internet

Contexte général : la société de l’information

La numérisation généralisée du savoir et de l'information

Les enjeux : les risques de "l'info-pollution"

Quels enjeux pour les usagers ?

Quels enjeux pour les professionnels de l'information ?

La montée en force d'une problématique

 


 

Contexte général : la "société de l’information"

Pourquoi l'évaluation de l'information est -elle devenue aujourd'hui une question centrale ?

Deux premiers ensembles de raisons doivent être évoqués :

  • Tout d'abord, le constat (déjà ancien) du rôle-clé de l'information et des enjeux de sa maîtrise : enjeux majeurs, aux multiples dimensions (sociales, politiques, économiques, etc).

"La maîtrise du savoir et de l'information sera vraisemblablement un facteur crucial dans les 15 prochaines années" (selon une réflexion, faite en 1985, par les experts du rapport France, An 2000)

La question de l'évaluation de l'information est à re-situer d'abord dans le contexte global de la "société de l'information" (sans discuter ici la pertinence de cette notion de "société de l'information") et pourrait se formuler ainsi :


à partir du moment où l'information devient la "matière première" (appelée parfois le "pétrole gris") des sociétés développées, le moteur de l'innovation technique et scientifique, etc., l'évaluation de la fiabilité et de la valeur de toute information en devient d'autant plus cruciale (cf l'exemple de la veille stratégique et de l'intelligence économique, où la question de l'évaluation des informations traitées est au coeur de la démarche de la veille). Cet enjeu de l'évaluation, lié à la valeur (économique, stratégique, scientifique...) de l'information, ne date pas d'Internet et il accompagne la montée en puissance du rôle de l'IST (Information Scientifique et Technique), notamment après la 2ème guerre mondiale, "l'explosion documentaire" des années 50-60, la naissance et l'essor des banques de données, de l'industrie de l'information, etc.

⇒ Si l'évaluation de la qualité de l'information n'est pas une activité nouvelle, son importance a accompagné l'émergence et le développement de la "société informationnelle"

  • L'explosion d'Internet et ses caractéristiques en tant qu'espace informationnel : liberté totale d'expression, hétérogénéité, instabilité, disparition des intermédiaires, etc.

► L'essor d'Internet et le "déluge informationnel" engendré posent, avec une acuité inégalée, la question socio-politique de la fiabilité de l'information disponible sur les réseaux : comment "séparer le bon grain de l'ivraie" dans les masses d'informations circulant sur les réseaux ? L'absence de validation a priori des informations publiées sur le web, notamment, change radicalement les données du problème de l'évaluation.

Le déluge informationnel sur Internet rend cette activité d'autant plus difficile et cruciale.

haut de page


 

La numérisation généralisée du savoir et de l'information

Un troisième élément, étroitement lié aux deux premiers facteurs, définit le contexte général de l'évaluation. En effet, la question de l'évaluation de l'information est à replacer dans le contexte socio-pédagogique de la numérisation généralisée du savoir et de l'information, qui touche toutes les parties de la " chaîne du savoir " (au sens large de l'ensemble des productions cognitives) :
- la production des savoirs
- la circulation des savoirs
- la transmission : généralisation des modes de lecture-écriture non-linéaire ("navigation "), nouvelles conditions de l'enseignement, possibilités inédites pour la formation continue...


► L'essor et la diffusion des TIC aboutissent à l'apparition de nouvelles manières d'apprendre, d'enseigner, de lire, d'écrire, à la transformation profonde de notre "écologie cognitive " (c.a.d. l'ensemble de notre environnement socio-cognitif, de nos modes de pensée, d'apprentissage..)

Quelles sont les grandes caractéristiques de ce savoir numérique et de cette nouvelle « écologie cognitive » ?

- un savoir « objectivé » et technicisé, en constante réorganisation
- une connaissance par simulation
- une présentation multimédia
- un savoir virtualisé
- un savoir en hypertexte
- un savoir hétérogène, mobile
- un savoir éclaté en d’innombrables lieux
- un savoir potentiellement accessible à tous
- un savoir collectif

Questionnement nécessaire : quels sont les aspects de ce nouveau savoir numérique qui concernent de près la question de l’évaluation de l’information ?

  • Sur l’objectivation du savoir et de la mémoire collective :

La révolution numérique a accéléré la séparation croissante de la mémoire collective, sociale des individus : la mémoire est de moins en moins "incarnée" mais présente dans des dispositifs techniques, aux capacités colossales de stockage.

Cette "objectivation", cette « industrialisation » de la mémoire rend les mémoires informatisées toujours mobiles, en réorganisation permanente : peut-on d'ailleurs encore parler de mémoire, avec la montée en puissance de la flexibilité, de la vitesse, de la pertinence...
L'une des conséquences, soulignée notamment par Pierre Lévy (cf Les Technologies de l'intelligence), serait le déclin de la vérité, de l’objectivité et de la critique : avec l’éloignement de la mémoire, le savoir informatisé s’éloigne aussi des exigences de vérité, fondamentales dans le pôle de l’imprimé.
L'exigence de vérité, d’objectivité, de critique nécessite une accumulation du savoir, une mise à distance, un travail sur les textes, une stabilité de la mémoire sociale...
Avec un savoir « en temps réel », on assiste au déclin de ces valeurs au profit de l’opérativité, de l’efficacité, de la pertinence...

Quelles incidences sur la question spécifique de l’évaluation de l’information ?
Ce changement profond du modèle du savoir et de ses fondements a peut-être trois incidences générales, d’ordre plutôt théorique, ou idéologique :

o      La montée en force de la question-même de l’évaluation de l’information, voire de l’évaluation tout court :
- à partir du moment où le savoir informatisé, la mémoire collective sont mobiles, mouvants, en constante réorganisation, sans cesse ajustés pour répondre à des besoins spécifiques, ciblés (cf la notion de « connaissance en temps réel », « d’open learning just in time », etc), l’évaluation de ces savoirs et de ces informations devient d’autant plus importante (pour l’apprentissage, l’enseignement, la vie sociale, etc)…
On peut faire un simple constat : pourquoi ne parlait-on pas de cette question de « l’évaluation de l’information » il y a 10 ou 20 ans ?

o      L’accélération en retour du déclin des anciens modèles du savoir : la notion même d’évaluation de l’information, son importance actuelle, son autonomisation croissante (à laquelle participe ce stage !)… participent de ce déclin des valeurs traditionnelles de vérité, de critique et d’objectivité…

o      La montée en force de la notion de « pertinence » de l’information au détriment des valeurs d’objectivité ou de vérité :
voir l’importance, souvent non discutée, de la pertinence de l’information dans les modalités d’évaluation…

o      Conséquence plus globale : le culte de l’information 
L’évaluation de celle-ci joue un rôle central ; on constate une certaine "idéologisation" des notions d’information et de communication, devenues les valeurs cardinales, dominantes… ;
d'où la nécessité de garder son sens critique vis-à-vis d’une survalorisation des problématiques documentaires d’évaluation de l’information

Notamment sur la question des moyens, des voies permettant de développer une véritable maîtrise de l’évaluation : notre conviction reste que le meilleur moyen de développer l’évaluation de l’information passe par la culture générale et l’acquisition des connaissances, et non par des grilles, des méthodes, ou des savoirs spécifiques…

  • L’imbrication des modes d’expression : le multimédia

Auparavant (dans la « graphosphère »),existait l'habitude de séparation assez nette entre les différents modes d’expression : oral, écrit, son, image... Avec le multimédia, s'est produit l'effacement des frontières et l'entremêlement de tous les médias : d'où la notion d’unimédia, c.a.d. de fusion de toutes les sources sur un même support.
Les conséquences sociocognitives sont nombreuses, qu'il s'agisse notamment de l'enrichissement du savoir avec les nouvelles combinaisons texte-son-image, des nouvelles écritures multimédia, du développement de l’art multimédia, des nouvelles possibilités de visualisation des phénomènes, etc.

o      Conséquences sur la question de l’évaluation :
des difficultés cognitives et techniques : l'évaluation des documents et de l’information est rendue plus difficile par cette imbrication des modes d’expression : des compétences multiples sont nécessaires, il est difficile d’évaluer simultanément sons, textes et images…
cf plus loin les difficultés dues au numérique

  • La virtualisation du texte

Le processus de virtualisation à l’oeuvre dans les réseaux du cyberspace entraîne de profondes mutations sur la nature et le statut des textes.
L'absence de support physique, matériel, dans les textes numérisés, modifie totalement les conditions de la lecture :


- mobilité, plasticité des messages : possibilités infinies de montage, modification, collages...
- disparition des structures habituelles du texte, ou du document : plus de structure logique, d’enchaînement linéaire des différentes parties des documents. Par ex. effacement des distinctions entre texte et paratexte (table des matières, titres, index...) ; juxtaposition des éléments du document, structure réticulaire des textes, reliés en permanence à d’autres textes.
« Il y a du texte » (comme de l’eau) dans les réseaux.
- exploration de textes à partir d’une petite fenêtre (écran), derrière laquelle existe une immense réserve textuelle, donnant une véritable « profondeur » au texte, une « potentialité » quasi-infinie (même si finie en réalité).

► La lecture devient une exploration, beaucoup plus active que la lecture d’imprimé : le lecteur est obligé d’appeler, de commander l’affichage de textes ; mais surtout possibilité de croisements, de montages, de juxtapositions infinies des textes et messages.

- hétérogénéité des messages : des types et des contenus d’informations, des sources (entremêlement du multimédia)...
Autre conséquence importante :
- effacement de la frontière auteur/lecteur dans ce type de savoirs numérisés : dans l’hypertexte généralisé, la séparation entre auteur et lecteur est brouillée : permutation des places, élaboration collective d’hypertexte.. Naissance d’une nouvelle littérature hypertextuelle, encore embryonnaire.

o      cf toute la problématique du document numérique, des nouvelles formes de lecture-écriture

Conséquences sur l’évaluation :

⇒ renforcement de la nécessité de l’évaluation, celle-ci se confondant presque avec un décodage du document numérique

  • Le savoir mobile

La numérisation apporte une sorte de révolution copernicienne dans la lecture, et au-delà, dans l’accès au savoir ;

- dans la "graphosphère", (i.e. le monde de l'imprimé), l'usager, le lecteur, l'élève.. tournaient autour du savoir, immobile, qui était contenu dans des lieux fixes (écoles), des réserves documentaires (bibliothèques...), des ouvrages (dictionnaires...), concentré, détenu par des acteurs sociaux identifiés (enseignants)...

Il existait une certaine fixité du savoir et une mobilité des lecteurs ou des élèves :

- dans le cyberspace, c’est l’inverse : le savoir "tourne autour de l’élève", les textes autour du lecteur...
Le savoir devient :
- mobile, en constante circulation sur les réseaux > phénomène de déterritorialisation du texte
- fluctuant, en métamorphose constante dans ses structures mêmes : en constante réorganisation
- éclaté, « distribué » en d’innombrables lieux : conséquences majeures sur l’école, qui finit de perdre son monopole déjà entamé de dépositaire unique du savoir.

voir Michel Serres, qui prédisait que « la concentration du savoir va être dynamitée »


Phénomène de circulation des savoirs : « le savoir voyage » et devient potentiellement accessible à tous ; est-ce l'avènement d’une « société de la pédagogie » (selon Michel Serres), notamment grâce aux possibilités énormes de l’enseignement à distance ? Enjeux essentiels pour l’université, l’enseignement, avec l’utilisation massive des TIC : possibilité technique de cours par téléconférence, de démultiplication des sources d’enseignement

o      Conséquences sur l’évaluation de l’information :
     - éclatement des approches
     - problème des élèves « seuls face à Internet » (comme il y a 20 ans, les enfants « seuls avec Goldorak »

o      Un constat pessimiste : la "contradiction médiologique" entre l’école et Internet
Problème des nouvelles pratiques informationnelles des élèves sur les réseaux : zapping, surf, représentations,   nouveaux mythes de l’information...

  •  En résumé :

o      D’un côté, les nouvelles formes du savoir et de l’information, la numérisation généralisée… plaident pour développer l’évaluation de l’information, rendue plus complexe, plus difficile à cause de la numérisation ; d’autant plus que les étudiants, les usagers sont désormais confrontés à l’éclatement des savoirs, et que les processus d’évaluation reposent beaucoup plus qu’avant sur l’usager ; la question de l’autonomie de jugement des usagers, notamment des jeunes élèves, est beaucoup plus aigüe qu’autrefois.

o      D’un autre côté, le développement des nouveaux modèles du savoir et de la problématique de l’évaluation, accélère la disparition des anciens modèles et le déclin de quelques valeurs centrales (vérité, approche critique et herméneutique des textes, respect de l’auteur…. ), au profit d’une certaine idéologisation, voire d’un certain culte de l’information

autrement dit, il faut former à l’évaluation de l’information de manière critique, y compris sur l’évaluation elle-même…

haut de page


 

Les enjeux : les risques de "l'info-pollution"

L'information comme nouvel environnement, nouvelle écologie, nouvelle pollution :
si la production, la diffusion, la recherche, le traitement de l’information sont au cœur de nombreux enjeux, si l’information constitue un nouvel environnement..., l' information est également l'objet de dangers, "d’accidents" (cf l'image d'un " Tchernobyl de l’information ", de Paul Virilio), et de pollutions (cf la notion " d ’infopollution ", selon l'expression d'Eric Sutter)

Quatre types de " pollutions " informationnelles (selon Eric Sutter), correspondant à quatre types de risques écologiques, peuvent être identifiés. Eric Sutter donne pour chacune d'elle une métaphore, une image forte, et relève les "pathologies potentielles" induites par ces pollutions. En reprenant sa typologie et en nous inspirant de ses réflexions, nous essayons ici, pour chacune de ces "pollutions", d'en indiquer, très schématiquement, les causes, les effets, et les éventuels remèdes.

1ère pollution : la surabondance

  • métaphores, images :
    - "l’océan", le "déluge informationnel"
    - images de pollutions écologiques : l’inondation, l’asphyxie
      ⇒ A noter le changement de métaphore : dans les années 60, on parlait "d'explosion documentaire" pour désigner l'augmentation vertigineuse du nombre de publications scientifiques et techniques. Avec Internet s'est répandue la métaphore aquatique du "déluge".
  • causes :
    - causes historiques : passage d’une situation de pénurie, de rareté de l’information à une situation d’abondance informationnelle : cf l'histoire de l'IST, le phénomène de l'explosion documentaire des années 60, sans parler de la société médiatique et des effets du "village planétaire", etc.
    - causes immédiates : l'explosion du web et des ressources sur Internet (des dizaines de milliards de pages web sur le web "visible")
  • quels effets ?
    - la désorientation : phénomène de perte de repères, de désorientation, de "noyade", dans l'hypertexte mondial... - la saturation : " Trop d’infos tue l’info " ; " trop d’information crée une sorte de saturation et on ne parvient plus à extraire le signal du bruit ", selon Joël de Rosnay.
    - l'aveuglement : " l’infopollution (qui) conduit à un certain abrutissement des esprits qui empêche de voir l’arbre dans la forêt et de discerner la vraie information " ( Victor Montviloff, de l’Unesco)
    - le découragement : dans la recherche de l’information sur le web, et pour la majorité des internautes, on peut relever une approximation totale dans la sélection des documents, et une certaine dépendance vis-à-vis des outils de recherche
    par exemple, dans le classement des documents, 90% des internautes ne consultent que la 1ère page de résultats affichés par les moteurs de recherche.
  • quels remèdes ?
    Si cette nouvelle surabondance informationnelle est un phénomène irréversible, incontournable, et surtout impossible à maîtriser, des réponses (à défaut de remèdes) sont à chercher néanmoins dans deux directions :
    • du côté des outils et des méthodes de traitement de l'information :
      Pour les outils de recherche, notamment les moteurs de recherche, la surabondance ou le déluge informationnel sont le principal défi à relever, depuis l'essor grand public d'Internet. De nombreuses solutions ont déjà été trouvées et apportées par les outils d'information, notamment :
      -
      dans leur puissance de collecte, d'indexation..., cad dans leur capacité à traiter d'énormes masses documentaires et à en extraire des informations pertinentes

      - dans les technologies et les méthodologies de filtrage de l'information : cf les techniques de "clustérisation", etc.
      De nouvelles solutions sont en cours de développement avec les travaux du web sémantique.
    • du côté des usages de l'information :
      Pour les usagers, faire face à la surabondance d'information implique (et impliquera de plus en plus) de développer des comportements et des pratiques personnelles de filtrage, de sélection, d'élimination, etc., cad une véritable "diététique informationnelle" , encore loin d'être acquise et répandue.
      Le développement des formations des usagers à la maîtrise de l’information constitue également l'une des réponses collectives possibles à cette surabondance informationnelle : en contribuant à mieux maîtriser les outils et techniques de recherche...

A noter : la problématique de l'évaluation de l'information n'est pas concernée directement par cette "pollution" de la surabondance : les réponses ou les remèdes possibles (au plan humain) relevant davantage d'un rapport général à l'information, des pratiques et des usages, d'une définition plus fine de ses besoins d'information, etc. Si évaluation il y a, elle porterait ici plutôt sur les besoins d'information, sur les raisons, les motivations et les objectifs qui nous poussent à chercher de l'information. (cf sur ce point Yves-François Le Coadic)

 

2ème pollution : la désinformation, la médiocrité de l'information

  • métaphores, images :

- l’intoxication, l’empoisonnement...
- notions de fiabilité, de " sûreté " de l’information, de confiance : puis-je consommer sans risque cette information trouvée ? (analogie avec les risques alimentaires)

  • causes :

ancienneté du phénomène (cf la rumeur, les pratiques d'intoxication, de manipulation...) mais trois nouveautés avec Internet :

le changement d’échelle : la puissance du média démultiplie l’impact des fausses informations, des rumeurs… (cf l'exemple de la désinformation sur l'attentat contre le Pentagone, l'importance des hoax dans le courrier électronique...)

le problème de la fiabilité des informations : problème ne relevant pas forcément de la manipulation, mais du manque de sérieux et de vérification des sources ; problème de la redondance, de la réplication des informations sans vérification…
 

Une étude de l'UCLA (University of California at Los Angeles) menée en 2002 a montré deux faits intéressants et paradoxaux :

- d'une part, 70 % des Américains utilisant Internet déclarent que le réseau est leur principale source d'information, loin devant la presse ou la télévision ;
- mais d'autre part, moins de 53 % des mêmes internautes américains jugent fiables les informations trouvées sur Internet (contre 58 % en 2001, et 55 % en 2000) ; et parmi ceux qui n'utilisent pas Internet, 33,6 % seulement d'entre eux font confiance aux informations du réseau, contre 36,7 % en 2001 et 33,3 % en 2000.)

(D'après Internet Actu Hebdo, n° 171, 6 février 2003, p. 3)

 

la confusion des écrits et des documents, l'hétérogénéité des informations disponibles : comment distinguer le brouillon ou l’avant-projet d'un texte du texte final d’un chercheur, comment identifier un rapport scientifique, un texte de propagande d’une secte, un document promotionnel, une page personnelle d'un lycéen...?
⇒ cf plus loin la partie sur "les brouillages du numérique", dans Questions, aspects théoriques...

 
  • quels effets ?
- développement d'une méfiance générale envers Internet et les médias (voir ci-dessus)
- intoxication par les rumeurs, les hoax
- perte de repères, perte de confiance en des instances sûres, reconnues...
- confusion intellectuelle généralisée, devant le mélange de toutes les sources
 
  • quels remèdes ?
Aucune "solution technique" ne peut être apportée à la désinformation, il n'existe aucune garantie d'échapper à une intoxication, à une rumeur, mais des réflexes, des compétences et une culture informationnels à acquérir, empruntés à la fois au journalisme d'investigation et à la recherche scientifique :
- connaître et vérifier les sources..
- les recouper
- vérifier les faits évoqués
- etc.

A noter : l'importance de l’évaluation de l’information par rapport à cette pollution informationnelle : le risque de la désinformation, le manque de fiabilité, la médiocrité de l'information... sont l'un des principaux défis que doit relever l’évaluation de l’information sur Internet.

 

3ème pollution : la contamination de l’information

  • métaphores, images :
    - la pollution des rivières ou maritime
    - image de la "marée noire"
     
  • phénomène :
    - prolifération d’informations indésirables sur Internet : pornographie, pédophilie, sectes, racisme, révisionnisme...
    - véritable contamination
    d’informations apparemment " saines " par des informations douteuses : sites révisionnistes trouvés dans une requête sur la Shoah, sites de la Scientologie référencés avec complaisance, sous une rubrique à part entière dans l’Open Directory et, à une certaine période, dans Google (sur ce sujet, voir la page :
    "Comment la secte criminelle scientologie a réussi à piéger Google"), sites pornographiques trouvés au hasard d’un lien apparemment inoffensif (cf les pratiques de " détournement " des liens par certains sites pornographiques), sites racistes déguisés en sites scientifiques, etc…
  • causes :
    - absence ou difficulté de contrôle éditorial sur Internet : n'importe qui peut publier n'importe quoi
    - utilisation d'Internet comme arme politique, moyen de propagande, moyen commercial, outil de communication par les réseaux mafieux ou délinquants, etc
    ⇒ Internet n'est plus (seulement) l'outil de communication scientifique, qu'il a été exclusivement pendant une vingtaine d'années : la plasticité des réseaux et du numérique s'e'st étendue (pour le meilleur et le pire) à toutes les facettes des activités humaines.
  • quels remèdes ?
    Plusieurs types de remèdes, complémentaires, peuvent être apportés à la "contamination de l'information" :
    - les remèdes techniques : par exemple les filtres parentaux, mis en place par les moteurs de recherche (mais d'une efficacité relative, et qui ne concernent que les sites pornographiques, pour protéger les enfants) ; les filtres des moteurs ne permettent pas d'éviter les sites révisionnistes ou sectaires
    - les remèdes "humains" : l'esprit critique, la culture générale, historique, politique, l'esprit citoyen ...
    sans aucun doute les meilleures armes contre cette pollution...

    - les outils juridiques, politiques : signaler un site révisionniste à l'outil de recherche qui l'a référencé, au serveur qui l'héberge, porter plainte contre des sites illégaux, signaler des sites pédophiles, etc.

- les remèdes "socio-techniques", militants : par exemple les " flames ", cad l’envoi massif de messages pour saturer un serveur, la dénonciation d'un site auprès de réseaux d'internautes, la censure sur les forums, etc.
 
A noter : l'intérêt des méthodologies d’évaluation de l’information, mais les limites de ces méthodes, car le problème vient ici du contenu politique, idéologique, religieux, historique… des informations trouvées.

 

4ème pollution : abus et effets pervers de la publicité, du marketing, du référencement payant

  • images :

- pollution par l’encombrement, l’enlaidissement des entrées de villes par les panneaux publicitaires.

  • phénomène :

invasion de l’information, surtout dans les portails, les annuaires, les sites commerciaux, par la publicité ; "spamming" ou "pourriel", "liens sponsorisés" dans la recherche d'information...
 

  • Quelques extraits d'articles :

Sur les ravages du spamming et la pollution informationnelle, nous reproduisons ci-dessous, avec l'autorisation des éditeurs (la FING et l'INIST), les deux articles suivants, extraits de :
Internet Actu nouvelle génération, n° 6, 16 novembre 2003, p. 8
Disponible sur : Internet Actu NG internetactu-ng@kiosqueist.com


Jakob Nielsen contre la pollution informationnelle

Connu comme le "gourou de l'usabilité" des sites web, Jakob Nielsen part en guerre contre la pollution informationnelle. "Si nous ne mettons pas en place des contre-mesures énergiques, l'ordinateur cessera d'être un outil de productivité et prendra le contrôle de notre temps".
L'info : http://news.bbc.co.uk/1/hi/technology/3171376.stm
Article de Jakob Nielsen : http://www.useit.com/alertbox/20030811.html
Le groupe de recherche anti-spam (Asrg) de l'Internet Research Task Force (Irtf) travaille à faire converger les nombreux projets qui visent à modifier les protocoles de base du courriel dans le but de faciliter l'identification de l'expéditeur, ou au moins de son adresse IP. L'objectif est de fournir une réponse technique au spam (ou "pourriel" en Français), fondée sur l'identification de l'émetteur et un système de "réputation", afin de limiter le recours à des réponses règlementaires.
L'info : http://news.com.com/2100-1038-5096820.html
Méthode de travail de l'Asrg et liste de réponses techniques possibles au spam : http://www.irtf.org/asrg/asrg_research_agenda.htm
Selon les sources, le spam représenterait entre 50 % et 70 % du nombre total de courriers électroniques échangés sur l'internet :
Ce serait 50 % selon Star Technology :  http://www.extremetech.com/article2/0,3973,952934,00.asp
Riches débats sur le "pourriel" sur le site de l'Isoc France : http://www2.isocfrance.org/vie_pratique/spam.


Le spam détourne les utilisateurs du courriel

Une étude du Pew Internet and American Life Project révèle que 25 % des internautes américains utilisent moins ou plus du tout le courriel à cause du "pourriel" (Spam). Près des trois quart des répondants considèrent que l'internet est une expérience moins agréable à cause de l'afflux de courriers électroniques non sollicités, même si le spam n'est un "gros problème" que pour 27 % des internautes. Un tiers des détenteurs d'adresses e-mail personnelles affirment que plus de 80 % des messages qu'ils reçoivent sont du spam. A l'inverse, 7 % d'entre eux ne reçoit aucun spam. 10 % des utilisateurs passent au moins une demi-heure par jour à traiter le spam.
Les utilisateurs sont nombreux à prendre des mesures pour tarir le flot de pourriel. 73 % d'entre eux évitent de donner leur adresse électronique, 69 % font attention à ne pas l'inscrire sur un site web. 37 % des utilisateurs à titre individuel utilisent un filtre anti-spam et 62 % des utilisateurs à titre professionnel affirment que leur entreprise dispose d'un tel outil. Mais plus du quart des utilisateurs pense que ces filtres retiennent également des courriels légitimes ou les empêchent d'écrire à certains de leurs correspondants - et les trois quarts des personnes interrogées pensent qu'il n'est pas possible d'arrêter le flot de spam.
Arrêter le spam sera d'ailleurs d'autant plus difficile que les internautes interrogés reconnaissent, pour un tiers d'entre eux, avoir cliqué sur un lien contenu dans un pourriel et pour 7 %, avoir déjà acheté un produit par ce biais.
L'info : http://www.transfert.net/a9484
L'étude : http://www.pewinternet.org/reports/toc.asp?Report=102


 
  • problèmes posés, effets :

- dans le courrier, le fléau du "spamming" (cf ci-dessus)
- la reconnaissance de l’information utile parmi les bandeaux publicitaires, sur certains portails...
- la suggestions d’achats ou de visites de sites, à partir d’une requête traitée par un "agent intelligent " qui analyse la requête et propose aussitôt des services personnalisés (cf lien entre Alta Vista et Amazon…)
- les incidences du référencement payant dans les annuaires et les moteurs de recherche sur les contenus d’information ;
- le détournement de la recherche d'information par le "sponsoring" ou le positionnement payant dans les résultats : par exemple la distinction, pas toujours facile, entre liens commerciaux et résultats
- les effets pervers de l’indice de notoriété (Google) ou de "l'indice de clic"...

  • remèdes :

Plutôt en amont, du côté des outils d’information :
- la maîtrise des outils de recherche
- l'identification de la publicité
- le choix d'outils publics, ou sans publicité

 

Cinquième risque de l'information : la logique (ou la tyrannie) du temps réel

Aux quatre pollutions informationnelles, relevées par Eric Sutter, s'ajoute, selon nous, le risque (et non la pollution) du temps réel sur l'information.

  • Caractéristique majeure de l'information numérique et de la nouvelle économie politique de l'information : le temps réel, la vitesse, l'instantanéité
  • Il s'agit ici d'un trait profond du numérique et non d'une "info-pollution", mais qui comporte des risques majeurs, brièvement évoqués ici :
    - la confusion entre l'événement, sa saisie et sa réception (sur ces questions complexes, voir Stiegler)
    - la pression de l'urgence, de la vitesse, du temps réel... sur les comportements et les usages informationnels
    - la logique du spectaculaire, du sensationnel... dans la transmission de l'information
    - la contradiction profonde avec la lenteur de l'intégration, de la "digestion" de l'information (contradiction entre information et connaissance, recherche d'information et apprentissage...)
    - "l'emballement" incontrôlé des réseaux et des machines informationnelles, aboutissant au "Tchernobyl de l'information" pointé par Paul Virilio : cf par ex. les phénomènes de krach boursier sur les réseaux  

A noter : la question du temps réel et de la vitesse dépasse de loin la seule question de l'évaluation de l'information ; mais la prise en compte de cette toile de fond du numérique est nécessaire, pour cerner les enjeux de l'évaluation.

  • En résumé, on peut relever plusieurs aspects de ces " pollutions informationnelles ", contre lesquels la meilleure garantie est le développement d’une véritable " culture informationnelle " (voir Baltz) : l’évaluation de l’information est un élément-clé de cette nouvelle culture informationnelle.

haut de page


Quels enjeux de l'évaluation de l'information pour les usagers ?

Ces risques et dangers de " l’info-pollution " provoquent ou peuvent provoquer de nombreux effets, plus ou moins graves, pour les usagers d’Internet, notamment pour les jeunes :

abdication de l’esprit critique, fuite, renoncement au travail de sélection, paresse intellectuelle devant la facilité de l'accessibilité générale…

risques de relativisme total, mettant tous les types d’informations et toutes les sources sur le même plan

dangers d’intoxication par les rumeurs…., et à l’inverse, méfiance systématique, paranoïaque, envers les informations diffusées, notamment officielles ou médiatiques

illusion de l'information, confondue avec la connaissance, la culture...

Les enjeux de l’évaluation de l’information sont ni plus ni moins des enjeux d’éducation, de formation intellectuelle, de développement de l’esprit critique et de la capacité de jugement des individus.

A la différence du problème des outils de recherche, sans cesse perfectionnés, la question de l’évaluation reste, in fine, une question purement cognitive, non automatisable, renvoyant à la dimension " humaine " de l’information. La formation des usagers (élèves, étudiants...) à l'évaluation de l'information ne peut reposer sur des savoir faire techniques, ni sur des recettes, des solutions "clés en mains", contrairement à certaines illusions naïves ou aux croyances excessives dans les capacités techniques.

Sur les approches "technicistes" de l'évaluation : la technique du "eye-tracking"
Une société informatique française utilise un dispositif technique (un oculomètre ou eye-tracking) permettant de suivre les mouvements oculaires des internautes lisant une page web :
"Grâce à cette expertise, nous pouvons juger objectivement la pertinence de l'organisation des pages et de l'information, valider ou non l'approche graphique retenue, vérifier que chaque zone de chaque page remplit l'objectif qui lui est fixé..." (d'après l'article de Pierre Barthélémy, "L'analyse des mouvements oculaires de l'internaute pourrait être utilisée pour jauger les sites web", in Le Monde, 16 mars 2002, p. 29).


Au-delà de la performance technique et de l'intérêt réel de ce dispositif pour décrypter les pratiques de lecture des documents numériques, jusqu'à quel point une technique suffit-elle à évaluer un site web (même s'il ne s'agit que de l'organisation et de la mise en forme de l'information) ?

haut de page


 

Quels enjeux pour les professionnels de l'information ?

Nouveauté du problème pour les professionnels :

Avec Internet se produit un renversement du modèle traditionnel de la recherche d’information : l'évaluation, la validation de l’information ne sont plus à la charge du professionnel mais de l’usager
  ⇒ d'où un "effacement" relatif des professionnels de l'information, comme de tous les médiateurs

Mais avec Internet, les professionnels de l’information voient leurs activités se développer selon deux axes, dans lesquels se pose la question de l'évaluation de l'information:  

  • la description, l'évaluation, la sélection, la validation des informations et des ressources
  • l'accompagnement, la formation des usagers à la recherche et à la sélection des informations.

haut de page


Evaluation de l'information, "démarche-qualité"... :

la montée en force d'une problématique

L'évaluation de l'information sur Internet a suscité depuis des années une abondante production sur le Net (cf la partie Ressources) et mobilise des acteurs de plus en plus diversifiés. Compte-tenu de l'importance et de la nature des enjeux liés à l'évaluation (qui sont brièvement évoqués ci-dessus), ces dernières années ont vu la montée en force de cette problématique.
Il ne s'agit pas de décrire ici ce nouveau "domaine" de l'internet, tant sa richesse, sa diversité, son approfondissement deviennent importants et défient l'observateur. On peut simplement remarquer que, à l'instar de la recherche de l'information et des évolutions des outils, ou encore de la question de l'indexation et du traitement des ressources du web (deux domaines d'études, d'expérimentations, de problématiques... désormais autonomes et bien constitués), l'évaluation de l'information est en passe de devenir également un nouveau champ, un ensemble d'acteurs et "d'actants", de sites, de ressources, de thématiques... en voie de s'autonomiser progressivement.

On peut citer au moins trois signes qui témoignent de cette montée en force de l'évaluation :

- la formalisation de plus en plus poussée des critères de qualité de l'information, variables selon les domaines et les objectifs des acteurs concernés (les critères ne seront pas les mêmes en santé, dans le domaine culturel, ou pour les sites commerciaux) : de nombreuses grilles d'évaluation existent aujourd'hui, parfois élaborées collectivement, comme le Net Scoring en Santé (cf ci-dessous)

- l'apparition d'entreprises, de sites, voire d'outils, spécialisés autour de l'évaluation, de la qualité des sites web, etc. : cf par exemple le site Temesis

- l'adoption des démarches-qualité sur l'évaluation des sites web dans les institutions ; cf ci-dessous l'exemple du Cadre Qualité de Bruxelles

Le Net Scoring de Centrale Santé : "Critères de qualité de l'information de santé sur l'Internet" :
- l'un des premiers travaux d'importance menés sur l'évaluation de l'information, dans le domaine médical, dès 1997.
- enjeux particuliers de l'évaluation de l'information de santé : prolifération des sites médicaux et de santé, grande hétérogénéité des ressources, dangerosité des informations non fiables, question cruciale de la crédibilité des sources et des informations dans le domaine médical...
- grille d'évaluation, d'une cinquantaine de critères, réalisée à l'origine au CHU de Rouen, à partir d'un travail mené aux Etats-Unis et au Québec. Le Net Scoring est élaboré par un groupe de travail de professionnels de la Santé, au sein de Centrale Santé.
- Depuis 1997, trois versions du Net Scoring ont été réalisées. Actuellement, il existe une version pour les professionnels et une version grand public.
- le Net Scoring est adopté par plusieurs institutions et organisations du domaine de la Santé.

  • Résumé du document présentant Net Scoring :
    "L'objectif est de ce travail est de fournir un ensemble de critères qui peuvent être utilisées pour évaluer la qualité de l'information de santé sur l'Internet. Pour assurer une objectivité maximale dans le choix de ces critères, nous avons mis en place au sein de Centrale Santé un groupe pluriel comportant des médecins, des ingénieurs, des bibliothécaires, et des juristes ; certains représentaient des organisations professionnelles. Ces critères peuvent être utilisés de deux façons : (a) par les cyber-citoyens pour améliorer leur esprit critique ; (b) par les maîtres-toile des sites de santé francophones pour en augmenter la qualité. Nous avons défini 49 critères, que nous avons réparti en huit catégories : crédibilité, contenu, hyper-liens, design, interactivité, aspects quantitatifs, déontologie, et accessibilité. Chaque critère est pondéré en critère essentiel (noté de 0 à 9), critère important (noté de 0 à 6) ou critère mineur (noté de 0 à 3). Le total de ces critères donne le score global du site (avec un maximum de 312 points)" (disponible sur http://www.chu-rouen.fr/netscoring/)

haut de page


Le Cadre de Qualité de Bruxelles :
- ensemble de critères de qualité, applicables aux sites culturels, définis par un Groupe de travail européen
- Origine : réflexions au sein de la Commission européenne, et résolution européenne du Conseil des Ministres de la Culture, adoptée en novembre 2001
- Objectif : l'encouragement de "démarches-qualité" dans les sites web culturels, l'élaboration d'un cadre commun de réflexion
- Document de travail et de réflexion, contenant une liste de "principes de la qualité" et une grille d'évaluation relativement simple, contenant 6 catégories de critères et une quinzaine de critères.

Résumé du Cadre de Qualité :
"Un premier outil européen qui constitue les premiers fondements d'une approche coordonnée européenne des critères de qualité pour des sites web culturels. Ce cadre propose un premier tableau de bord déclinant la notion de qualité en termes de critères objectifs et mesurables". (disponible sur : http://www.cfwb.be/qualite-bruxelles/pg001.asp)


 Références bibliographiques :

- BALTZ, Claude. Une culture pour la société de l'information ? Documentaliste - Sciences de l'information, vol. 35, n°2, 1998, p. 75-82

- LE COADIC, Yves-François. Le Besoin d'information. Formulation, négociation, diagnostic. Paris : ADBS Editions, 1998. (Science de l'information

- STIEGLER, Bernard. La Technique et le temps.2. La désorientation. Paris : Galilée, 1996. Chap. 3 L'industrialisation de la mémoire, p. 117-216

- SUTTER, Eric. Pour une écologie de l'information. Documentaliste - Sciences de l'information, vol. 35, n°2, 1998, p. 83-86

 


 

Critères, démarche et méthodologie de l'évaluation de l'information

 Proposition d’une démarche de questionnement

On relève la présence sur Internet, depuis plusieurs années, de méthodes de plus en plus nombreuses pour l’évaluation des sites web : voir liste de signets ;

La démarche proposée ici s’inspire de plusieurs approches de l'évaluation et se fonde sur les trois principes méthodologiques suivants :

  • distinguer les étapes de l’identification et de l’évaluation
  • distinguer les trois composants, les trois " couches " de tout document :
    • le document lui-même : type, genre, responsabilité, notoriété, etc
    • la mise en forme (au sens large) du document : organisation de l’information, structuration du site, graphisme, accessibilité… Des distinctions secondaires seront nécessaires.
    • l’information elle-même : cad le contenu informationnel
  • distinguer les critères communs à tout type de ressources des critères propres à chaque type de document 

 

Evaluer

Evaluation d’une source, d’un auteur

Evaluation du contenu

Evaluation de la structuration

Evaluation de la mise en forme

Evaluation de l'accessibilité


 

Après la première étape de l'identification et sur la base des données recueillies peut se faire l'évaluation du document ou/et de l'information. Au moins quatre grandes parties peuvent être distinguées :

- l'évaluation de la source, ou de l'auteur
- l'évaluation de l'information proprement dite, du contenu
- l'évaluation de la structuration, de l'organisation du site ou du document, de la navigation
- l'évaluation de la mise en forme, de la lisibilité, de l'accessibilité.

Selon les objectifs définis, il s'agit de mettre l'accent sur tel ou tel élément.
Le questionnement et la "grille" d'évaluation proposés ici ne se veulent ni exhaustifs, ni valables pour toutes les situations ; il s'agit plutôt de définir les principaux critères, communs à toutes les ressources.

Qui dit évaluation dit note, jugement, éventuellement selon un barème. Plusieurs notations sont possibles.

Voir les exemples de grille d'évaluation :


Evaluation d'une source d'un auteur

 

Critères dévaluation

Faible

Moyen

Bien

Très bien

Clarté, facilité d'identification de l'organisation, de l'auteur, accessibilité
    
Sérieux, fiabilité de l'organisation, de l'auteur
    
Degré de compétence dans le domaine
    
Notoriété
    
Adéquation du site avec les objectifs visés
    

haut de page


Evaluation du contenu

 

Critères dévaluation

Faible

Moyen

Bien

Très bien

Degré de fiabilité de l'information
    
Niveau de précision, d'exhaustivité, d'exactitude
    
Degré de nouveauté, d'originalité
    
"Fraicheur" de l'information, actualisation
    
Clarté d'indication et accessibilité des sources 
    
Pertinence, richesse des liens externes
    
Qualité de la langue (expression écrite, traduction)
    
Clarté de présentation de l'information
    
Utilité, pertinence des illustrations (schémas, images...)
    

haut de page


Evaluation de la structuration

 

Critères dévaluation

Faible

Moyen

Bien

Très bien

Logique de l'organisation
    
Clarté de la représentation de l'ensemble du site
    
Facilité d'orientation (sommaire, plan du site...)
    
Facilité de navigation (aller-retour, retour page d'accueil, ascenseur...)
    
Facilité de lecture des pages intérieures (sommaires internes, boutons de retour...)
    
Outil de recherche dans le site
    
Autres dispositifs d'aide (foire aux questions, archives, page d'aide...)
    

haut de page


Evaluation de la mise en forme

Critères dévaluation

Faible

Moyen

Bien

Très bien

Design du site, choix des couleurs
    
Homogénéité de la mise en forme
    
Lisibilité du texte
    
Qualité des illustrations
    

 haut de page


 Evaluation de l'accessibilité

TP du détective de l'internet : Les technologies appropriées

 

Critères dévaluation

Faible

Moyen

Bien

Très bien

Rapidité de chargement du site et des pages
    
Choix des formats graphiques (chargement, compression des images...) 
    
Accessibilité du site (référencement dans les outils de recherche...)
    

haut de page

Exemples, TP

Recherche de critères d'évaluation de sites web

 S'orienter sur un site web

 L'identification

 L'évaluation

 


Recherche de critères d'évaluation de sites web

- rechercher les critères (au moins une douzaine) permettant d'évaluer un site web
- les regrouper par catégorie selon leur objet (au moins quatre catégories)
- hiérarchiser ces catégories selon l'importance que vous leur accordez
- tester rapidement ces critères sur un ou deux sites choisis

haut de page 


S'orienter sur un site web

Savoir décoder et s'orienter sur une page d'accueil :

haut de page


 L'identification

  • Observation d'un "site-modèle", particulièrement bien fait : Le site web de Didier Pol
    • un exemple à suivre en matière de politique claire d'identification de site web par son auteur (sans parler ici de la qualité du contenu proprement dit de ce site très riche) : identification précise de l'auteur, de l'objet, du public, du contenu...

Identification de sites web :

  • Identification du nom de l'organisation :
  • Décodage des URL
    • Question : peut-on "évaluer" vraiment un site d'après son URL ?
  • Identification de la nature d'un site :
    • Faire une recherche sur Google, sur le web francophone, avec l'expression suivante :

Identification des auteurs :

  • Identification du nom de l'auteur :

    • L'identification de l'auteur d'un site est souvent essentielle, pour pouvoir identifier clairement la nature du site, et évaluer la fiabilité de l'information. Cette opération n'est pas toujours aisée.
      Voici quelques astuces techniques pour identifier un auteur (largement inspirées de l'article de Jean-François Vincent) :

      • A/ Bien explorer le site : pied de page de la page d'accueil, pages dédiées ("A propos", "Copyright"...), adresse électronique...

      • B/ Vérifier l'adresse d'un lien pointant vers une adresse e-mail, en passant le curseur de la souris sur le lien (certains liens pointent en fait vers des pages HTML) :
        Exemple donné par J.F. Vincent : le site www-2.cs.cmu.edu/~mwm/sci.html  
      • C/ Remonter ou descendre l'arborescence pour trouver d'autres informations sur l'auteur :
        • Exemple : en descendant l'arborescence du site, trouver l'adresse de l'auteur du site Ecologie et Progrès
      • D/ Consulter les métadonnées, qui contiennent des éléments de description du document, notamment parfois la mention de responsabilité, le nom de l'auteur, voire son adresse électronique.
        Pour afficher les métadonnées : menu "Afficher la source" (par le bouton droit de la souris)
        Exemple :
      • E/ Retrouver le responsable de la mise en ligne du site, propriétaire d'un nom de domaine : 
         
      • Utiliser les base de données Whois, contenant les informations sur les noms de domaine.
        - Pour la France (les sites en .fr), voir le site de l'AFNIC : http://www.afnic.fr/outils/whois
        - Pour les autres noms de domaines (.com, .net, .org), voir : www.uwhois.com, DomainTools
         
      • Utiliser l'outil ShowIP (extension de Firefox) :
        - télécharger le plug-in ShowIP
        - une fois sur le site à identifier, observer l'adresse IP : en bas à droite, dans la barre d'état
        - cliquer sur l'adresse IP et choisir whois.sc
        - repérer le nom et l'adresse du propriétaire du nom de domaine
         
      • Exercices :
        avec ShowIP, chercher les propriétaires des sites :
        - Histoire de l'Internet, des réseaux et du web
        -La Commission des Citoyens pour les Droits de l'Homme

        Attention : un nom dans une base Whois ne correspond pas forcément au nom de l'auteur, ni du webmestre ; et les données des bases Whois ne sont pas forcément actualisées

        F/ Utiliser les outils de recherche généralistes et spécialisés :

        - Après avoir trouvé le nom de l'auteur ou du propriétaire du site, faire une recherche sur les moteurs généralistes (Google...) ou les moteurs de personnes (123 People), pour trouver des informations sur cette personne.
        - Exercice : rechercher d'autres informations sur les propriétaires des deux précédents sites : documents, blogs, autres sites...

    

  • Identification du statut de l'auteur :
  •   Identification de la notoriété de l'auteur :
    • Quelle est la notoriété de l'auteur de ce site :
    • Requête de type : +link, ou bien taper le nom de l'auteur sur Google...

Identification des documents

haut de page


L'évaluation

 

Sur la qualité des sites web :  

Evaluation d'une source, d'un auteur

Evaluation du contenu

Evaluation de l'organisation  


Evaluation des aspects techniques

 
Evaluer les sites suivants à partir de la grille proposée :

Utiliser le document Word "TP D'EVALUATION COMPAREE DE SITES WEB

haut de page

Grille d'identification et d'évaluation

Le fichier attaché à cette page contient les grille d'identification et d'évaluation.

Identifier

Identification de l'organisation, du site

Identification de l'auteur

Identification de la nature du document et de l'information

 


 

"Mal nommer les choses, c'est ajouter au malheur du monde" (Albert Camus)

Préalable indispensable à toute évaluation, l'identification des documents électroniques est néanmoins une opération distincte de l’évaluation proprement dite, puisqu’il ne s’agit pas ici de juger, de comparer ou d’évaluer un document ou une information, mais de commencer par l’identifier soigneusement.
Opération (relativement) facile dans le monde de l'imprimé, la reconnaissance, l'identification, le repérage du type de document sont beaucoup plus complexes dans l'univers numérique, qui brouille les frontières, uniformise les genres et formes documentaires habituels, et place toutes les sources et tous les auteurs sur le même plan.

L'identification doit porter sur trois parties au moins du document, toujours étroitement liées :
- l'organisation, le site producteur ou hébergeur : autrement dit la responsabilité éditoriale
- l'auteur proprement dit du document (auteur physique ou moral)
- la nature du document

Il ne s'agit pas de présenter ici les méthodes et les travaux des professionnels de l'information, confrontés à la description des documents électroniques.
 

Condition de toute identification : l'orientation dans le site

TP (du Détective de l'Internet) : Sachez vous orienter  

 


Identification de l'organisation, du site

Première étape, essentielle et commune à tous les sites et toutes les informations : identifier clairement le site producteur ou hébergeur de l’information trouvée, ou l’organisation responsable, c'est-à-dire essayer de déterminer la nature, l'objet, le statut, la nationalité, les objectifs, le domaine... du site.
 

Différentes questions à (se) poser (liste non limitative) :

en italiques et précédé d'une flèche, les éléments d'identification pouvant faire l'objet d'une évaluation.

Eléments d'identification

Exemples de questions

Réponses possibles

Quel est le nom de l'organisation ?
Retrouver le nom précis de l'organisation responsable.
Elément d'évaluation: le nom de l'organisation ou du responsable est facilement identifiable?
- le hostname : nom du sous-domaine
TP Détective de l'internet : trouvez les indices à partir des URL
- la page d'accueil : rubrique présentation, Auteurs, A propos ...
 Quelle est la nationalité du site?
 Identifier clairement l'origine géographique, la nationalité, la langue du site (ou de l'hébergeur)...
 - le hostname : nom de domaine national (.fr, .be, .ca, etc.)
Site sur les noms de domaines nationaux
- la page d'accueil
- le site lui-même
 Quelle est la nature du site?
 S'agit-il d'un site universitaire, éducatif, institutionnel, commercial, d'entreprise, associatif, politique, personnel ...
 - le hostname : nom de domaine international (.com, .edu, .org, etc.)
-la page d'accueil
- le site lui-même
 Quel est son statut?
 S'agit-il d'un site :
  • public, officiel? ⇒ de quelle instance?
  • privé? ⇒ de quelle nature?
  • personnel?
  • principal ou "sous-site" hébergé?
  • gratuit ou payant?
  • ...
 - la page d'accueil
- le site lui-même
 Quel est son objet?

 

L’identification doit chercher à définir, cerner au mieux l’objet même du site, ses fonctions premières, ses objectifs…
Difficultés : 
- un site vise souvent plusieurs fonctions et objectifs à la fois
- difficultés parfois à cerner l'objet d'un site 
- distinguer les objectifs explicites et implicites
S'agit-il d'un site :
  • de production-diffusion d'informations : une institution, une association, une bibliothèque...?
  • de publication de la recherche : un laboratoire, un site universitaire?
  • de diffusion d'informations produites en interne, ou en externe?
  • d'expression personnelle ou collective : artistique, littéraire, personnelle...?
  • de militantisme, de défense d'une cause?
  • de services (communication, vie pratique...)?
  • de vente, de commerce?
  • d'échange (de service, d'information...)?
  • de propagande, de prosélytisme?
  • de divertissement?
  • ...
Elément d'évaluation: le contenu du site correspond-il vraiment à ses objectifs déclarés?
 - dans la page d'accueil :la présentation du site
- le site lui-même
 Quel est le public visé?
S'agit-il d'un site :
  • tous publics?
  • visant un public spécifique (professionnel, universitaire, communautaire, spécialisé...)?
  • le public visé est-il clairement annoncé sur la page d'accueil?
Elément d'évaluation: le contenu du site correspond-il vraiment au public visé?
 - la page d'accueil
- le site lui-même
 Quelle est la date de création du site?
 Identifier les différentes dates du site :
  • Date de création
  • Date de la dernière mise à jour
Elément d'évaluation:
  • le site est-il mis à jour régulièrement?
  • les dates sont elles clairement indiquées?
 - la page d'accueil
 Quelle est la notoriété du site ou de l'organisation?
Attention : notoriété, ou popularité n'égalent pas forcément crédibilité et sérieux...
La mesure de la popularité doit prendre autant en compte "l'audience" du site (qui relève de l'identification) que la nature de cette audience (qui relève plutôt de l'évaluation) ; par qui le site est référencé compte plus que les citations elles-mêmes.
Observer, mesurer la popularité, la notoriété du site, sur le web et hors du web ; deux éléments (au moins) :
  • la consultation directe du site : 
    • nombre de visiteurs ?
    • forum de discussion sur le site ? 
    • livre d'or ? 
  • les liens vers le site, i.e. la reconnaissance du site par les autres : 
    • nombre de liens
nature des sites qui "pointent" vers le site observé : Signets de la BNF, CNRS...
Elément d'évaluation: combien d'autres sites "pointent" vers le site évalué? Et lesquels?

 - le site lui-même : compteur, livre d'or, forum
- sur les moteurs de recherche, recherche sur le champ link ou anchor
Exemple sur Alta Vista : +link:adbs -host:adbs
- recherches sur les sites de référence
-recherches hors Internet

 

 haut de page


Identification de l'auteur 

L'identification de l'auteur est essentielle pour toute évaluation portant sur un document précis, sur un site web personnel, sur une sous-partie de site web...
Dans cette première étape, il ne s'agit pas d'évaluer un auteur (tâche particulièrement difficile et délicate), mais de recueillir sur lui un certain nombre d'informations. Les questions ci-dessous peuvent être communes à plusieurs types d'auteurs ; mais les documents scientifiques (articles, ouvrages...) exigeront un questionnement plus poussé et plus spécifique (cf SAPRISTI).

en italiques et précédé d'une flèche, les éléments d'identification pouvant faire l'objet d'une évaluation.

 

Qui est l'auteur du document?
Est-il joignable ? (coordonnées, e-mail, adresse) 
Elément d'évaluation : 
- quelle est la facilité d'identification de l'auteur ?
-> un site anonyme peut être considéré comme suspect
- la page d'accueil du site
- la page de titre du document
- la fin du document
- en dernier recours, les métadonnées : 
Voir sur Netscape : Affichage, Source de la page.
- repérer la balise "Meta name=author" 
Quel est son statut, son domaine de
compétences ?

 

Remarque : en dépit des difficultés, l'identification doit chercher à apprécier le niveau, le degré d'expertise d'un auteur sur le sujet traité : débutant ? bon connaisseur ? spécialiste ? expert ?
- quel est son statut ? (élève, étudiant, enseignant, doctorant, chercheur, ingénieur, spécialiste...)
- quel est son domaine de connaissance ou de recherche ? 
- la page d'accueil du site : présentation de l'auteur
- la page de titre du document
- le document lui-même
- l'auteur lui-même : possibilité de le contacter ? 
- recherche hors Internet 

 

Quelle est sa notoriété?
- L'auteur est-il connu ou reconnu dans son domaine ? 
- S'il n'est pas connu, l'auteur est-il cité par d'autres ? 
- si oui, par qui ? (auteurs reconnus? non reconnus ?  )
- recherche sur le champ " anchor " ou " link "
- recherche hors Internet
Quel est son réseau de référence?
- A quels auteurs fait-il référence ?
- Qui (ou quoi) le document cite-t-il? 
- Quelle est la bibliographie ? 
- De quelles théories, approches, idées, modèles... l'auteur se réclame-t-il ? 
- les liens extérieurs du document
- les auteurs cités dans le texte
- la bibliographie, les sources citées
- le texte lui-même 
Quel est le point de vue de l'auteur? (ou plutôt "d'où" parle-t-il?)
- L'auteur s'exprime-t-il sur son site personnel ou bien sur celui d'une organisation ? 
- S'exprime-t-il en son nom propre ou au nom de l'organisation qui l'héberge ?
- Quels sont les liens entre l'auteur et le site hébergeur ?  
- l'URL ou le hostname :
présence, dans l'URL des sites personnels, de ~nom 
- la page d'accueil du site : présentation de l'auteur

 

Quelles semblent être ses motivation?

 

A noter :
Plusieurs difficultés pour identifier clairement les objectifs de l'auteur : 
- caractère subjectif de l'appréciation
- plusieurs motivations entremêlées
...
Questionnement plus important que la réponse... 
- expression personnelle ?
- souci d'informer ?
- volonté de partage (de travaux, de recherches, d'informations, d'une passion…) ?
- auto-promotion ?
- vente ?
- propagande, prosélytisme politique, religieux, social... ?
- autre… ?
- la page d'accueil du site : présentation de l'auteur, du document
- le site ou le texte lui-même 

 

haut de page


Identification de la nature du document et de l'information

Quelle est l'étendue du document?
- un site entier ? 
- une partie d'un site ? 
- une page web ?
- une unité documentaire autonome (par ex. un extrait de monographie, un article…) ?
- ...
- le site ou le document lui-même
Quel est le type de "support documentaire"?
- un ouvrage ?
- une publication en série ?
- une thèse ?
- une base de données ?
- un site web ? 
- une liste de diffusion ?
- un forum ?
- un message électronique ?
- ...
- le site ou le document lui-même
Quelles sont les dates du document?
- quelle est la date de création du document ? 
- ses dates de mise à jour
Elément d'évaluation : 
- indication claire des dates de création et de mise à jour 
- fréquence des mises à jour, selon la nature des informations diffusées 
- la page d'accueil
- le document lui-même : souvent à la fin 
Quelle est la nature du document?
S'agit-il d'un document : 
- scientifique ? 
- de vulgarisation ? 
- d'expression ?
- artistique ? 
- ...
- le document lui-même 
Quel est le domaine de l'information?
- Quel est le domaine de connaissance, ou la discipline ?
- le document lui-même 

 

haut de page


 

Outils pour l'identification et l'évaluation de l'information

Quelques outils utiles pour l'identification d'auteurs, de sites web, ou pour aider à l'évaluation d'un site :

1/ Pour affiner les résultats sur les moteurs de recherche :

  • Search Cloudlet :
    - extension Firefox, disponible sur : https://addons.mozilla.org/fr/firefox/addon/9943 ou sur http://www.getcloudlet.com/
    - fonctionne sur les résultats de Google, Yahoo et les messages de Twitter ;
    - création de nuages de tagsà partir du lot de résultats ;
    - permet de créer un nuage de tags et d'affiner sur :
    • les mots-clés : Tags
    • les sites : Sites
    • les noms de domaine : Net

      > Utilisation pour l'identification et l'évaluation de l'information :
      - filtrage sur le thème par le nuage de tags sur les mots-clés
      - repérage des sites les plus importants sur le sujet : par filtrage sur Sites
      - repérage des acteurs par filtrage sur les noms de domaine : Net

2/ Pour identifier un site, une page web :

  • Sur le navigateur : exemple de Firefox :
    • Dans Affichage : Code source de la page
      - affiche le code source HTML de la page consultée ;
      - permet de repérer éventuellement les balises de métadonnées, notamment la balise Author
    • Dans Outils : Informations sur la page
      - donne des indications techniques sur la page consultée
       
  • ShowIP :
    - Auteur : Jan Dittmer.
    - Extension de Firefox ; disponible sur : https://addons.mozilla.org/fr/firefox/addon/590
    - une fois téléchargé, se place sur la barre d'état du navigateur, en bas à droite ;
    - affiche l'adresse IP (indiquée en rouge) des sites Web visités ;  
    - en cliquant sur l'adresse IP, ShowIP donne accès à plusieurs bases : Whois.sc, Netcraft...
    - cliquer notamment sur Whois.sc
    - utile pour vérifier si des sites Web sont hébergés sur la même adresse IP.
    - Voir fiche technique sur : http://www.01net.com/telecharger/windows/Internet/plugins/fiches/47696.html.

    > très utile pour identifier le nom et l'adresse du propriétaire du nom de domaine d'un site.
    Attention : ShowIP ne permet d'identifier que les noms de domaine ; il ne permet pas d'identifier l'auteur d'un site hébergé (par ex. un blog hébergé sur une plate -forme de blogs)
     
     
  • WoT (Web of Trust) :
    - Helsinki : Against Intuition, 2006.
    - extension de Firefox, disponible sur https://addons.mozilla.org/fr/firefox/addon/3456 ; fonctionne aussi avec Internet Explorer ;
    - voir le site de WoT : http://www.mywot.com/fr
    - outil de sécurisation de la navigation, qui "protège des fraudes en ligne, de l'usurpation d'identité, des logiciels espions, du courrier indésirable, des virus et des sites de vente en ligne non fiables". WoT repose sur une communauté de plusieurs millions de membres ; l'application est "couplée à des données issues de sources fiables" - la communauté a déjà permis l'évaluation de plus de 24 millions de sites Web.
    - "Des sites de téléchargement populaires aux sites de vente en ligne en passant par les blogs personnels, les utilisateurs WOT basent leurs évaluations sur les quatre critères suivants : Crédibilité, Fiabilité commerciale, Confidentialité, Sécurité des mineurs"
    - Voir articles sur Commentçamarche et Vedocci

    > permet de repérer ou de signaler des sites frauduleux, dangereux, sectaires, etc.

 3/ Pour mieux identifier une personne, un auteur :

  • Les moteurs de recherche de personnes :
  •  Who is this person ? : 
    - extension Firefox, disponible sur https://addons.mozilla.org/fr/firefox/addon/1912
    - une fois installé sur Firefox, permet de lancer une recherche sur un nom de personne trouvé sur une page web, en interrogeant plusieurs outils ; 
    - Fonctionnement : mettre en surbrillance le nom de la personne sur la page web ; cliquer sur le bouton droit de la souris, choisir Who is this person ?, sélectionner l'outil de recherche ;
    - l'extension permet d'interroger successivement :
    • plusieurs moteurs de recherche de personnes: Wink Searches, ZoomInfo, Spock, ZabaSearch...
    • des réseaux sociaux : Linkedin, Facebook...
    • Wikipedia
    • des moteurs généralistes : Google, Yahoo..
       

 4/ Pour en savoir plus sur le référencement d'un site web :

  • SeoQuake :
    - extension Firefox, disponible sur https://addons.mozilla.org/fr/firefox/addon/3036
    - SeoQuake permet d'indiquer pour un site (d'après Veille Technologique IT) :
    • le PageRank de Google
    •  le nombre de pages indexées par Google pour le site visité
    •  le nombre de liens externes pointant sur la page visitée selon Google
    •  la date (de fraicheur) du cache de Google pour la page visitée
    •  le nombre de pages indexées par Yahoo pour le site visité
    •  le nombre de liens externes pointant sur la page visitée selon Yahoo
    •  le nombre de liens externes pointant sur le domaine visité selon Yahoo
    •  le nombre de pages indéxées par MSN
    •  le Rank Alexa (estimation du traffic)
    •  la date estimée de la 1ère publication du site (selon archive.org)
    •  le nombre de liens de Del.icio.us (bookmark)
    •  le nombre de liens de Technorati  (bookmark)
    •  l’adresse IP du serveur hébergeant le site
    •  les données Whois permettant de déterminer le propriétaire du domaine
    •  l’existence d’un fichier robot.txt pour le site
    •  la densité des mots clés de la page
    •  le nombre de liens internes et externes
    •  etc….

      > un outil complet pour évaluer la "notoriété" d'un site, d'après les techniques du référencement.

       

 

Questions, aspects théoriques, problèmes

Un quadruple questionnement nécéssaire

Bref retour sur les différents "brouillages" du numérique

Quel modèle implicite de l'information ?

Le problème de la qualité et de la pertinence (relevance) de l'information

Questions et précautions méthodologiques sur l'évaluation

 

Un quadruple questionnement nécEssaire

Toute la problématique de l'évaluation de la qualité de l'information ou de l'information de qualité sur Internet repose sur un certain nombre de présupposés, de conceptions implicites rarement discutées et qui semblent aller de soi. La plupart des grilles d'évaluation de l'information font généralement l'impasse sur des questionnements théoriques, pourtant indispensables.
Pourtant, chacun des quatre termes de la problématique mérite un rapide questionnement préalable, pour éviter aussi bien certaines confusions dans l'objet même de l'évaluation qu'un certain nombre d'illusions ou "d'aveuglements épistémiques".
 

Evaluer la qualité de l'information sur Internet : quatre questions, quatre aspects théoriques.

  • sur Internet :

Les caractéristiques du document numérique et le "brouillage" des composants du document doivent absolument être pris en compte, dans toute démarche d'évaluation. Il faut même commencer par là, car la plupart des difficultés et des problèmes de l'évaluation sur Internet proviennent des conséquences de la numérisation sur l'économie et la structure du document.

  • l’information :

Evaluer l'information, mais qu'entend-on précisément par information ? de quelle conception de l’information est-il question ? quels présupposés sont mis en œuvre, de quelles illusions " l’évaluation de l’information " peut-elle être porteuse ?

  • la qualité :

qu’appelle-t-on une information de "qualité " ? puisque l’évaluation de l’information vise à identifier et reconnaître une "bonne " information d’une "mauvaise ", à trier le bon grain de l’ivraie, encore faut-il caractériser rapidement les attributs d’une bonne information, ou d’une information de qualité. Et quelle différence entre qualité et pertinence de l'information ?

  • évaluer :

Evaluer, mais selon quelle conception de l’évaluation ? quels pièges, quelles précautions méthodologiques sont liés à l’évaluation ?
 
  ⇒ Il est essentiel, à nos yeux, de réfléchir au préalable sur ces différentes dimensions de l'évaluation de l'information, d'approfondir les aspects théoriques et la complexité de l'évaluation, trop souvent réduite à l'application simpliste de "recettes", à l'utilisation de grilles passe-partout. Encore une fois, savoir évaluer l'information n'est pas une compétence d'ordre technique, ni une somme de savoir faire.

 haut de page

 


Bref retour sur les différents "brouillages" du numérique

L’évaluation de l’information a toujours posé des questions difficiles : comment évaluer "objectivement" la qualité d'un document, d'un auteur, etc. Mais au moins les différents éléments à évaluer étaient-ils assez clairement distincts et identifiables, dans le monde traditionnel de l'imprimé.
La grande difficulté, avec le numérique, provient du "brouillage des cartes" ou des frontières du document, induit par la numérisation.
Evaluer une ressource électronique ou une information disponible sur Internet implique donc une réflexion préalable sur les différents éléments qui composent cette ressource, ou cette information. D'une certaine manière, le numérique (et c'est l'une de ses conséquences les plus intéressantes) oblige à "revenir aux fondamentaux", c.a.d. à la définition, aux composants, aux strates du document.

Ces questions débordent le seul cadre de l'évaluation et renvoient aux mutations engendrées par le numérique, qui redistribue l’économie, la structure, les usages... du document et de l’information.
Schématiquement, quatre types de "brouillages" sont induits par le numérique et Internet :

  • A/ Le brouillage des "strates" du document :
    De quoi est composé un document, dont on rappellera la définition de l'ISO (Organisation Internationale de Normalisation) : " Ensemble formé par un support et une information, généralement enregistrée de façon permanente, et tel qu'il puisse être lu par l'homme ou la machine" ? ou plutôt de quoi était composé un document imprimé ?
    Des éléments suivants (sans exhaustivité) :
    - un support matériel (le papier)
    - une technique d’impression (l’imprimerie à caractères mobiles)
    - un code linguistique (la langue)
    - des techniques de mise en forme du texte (la typographie, "l'ordre de la page", les chapitres, etc)
    - des contenus, généralement textuels
    - des codes (culturels, cognitifs…) de lecture, longuement élaborés et intégrés par le lecteur
    - une séparation nette entre le livre et son signalement bibliographique…

La distinction des métiers reposait alors sur une séparation nette, non seulement des étapes de la production d’un livre, mais des différentes " strates ", des différents niveaux qui composent l’objet-livre ou le document imprimé : par exemple, la mise en forme du livre est clairement distincte du signalement bibliographique, ou de l'impression.
Aujourd'hui le numérique redéfinit la chaîne technique du document ou du livre.

Brouillage général de ces différentes catégories par le numérique :
nouveau code unique et universel, servant à la fois à l’écriture, à la mise en forme du texte, à la " lecture " (le document numérique est d’abord " lu ", c.a.d. décodé par la machine), à la recherche documentaire, au signalement du document (désormais intégré dans le document lui-même)
(sur ces questions, voir Jeanneret)

    • Quelques conséquences :
      - la confusion entre le document et l'information :
      la différence entre le document, en tant que support, et l'information, en tant que contenu, est moins évidente avec le document électronique.
      D'où l'absence de distinction, fréquente dans les grilles d'évaluation, entre l'organisation, la mise en forme, le graphisme, la navigation, le contenu... du document.

 

  • B/ Le mélange des compétences :
    pour le livre imprimé classique, distinction traditionnelle, bien établie, entre l’auteur qui l’écrit, l’éditeur qui le publie, le typographe qui met en forme le texte, l’imprimeur qui l’imprime, le libraire qui le vend…
    Sur Internet : imbrication de ces différents métiers et compétences.
    • Conséquence : 
      - difficulté à distinguer entre l'auteur et l'éditeur, entre le responsable du contenu et le webmaster...;
      - difficulté d'identification des acteurs...

         
  • C/ Le mélange des genres documentaires :
    Dans le monde de l'imprimé, repérage et identification assez facile des différents supports, des différents "genres" documentaires.
    Sur Internet, mélange généralisé de tous les genres et supports documentaires, sous l'effet de la numérisation généralisée, mais aussi à cause de la faible normalisation documentaire sur Internet.
    • Quelques conséquences : 
      - difficulté à identifier clairement un support ou un type de ressources (monographie, périodique...) ; par exemple, quel est le "genre documentaire" d'un site web ?
      - problème également des limites du document numérique :
      un document web repose de plus en plus sur la fragmentation de noeuds d'information, la (re)combinaison de différentes parties de documents (cf la syndication de contenus) ; les différences entre pages web, fichier, document, site web ne sont pas toujours claires.
       
  • D/ Le brouillage des sources :
    Dans le monde de l'imprimé, les procédures de légitimation éditoriale, les processus de validation a priori, les circuits de production (littéraire, scientifique...)... sont bien établis, connus et reconnus.
    Rappelons l'une des particularités majeures d'Internet : la possibilité offerte à chacun de publier directement, sans intermédiaire, en dehors des circuits éditoriaux habituels.
    D'où le brouillage général des sources et des statuts des documents : qui a publié cette page web ? par qui est-elle légitimée ? quel est le statut de ce document (scientifique, public, privé, etc.) ?
    • Quelques conséquences :
      - la difficulté (parfois très grande) à identifier la source, l'organisation éditoriale, l'instance de légitimation d'un document sur le web
      - la confusion entre des documents de type, de statuts et de valeur très différents

⇒ Tous ces problèmes, qui se posent dès qu'il est question du document électronique, se posent avec d'autant plus d'acuité pour toute démarche d’évaluation d’une ressource électronique. Ils nécessitent une distinction claire des composants de l'identification et de l'évaluation de l'information (cf Parties "Identification" et "Evaluation")

 haut de page

 


Quel modèle implicite de l'information ?

La complexité de la question de l’évaluation (cf plus loin) est redoublée par la complexité de la notion d’information : quelle conception implicite de l’information est généralement en jeu ?

  • la conception documentaire classique :
    Les approches de l’évaluation de l’information sont fondées sur les conceptions documentaires "classiques " de l’information :
    - l’information en tant que connaissance, " knowledge ", contenu signifiant d’un message inscrit sur un support, qui est le document.
    - distinction entre le document et l’information

⇒ Cette conception, aussi juste soit-elle, est-elle suffisante ? Ne repose-t-elle pas sur un présupposé implicite de l’information, selon lequel celle-ci serait une entité mesurable, quantifiable, évaluable ? (cf notions d’information comme " matière première ", " pétrole gris " de nos sociétés.

  • une conception "objectiviste" de l'information :
    La plupart des approches de l’évaluation (notamment canadiennes ou américaines) restent fondées sur une conception que l’on peut qualifier d’" objectiviste " de l’information, l’information étant supposée exister " en soi ", objectivement et indépendamment d’un regard humain.
    - la conception " objectiviste " d’une information, en tant que quantité mesurable, n’est pas nouvelle et provient notamment de la " Théorie Mathématique de la communication ", de Shannon et Weaver.

Sans entrer ici dans des réflexions théoriques sur l’information, il s’agit seulement de pointer ce qui nous apparaît comme une illusion assez répandue, fondée sur la croyance en une "évaluation objective " de l’information, centrée sur ses caractéristiques " externes ".
 

Dans toute évaluation, trois caractéristiques fondamentales de l'information (au sens social, cad "l'information-knowledge" et non "l'information-data") ne doivent pas être perdues de vue :

  • le caractère socialisé, construit, de l'information :


- l'information n'existe que parce qu'elle permet l'interaction d'un humain avec un objet, elle est " une relation posée face à un objet " (Yves Jeanneret), qui est le document.
- Robert Escarpit : " un processus dont le regard humain est absent ne comporte aucune information ".
- un document ne contiendra de " l'information " (au sens social) que s'il fait l'objet d'un regard, d'une interrogation, d'une interaction, d'une interprétation.

l'information n'existe pas "en soi", elle est toujours relative à un sujet, construite par un acteur humain.

  • le caractère relatif, contextuel de l'information :


- la réception de l'information dépend toujours de son contexte, de ses récepteurs :
Y. Jeanneret : " un même énoncé (sur différents supports) produira une information de nature extrêmement différente, pour des lecteurs différents, dans des contextes différents ".

la signification d'une information dépend toujours des conditions de sa réception : réceptivité, attente... du lecteur

  • le caractère matériel, technicisé, organisé, de l'information :


- la réception de l'information dépend également de son support matériel, de l'organisation du message : importance de la mise en page, de la mise en forme textuelle de l'information...

si le contenu et le contenant, l'information et sa mise en forme doivent être distingués dans l'évaluation, ils sont néanmoins indissociables et constituent les composants de la réception de l'information.

Exemple : une information essentielle non trouvée en raison d'une mauvaise disposition, d'une mauvaise mise en forme textuelle.
 

En bref, il n'existe aucune automaticité dans la diffusion et la réception de l'information et le souci "d'objectivité" (ou plutôt d'objectivation, de rationalisation des processus informationnels), développé dans les approches de l'évaluation, ne devrait pas faire oublier le caractère toujours relatif, approximatif, incertain, construit... de l'information.

On peut d'ailleurs noter que les grilles d'évaluation de l'information ne portent que très partiellement sur le contenu-même des informations.

 haut de page

 


Le problème de la qualité et de la pertinence (relevance) de l'information

Première remarque :
La nécessité d’identifier, d’évaluer la qualité et la pertinence de l’information n'est pas nouvelle : elle est au fondement de la recherche documentaire.

Rappel de la définition de la recherche documentaire :
" Action, méthodes et procédures ayant pour objet de retrouver dans des fonds documentaires les références des documents pertinents " (Vocabulaire de la documentation, AFNOR, 1987).

  • La notion de pertinence :
    "Degré de corrélation entre une question et la réponse apportée, la pertinence est un concept-clé de la recherche d'information depuis les années 50" (Sylvie Dalbin).
    En général, la notion de pertinence vise le document et son adéquation à une requête :
    - généralement définie par le croisement de deux notions transversales de la recherche d'information et de la RDI : le bruit et le silence documentaires :
    • bruit : documents retrouvés non pertinents
    • silence : documents pertinents non retrouvés

- l’élimination ou la réduction de ces deux indices définit la pertinence (relevance) d'un système documentaire.
> mais il s'agit là d'une vision restrictive de la pertinence, centrée uniquement sur les systèmes documentaires classiques (de type bases de données).

  • En fait, selon Sylvie Dalbin, la pertinence concerne plusieurs aspects de la recherche d'information :
    • la pertinence de la représentation du document par rapport à la requête
    • la pertinence de la représentation du document par rapport au thème
    • la pertinence du document lui-même par rapport à la requête
    • la pertinence du document par rapport au thème
    • la pertinence de la requête par rapport au système documentaire
    • la pertinence de l'information trouvée par rapport au besoin initial

 
Toutes ces catégories de la pertinence ne sont pas concernées par l'évaluation de l'information et il importe de bien caractériser la pertinence que l'on veut mesurer, évaluer.
Schématiquement, trois grandes catégories de pertinences relevées par plusieurs chercheurs :

    • la pertinence-système :

- concerne la capacité du système documentaire (logiciel, base de données...) à indexer le document et surtout à le retrouver, en réponse à une requête :
> elle vise surtout la pertinence de la représentation du document (son indexation...) et, en conséquence, la pertinence de la recherche d'information elle-même.
>> la pertinence-système ne concerne pas l'évaluation de l'information mais plutôt les outils de recherche

    • la pertinence-utilisateur :

- pertinence vue sous l'angle de l'utilisateur
- concerne la tâche elle-même de recherche, le besoin d'information, la formulation de la requête, etc.
- Plusieurs types de pertinences-utilisateur :

        • la pertinence de la formulation de la requête : comment l'utilisateur traduit sa question en une requête d'interrogation, comment le système facilite ou non la formulation des requêtes, etc.

> renvoie encore à l'évaluation des outils (des interfaces de recherche...)

        • la pertinence de la présentation des résultats : concerne encore exclusivement les outils de recherche

- par exemple, quelle pertinence des représentations cartographiques dans certains outils (Kartoo...)
- pertinence encore mal mesurée

        • la pertinence du document par rapport au besoin :

- la plus importante du point de vue de l'utilisateur :
un document pertinent par rapport à sa représentation dans le système (bien indexé), pertinent par rapport à la requête, ou au thème, n'est pas forcément pertinent par rapport au besoin d'information de l'utilisateur.
- pertinence la plus difficile à mesurer : à apprécier par l'utilisateur lui-même
- ne peut faire l'objet d'une évaluation "objective" et critériée

    • la pertinence-thème:

- concerne la pertinence de la valeur d'un document ou d’une information, par rapport au thème traité
> pertinence du contenu
- type principal de pertinence visée dans les problématiques d'évaluation de l'information sur Internet.
 

  • Notions de pertinence et de qualité de l’information :

une information pertinente répond à un besoin précis d’information, formulé par un acteur donné, à un moment donné et sur un sujet donné.

    • caractère toujours localisé, relatif, contextuel de la pertinence de l’information, qui n’existe pas en soi
  • au plan terminologique, important de distinguer ces deux notions : information de qualité et information pertinente.

Quelles sont les caractéristiques d’une " information de qualité ", notamment de l’information documentaire, ou spécialisée ?

Intéressant de repartir de la définition traditionnelle des caractéristiques de la qualité de l’information, notamment professionnelle : elles définissent en creux tous les objectifs et les critères d’évaluation :

  • une information identifiée, " sourcée "

- une information dont on peut identifier facilement l’auteur

    • identification = le premier objectif de l’évaluation
  • une information fiable :

- le contenu, les données apportées doivent avoir été vérifiées, recoupées ;
- l’information professionnelle doit reposer sur un contrat de confiance, une légitimité admise, évitant au lecteur d’avoir à vérifier lui-même la véracité des informations.
- Fiable ne signifie pas forcément " vraie " : fiabilité n’égale pas vérité…

    • objectif le plus difficile et le plus important de l’évaluation de l’information sur Internet, puisqu’il n’y a pas forcément le contrat de confiance existant dans l’information professionnelle 
  • une information apportant de la nouveauté :

- renvoie à la définition même, au plan théorique, de l’information : quelque chose qui apporte du nouveau, enrichit les connaissances.

    • sur Internet, l’évaluation de l’information doit viser à apprécier le degré de nouveauté, d’originalité d’une information ;
    • l'un des fléaux d’Internet : la redondance, qui toucherait environ un tiers des documents… 
  • une information précise, exacte, complète ou exhaustive :
    - critère de la densité, de l’exactitude, de la complétude de l’information apportée.
  • une information accessible :

- l’information documentaire, spécialisée, doit être facilement retrouvée, identifiée, localisée, et accessible.

    • problème sur Internet de l’accès parfois incertain aux documents, de l’accès gratuit ou payant, de la localisation… 
  • une information fraîche, actualisée :

- mise à jour, renouvellement de l’information est une donnée essentielle

    • critère de la mise à jour des sites web 
  • une information ayant un impact, un effet :

- caractéristiques de l’information " utile ", recherchée en vue d’un objectif d’action ou de décision…

    • critère difficile à apprécier, lié à la pertinence et à l’adaptation de l’information à l’objectif de recherche
  • une information bien structurée, bien présentée, bien rédigée :

- voir ci-dessus l'importance des critères de forme

 haut de page

 


Questions et précautions méthodologiques sur l'évaluation

Six questions posées, donnant lieu à six précautions méthodologiques :

1/ Identifier, évaluer, valider : quelle différence ?

Dans certaines approches de l'évaluation, les questions sont parfois mélangées et portent à la fois sur :

- les éléments servant à identifier, repérer, classer le site, qui ne peuvent donner lieu à évaluation : par ex., la nature du site (site universitaire, associatif, etc), ses objectifs... ne peuvent être évalués, cad jugés, notés, comparés…
- les éléments servant à juger, noter, comparer le site, selon un barème, une grille de critères : par ex. l’accessibilité du site, ou bien la qualité de l’expression…

    • précaution méthodologique :

- bien distinguer, dans le questionnement, ce qui relève de :

      • l’identification, de la description d’un site ou d’une ressource : tous les éléments permettant de situer, de référer, de classer, d’identifier… sans possibilité (ou sans intérêt) de jugement, de notation
      • l’évaluation : ce qui peut donner lieu à jugement critique
      • la validation : les éléments de sélection, de référencement

2/ Evaluer : pour quels objectifs ?

La définition des objectifs de l'évaluation

Toute évaluation se fait dans un contexte donné, par des acteurs et pour des objectifs donnés.
Schématiquement, deux types d’évaluations, menées par deux catégories professionnelles ou sociales, pour deux sortes de finalités :

  • les bibliothécaires, les documentalistes, les professionnels de l’information, mais aussi les enseignants, les étudiants… :

o       objectif : recensement de ressources validées, pertinentes, pouvant répondre à des besoins d’information

o       évaluation du contenu prioritaire

o       finalité de sélection

  • les webmasters, graphistes, ergonomes, spécialistes du référencement de sites web… :

o       objectif : amélioration de la visibilité, de la diffusion, du référencement, de la notoriété d'un site

o       évaluation du contenant prioritaire

o       finalité de diffusion

  • précaution méthodologique :

o       bien définir ses objectifs d’évaluation, et les hiérarchiser en finalités / objectifs généraux / objectifs spécifiques, en fonction de ses objectifs de recherche, ou de ses objectifs professionnels ;

o       Exemples :

finalité : sélection de l'information

objectifs généraux :

      - a/ élaborer une sélection de ressources sur un thème ou dans un domaine quelconque
- b/ faire une recherche documentaire sur un sujet précis et sélectionner quelques ressources
- c/ faire une activité de veille sur un sujet

objectifs spécifiques :

      - a/ mesurer la pertinence, le sérieux d’une source ; évaluer la notoriété d'un site...
- b/ évaluer l'expertise d'un auteur ; vérifier la fiabilité des informations trouvées ; évaluer la pertinence des ressources sur le sujet ; évaluer la qualité d'expression d'un texte...
- c/ vérifier la fraîcheur d'une information ; évaluer la fiabilité d'une source ; évaluer la pertinence des ressources sur le sujet...

finalité : diffusion de l'information

objectifs généraux :

- a/ comparer l’ergonomie de différents sites web
- b/ évaluer la structuration de l'information dans un site
- c/ évaluer la qualité graphique d'un site

objectifs spécifiques :

- a/ évaluer les performances et la pertinence des interfaces ; comparer les dispositifs de navigation interne : plan, liens... ; évaluer la qualité des pages d'accueil...
- b/ évaluer la cohérence, la logique de l'organisation du site ; évaluer la clarté de la présentation des informations (sommaire, etc)...
- c/ évaluer la lisibilité du site ; évaluer la charte graphique ; évaluer le choix des formats graphiques...

3/ Qu’est-ce qui est évalué ?

La délimitation de l'objet de l'évaluation :
selon les objectifs fixés, il s'agit de définir clairement ce qui doit être évalué et d'identifier les problèmes sous-jacents posés :

un site web ? une partie du site ? Une page web ? un document autonome ?

o       problème des " limites " du document électronique

un document électronique ou bien l’information contenue ?

o       problème de la distinction entre document et information, support et contenu

l’information contenue ou son organisation, sa structuration ?

o       problème de la distinction entre information et organisation de celle-ci, entre contenu informationnel et mise en forme

la structuration du site et/ou du document ou son esthétique, son graphisme, sa lisibilité ?

o       problème de la distinction entre mise en forme, structuration et choix du graphisme, esthétique du texte, dispositif de lecture

D’autres objets de l’évaluation peuvent être trouvés :

dans l’information, qu’est-ce qui est recherché et évalué ?
sa pertinence ? son originalité ? son exhaustivité ? sa fraîcheur ?

la notoriété, le sérieux de la source ?

⇒ L'imbrication de toutes les dimensions, de toutes les " couches " du document par le numérique induit une certaine confusion entre les différents aspects et composants du document et de l’information, qui risque de se retrouver dans l’évaluation.

précautions méthodologiques :

o       selon son objectif, identifier et délimiter clairement ce qui fera l’objet, en priorité, de l’évaluation : contenu, forme… ?

o       acquérir une meilleure connaissance des différentes " couches " d’un document électronique, des différents composants d’une unité documentaire

4/ Evaluer : selon quels critères ?

La formulation et la hiérarchisation des critères :
Evaluer quelque chose (ou quelqu’un) signifie à la fois juger, comparer, parfois quantifier, selon des critères externes posés a priori, plus ou moins explicités et détaillés.

    • problème :

- les critères ne sont pas toujours clairement exprimés et formulés : on évalue généralement " à l’instinct ", au jugé, selon ses propres modèles de qualité, cad selon des critères non explicités, non formulés.
- l’évaluation se fait spontanément de manière globale, sur une impression d’ensemble d’un site, d’un document…
- les différents éléments d’évaluation sont souvent confondus : notamment la différence entre le contenu et la forme du document.

    • précautions méthodologiques :
      • expliciter ses critères d'évaluation, personnels ou non
      • établir une liste de ces critères, classés en différentes parties
      • viser l'exhaustivité des critères : les critères doivent pouvoir cerner tous les composants d’un site, ou tous les aspects d’une information
      • hiérarchiser les catégories et les critères : toutes les catégories ne peuvent être mises sur le même plan, tous les critères ne se valent pas. Cette hiérarchisation n’est pas absolue et dépendra des objectifs de l’évaluation.
         

5/ Evaluer : en référence à quelles normes ?


La connaissance et l’explicitation des normes :

Caractère normatif de l’évaluation :

o       critères fondés sur des normes, des valeurs, des règles, qui représentent un "idéal-type" et permettent de distinguer la qualité de la médiocrité.

problème :


- les règles et les normes, qui définissent un " modèle " de la qualité, sont souvent mal connues ou peu connues :

o       exemple des règles de la mise en page, de la lisibilité des documents électroniques…

précaution méthodologique :

o       connaître les règles, les normes, les " canons " de la " qualité documentaire " :

- critères de qualité de l’information
- normes d’identification des documents
- règles de présentation des documents
- normes de mise en page
- etc.

⇒  L’évaluation des ressources électroniques nécessite en amont de nombreux savoirs, non seulement disciplinaires, mais documentaires, des compétences diverses, renvoyant à divers métiers ou domaines professionnels.
 

6/ Evaluer : selon une grille universelle ou des grilles spécifiques ?


Universalité ou spécificité de l’évaluation ?

Peut-il exister une grille universelle d’évaluation de l’information ?
A l’évidence non : plusieurs grilles d’évaluation à élaborer et utiliser selon :

o       l’objectif et l’objet de l’évaluation : évaluation du contenu différente de celle du support

o       " l’étendue " de la ressource : évaluation d’un site entier, d’une partie, d’un document précis…

o       le type de ressources électroniques : différences selon la nature des sites (documents scientifiques évalués différemment de sites grands publics), la nature des documents (textuels ou non textuels…)

Existence de quelques critères communs, de catégories communes de critères, mais organisation différente des critères selon les objectifs, les situations, les objets de l’évaluation…

Grilles existantes, plus ou moins élaborées, et découpées en parties bien distinctes, visent une sorte d’universalité de l’évaluation, mais sont adaptées en fait à des situations assez spécifiques :

Exemples :

  • " Grille d’évaluation de l’information présente sur Internet ", de Doc’Insa : contenu, organisation, auteur, autres critères… : bien adaptée pour évaluer des ressources scientifiques, présentées plutôt sous forme d’unités documentaires
    • permet difficilement d’évaluer un site entier, ou une ressource issue d’un secteur non scientifique 
  • " Grille de sélection des sites web " : du réseau de la Santé et des services sociaux de la région de Montréal : 4 parties : contenu, navigation, présentation visuelle, accessibilité : portée plus générale, pouvant couvrir différentes sources, mais grille visant clairement l’évaluation d’un site, ou d’une partie de site, et non celle d’un document.
    • bien adaptée à l’évaluation d’un site web, de toute nature, mais pas assez précise pour évaluer un document spécifique, ni le contenu informationnel
  • Weborama : grille d'évaluation commerciale, ou "grand public"
  • précautions méthodologiques :
    • adapter les grilles d’évaluation à l’objet et à l’objectif de l’évaluation
    • bien distinguer les critères communs, " universels " pour l’identification d’une information de qualité avec les critères propres à chaque catégorie, chaque type d’information
    • ne pas s’enfermer dans des grilles d’évaluation trop figées : l'évaluation de l’information est surtout un questionnement

haut de page


 

Sylvie Dalbin, Instruments de recherche sur le web, In La Recherche d'information sur les réseaux. Cours INRIA, 30 septembre-4 octobre 2002, Le Bono (Morbihan), ADBS Editions, 2002, p.46-50

Ressources sur l'évaluation de l'information

Liste de ressources

Sites-ressources, sites spécialisés sur l'évaluation de l'information

Guides méthodologiques, grilles d'évaluation

Supports pédagogiques, didacticiels, exercices...

Articles de presse, dossiers documentaires, documents web...

Publications de recherche (textes de colloques, ouvrages, articles de  revues scientifiques...)

Sites-ressources sur la désinformation, les dangers d'internet, etc

NOUVEAU :
Sélection de ressources sur la lutte contre les complotismes, avril 2016


Avertissement :
Cette  liste de ressources est évidemment sélective. Elle vise notamment à compléter les stages de l'URFIST "Evaluation de l'information, "Evaluer la crédibilité d'une ressource"..., en indiquant les références des textes, ouvrages, enquêtes... cités dans les stages.
Pour avoir une bibliographie plus complète sur les divers aspects de l'évaluation de  l'information, il faut consulter plutôt, sur mon compte Zotero, la "collection Evaluation".
Pour avoir une  webographie régulièrement actualisée, vous pouvez également suivre la Liste Diigo "Evaluation de l'information" de  mon compte personnel Diigo, qui alimente (en partie) le Groupe "Evaluation de l'information", créé avec Olivier Le Deuff sur Diigo.
Sur la formation des étudiants et des élèves à l'évaluation de l'information, voir : "Ressources pédagogiques pour la formation à l'évaluation de l'information"

Alexandre Serres 

 

Dernière mise à jour : 22 avril 2016


1/ Listes de ressources

2/ Sites-ressources, sites spécialisés sur l'évaluation de l'information

  • CENTRALE SANTE. Net Scoring ®. Critères de qualité de l'information de santé sur l'Internet. Rouen : Centrale Santé, 2001. (dernière mise à jour le 07.01.05). Disponible sur : <http://www.chu-rouen.fr/netscoring/>
     
  • CLEMI (Centre de Liaison de l'Enseignement et des Médias d'Information). Paris : Ministère de l'E.N., 1997. Dispo. sur : http://www.clemi.org/
     
  • HEALTH ON THE NET (HON). HONcode : Code de Conduite pour sites Web médicaux et de santé. Genève : HON, 2004. Disponible sur : http://www.hon.ch/Project/HONcode_f.html
     
  • HABILOMEDIAS.  Montréal : HabiloMédias, 2006. Disponible sur : http://habilomedias.ca/
     
  • TEMESIS. Qualité, accessibilité et conformité des sites Internet. Cenon (33150) : Temesis, 2002-2005. Disponible sur : <http://www.temesis.com/>
     
  • UNION EUROPEENNE. Cadre de Qualité de Bruxelles. Bruxelles : Minerva-Project, 2003-2004. (dernière mise à jour le 04-02-04.) Disponible sur : http://www.cfwb.be/qualite-bruxelles/pg001.asp

3/ Guides méthodologiques, grilles d'évaluation

4/ Supports pédagogiques, didacticiels, exercices...

Tous les liens vers des supports, didacticiels, etc. sont désormais regroupés sur le support du stage "Former à l'évaluation de l'information", sur la page  Ressources pédagogiques pour la formation à l'évaluation de l'information

5/ Articles de presse, dossiers documentaires, sites web, billets...

6/ Publications de recherche (textes de colloques, ouvrages, articles de  revues scientifiques...)

7/ Sites-ressources sur la désinformation, les dangers d'internet, etc.

 

 

 

 

Fichiers attachésTaille
Fichier Sélection de ressources_Complotismes_2016-04-22.docx159.43 Ko

Sources utilisées

 

- BAZIN, Louise. Elaboration d'une grille de sélection des sites web. Projet collectif du réseau de la Santé et des services sociaux de la région de Montréal. Bulletin des Bibliothèques de France, t. 44, n°2, 1999, p. 73-76

- COMMISSION "FRANCAIS ET INFORMATIQUE" de la FESeC (Fédération de l'Enseignement Secondaire Catholique belge). Comment évaluer de manière critique les ressources issues de l'Internet ? [en ligne]. (Belgique) : FESeC, 1998 (dernière mise à jour le 24.11.2001). Disponible sur : <http://users.skynet.be/ameurant/francinfo/validite/> (consulté le 04.04.2002)

- HERZHAFT, Lise. Evaluer des sites internet pour les étudiants et les entreprises. [en ligne]. Lyon : URFIST, 2001. (dernière mise à jour février 2001). Format Powerpoint. Disponible sur : <http://urfist.univ-lyon1.fr/eval_site.ppt>

- INSA LYON : SAPRISTI! (Sentiers d'Accès et Pistes de Recherche d'Informations Scientifiques et Techniques sur l'Internet) (France) Evaluation de l'information présente sur Internet [en ligne]. Villeurbanne : Doc'INSA, 1997. (dernière mise à jour le 07.09.2000). Disponible sur : <http://csidoc.insa-lyon.fr/sapristi/fristi36.html>. (consulté le 04.04.2002)

- JEANNERET, Yves. Y a-t-il (vraiment) des technologies de l'information ?. Villeneuve d'Ascq : Presses Universitaires du Septentrion, 2000 (Communication)

- Projet DESIRE, Union Européenne. Le Détective de l'Internet [en ligne]. Bruxelles : Union Européenne, 1998. Disponible sur : http://www.desire.org/detective/detective-fr.html. (consulté le 04.04.2002)

- SUTTER, Eric. Pour une écologie de l'information. Documentaliste - Sciences de l'information, vol. 35, n°2, 1998, p. 83-86

- VINCENT, Jean-François. Quelques pistes pour débusquer l'auteur d'un site. Netsources, n° 39, juillet-août 2002, p. 1-4