Trouver les indices dans les URL

URL signifie Uniform Resource Locator, adressage standard des ressources.
Les URL sont tout simplement les adresses des documents de l'Internet - l'endroit où l'on peut trouver une ressource précise.
En voici un exemple:

http://indice.utile.net/

Vous les voyez en haut du navigateur (dans la fenêtre localisation si vous utilisez Netscape ou adresse si vous utilisez Internet Explorer).

 

Utilisez l'URL comme un indice - il peut vous fournir un tas d'informations sur la ressource et sur l'endroit où vous vous trouvez dans le site. 

Les URL: Avant même de regarder la ressource elle-même, on peut déduire un tas de choses de l' URL : par exemple, regardez l'information que l'on peut glaner dans cette URL :

http://www.bps.org.uk/publicat/Periodicals/Psych/PSY9_97.HTM

 URL image
 
Ainsi, rien qu'en regardant cette URL on peut déduire ceci: Conclusion?
  1. On est en présence d'un site web anglais qui relève d'une institution.
  2. On est sur un fichier à l'intérieur d'un répertoire puis d'un second puis d'un troisième... c'est à dire qu'on est sur une page loin à l'intérieur d'une collection de documents reliés entre eux.

Disséquons les URL

La structure de base d'une URL est celle-ci:

protocole://nom-du-serveur.nom-du-domaine/répertoire/nom-du-fichier

1) Protocole

La première partie d'une URL - avant les deux points - décrit la méthode (le protocole) d'accès aux ressources.

On accède aux informations sur l'internet par différents protocoles:
 

http:// un serveur World Wide Web (WWW)
ftp:// un serveur de transfert de fichier
mailto://  le courrier électronique
telnet://  Telnet, travail sur un ordinateur distant 
gopher:// un gopher
 

2) l'adresse de la machine

La deuxième partie d'une URL - après le protocole et les // - vous informe sur la machine à laquelle vous êtes relié.

Elle peut donner des renseignements intéressants, puisque cette partie de l'adresse vous indique parfois le nom du pays où se trouve la machine et le type d'organisme propriétaire.

Les noms de serveurs

On peut donner n'importe quel nom à une machine; - si on utilise le WWW, on parle de nom du serveur.

La plupart des collectivités utilisent leur nom comme nom de serveur, par exemple:

http://www.harvard.edu/

est l'adresse internet du serveur web de l'Université Harvard .
 

Les noms de domaine

Le nom de domaine localise la ressource sur l'internet. Il faut faire une demande officielle pour obtenir un nom de domaine (auprès de son fournisseur d'accès internet); ainsi, il n'y aura pas deux machines qui auront la même adresse. Les noms de domaine vous apportent donc des informations intéressantes puisqu'ils peuvent comprendre les codes des pays et les codes des organismes.

Par exemple:

.ac.uk

... indique que la ressource est sur un serveur universitaire (.ac) au Royaume-Uni (.uk).

Déchiffrer les codes des pays

Parfois, par le code pays, vous trouverez le premier indice : le pays où se trouve une ressource.  Par exemple:
 
au Australie
ca Canada
de Allemagne
fr France
uk Royaume-Uni

Notez cependant qu'un code de pays n'est pas toujours indiqué dans une URL. De nombreux sites américains par exemple, ne contiennent pas le code de pays .us .

Déchiffrer les codes d'organismes

On peut trouver un indice sur la nature de l'organisme qui possède le serveur à partir de son code.  Par exemple:
 
ac, edu serveurs académiques ou universitaires
co, com serveurs commerciaux
gov, gouv serveurs gouvernementaux
org serveurs non-gouvernementaux, d'organismes à but non lucratif

Noter que selon les pays, les codes diffèrent pour le même type d'organisme. Par exemple, un serveur universitaire peut avoir le code .ac au Royaume-Uni (ac , abréviation de "académique") mais .edu aux États-Unis (edu, abréviation de "educational" et .univ, pour "universitaire" en France).

On trouvera dans l'annexe c une liste des codes des pays et des organismes  
 

Attention!

Les noms de domaine ou des serveurs ne sont pas toujours des indications directes sur la localisation et la source de l'information.   

On peut donner n'importe quel nom à son serveur; et il est possible d'enregistrer des noms de domaine qui donnent de fausses impressions. 

Par exemple, il est possible (bien que peu probable) que l'URL: 

http://MacDonalds.com

ne pointe pas vers le site d'un restaurant de hamburgers mais vers le fabricant de matériel agricole   "Old MacDonald's Farm Supplies" ! 
 
 

3) Répertoires et noms de fichiers

Après le nom du serveur, entre l'ensemble de barres obliques (/) on trouve les noms des répertoires contenant le fichier auquel on accède.

De nombreuses ressources de l'internet sont organisées en répertoires, comme la plupart des applications sur les ordinateurs.  Ceci peut fournir des pistes utiles à la compréhension de la structure des sites.

Par exemple:

http://www.bps.org.uk/publicat/Periodicals/Psych/PSY9_97.HTM

possède une structure assez complexe - trois répertoires sont indiqués (publicat, Periodicals et Psych) avant d'arriver au véritable fichier (toujours situé au bout de l'adresse, à droite) .

C'est un indice sur la taille et la complexité du site - de façon générale, plus il y a de répertoires, plus le site est complexe. Gardez à l'esprit cependant, qu'un site complexe n'est pas forcément un site de qualité!

C'est aussi un indice sur le fait que cette URL vous entraîne sur un fichier situé loin au cœur du site.

On peut supposer que ce fichier vous amène sur la livraison de 1997 d'un périodique qui traite de psychologie.
 


Trucs et informations pratiques

Effacer des parties de l'URL pour en apprendre plus sur le site

Il peut être très utile d'effacer sur la droite des parties de l'URL pour découvrir où cette nouvelle adresse, plus courte vous entraîne.

En faisant cela, vous pouvez trouver des indications sur votre position à l'intérieur du site ainsi que sur sa structure.

En effaçant tout ce qui est situé à droite de la première barre oblique (/) vous remontez l'arbre du répertoire et pouvez comprendre comment le fichier est implanté dans le site.

Regardez par exemple, ce qui se passe si vous effacez une partie de l'URL suivante:
 

URL affiche: signifie:
http://www.ariadne.ac.uk/issue13/music.html  un article en ligne ceci est un article en ligne
http://www.ariadne.ac.uk/issue13/  le sommaire de la livraison 13 d'un journal l'article fait partie du n° 13 de ce journal
http://www.ariadne.ac.uk/  la page d'accueil d'un journal électronique l'article est contenu dans ce journal

Vous pouvez effacer une partie de l'URL en plaçant le curseur à la fin de l'URL dans la fenêtre "Adresse" et en appuyant sur le bouton "d' effacement arrière" ou "supprimer" jusqu'à ce que vous atteigniez la barre oblique (/), puis vous appuyez sur la touche "Entrée" .

Effacer à partir de la droite jusqu'à la barre oblique dans l'URL.

Cette technique est particulièrement utile pour de longues adresses URL.

Trouver la page d'accueil d'un site web

La page d'accueil est la première page d'un site web - l'équivalent de la couverture d'un livre - et comme telle, fournit beaucoup d'informations comme le titre, le nom de l'auteur et une présentation sommaire de l'objectif du site. Souvent, les hyperliens vous entraînent au beau milieu d'un site par opposition à la page d'accueil. Il est ainsi difficile de savoir où l'on est. C'est une bonne habitude de regarder la page d'accueil d'un site avant de l'utiliser, tout simplement pour vérifier ce que vous regardez. Les URL vous aident sur ce point - la racine d'une URL vous emmènera souvent sur la page d'accueil. Ca ne marchera pas toujours - mais essayez d'effacer le nom du fichier et celui des répertoires à droite de l'adresse, puis appuyez sur la touche Entrée (assurez-vous que la nouvelle URL se termine par une barre oblique / ou html ou htm). Ceci vous emmènera vraisemblablement à la page d'accueil. Par exemple:
Le site web du Président de la République française
http://www.elysee.fr/disc/disc_.htm une page loin dans le site
http://www.elysee.fr/ la page d'accueil
Ceci est surtout utile lorsque vous regardez les réponses données par un moteur de recherche; celles-ci vous entraînent souvent loin à l'intérieur des sites plutôt que sur les pages d'accueil.

Astuces!

Les URL qui se terminent par:
/welcome.html
/index.html
/defaut.html

sont souvent des pages d'accueil
 
 

Le tilde ~

D ans certaines URL vous verrez le tilde qui s'écrit ainsi:  ~

Par exemple: 

http://www.ilrt.bris.ac.uk/~cmpac/

Utilisez le tilde comme un indice!

La plupart des serveurs web utilisent le ~ pour indiquer qu'il s'agit de répertoires personnels.

Si l'URL contient un tilde, alors sachez que probablement (pas systématiquement cependant ) vous regardez une page personnelle, présentant des opinions personnelles et non sur un site officiel transmettant la ligne de pensée officielle.

Ceci ne signifie pas, cependant, que l'information soit de mauvaise qualité.

Par exemple la page suivante contient un tilde :

http://www.ilrt.bris.ac.uk/~cmpac/

Cette page est hébergée sur le serveur de l'Université de Bristol, mais n'est PAS une page officielle de l'université - c'est la page personnelle d'un membre du personnel.

home page image
 

PURL

Certaines URL contiennent le mot "PURL" au début de leur adresse

PURL signifie adresse permanente (Persistent Uniform Resource Locator).   Par exemple:

http://purl.org/metadata/dublin_core

Une PURL est une indication sur la longévité d'un site: le propriétaire de la ressource s'est engagé à donner un accès stable et permanent à travers une URL donnée.

Pour obtenir une PURL le propriétaire du site a dû l'enregistrer auprès d'un service PURL faisant office d'intermédiaire. Si pour une raison quelconque le site change ses adresses, le propriétaire transmet ces changements au service PURL qui se charge alors de rediriger les utilisateurs vers la nouvelle URL.

Une adresse PURL ne mène jamais à un lien mort; elle signifie que la même URL pointera toujours vers la même ressource même si, à l'arrière plan, les ressources ont été changées de serveur en serveur.



Accueil | Table des matières | Qualité | Critères de contenu | Critères de forme | Critères de traitement | Exemples | Exercices
8 sur 52 | Précédent | Suivant