Google

De Aldeid.
   Voir aussi Google Hacks

Sommaire

Google

Qu'est-ce que Google?

Extrait des outils Google

Qui aujourd'hui ne connaît pas Google? Google est avant tout une société (Google Inc.) qui a été créée en 1998 par Larry Page et Sergey Brin qui s'étaient fixés comme objectif d'organiser l'information à l'échelle mondiale. Aujourd'hui, Google est réputé pour son moteur de recherche, mais la société propose une suite d'outils en ligne (Agenda, Blogger, Documents, Gmail, Groups, Picasa, Reader, Sites, Sketchup, Talk, Traduction, YouTube, Mobile, Maps, Pack, Actualités, Alertes, Annuaire, Barre d'outils, Google Chrome, Desktop, Earth, iGoogle, Images, Livres) qui ne cesse de s'étendre et également son propre système d'exploitation (Google Chrome OS).

Comment fonctionne l'indexation Google?

Afin d'alimenter la base d'indexation Google, des robots, appelés "bots" parcourent régulièrement les pages sur Internet à la recherche de nouveaux liens, ces derniers permettant de découvrir de nouvelles pages qui viendront s'ajouter à l'index Google.

Par ailleurs, Google constitue également une base de données d'archives, appelée "cache". Lorsqu'un site Web est inaccessible par exemple, ou une page a été supprimée d'un site Web, il est toujours possible d'y accéder, par la fonction cache des résultats de recherches Google.

» Les "Google bots" sont des programmes, hébergés sur les serveurs Google, qui parcourent les pages Web à la recherche de nouveaux contenus, de nouveaux liens. Le passage de ces "bots" est appelé "Google dance".

» L'index Google est basé sur les informations remontées par les "bots". Google est le moteur de recherche possédant le plus important index au monde (plusieurs milliards de pages : voir http://www.worldwidewebsize.com/). Pour chaque page indexée, Google associe les contenus similaires, et calcule poiur chaque domaine un PR (Page Rank), une formule gardée partiellement secrète par l'éditeur. C'est la position du PR qui permet de positionner les pages dans les résultats d'une recherche Google.

» Cache : Pour chaque page parcourue, Google conserve dans sa base de données de "cache" 101k de données de texte (également les fichiers HTML, DOC, PDF, PPT, ...)

» L'API Google est un petit programme externe proposé par Google, et permettant aux développeurs d'intégrer des fonctionnalités d'interrogation distante du moteur de recherche. Pour pouvoir l'utiliser, il faut posséder une clé de licence gratuite (délivrée par Google). Chaque clé permet d'interroger 1000 recherches par jour.

Image:info.png
Remarque
Par défaut, lorsque vous entrez l'adresse http://www.google.com, vous êtes automatiquement redirigé vers l'adresse du serveur Google local. Pour forcer la consultation d'un serveur Google autre que celui de votre pays d'origine, il suffit d'ajouter "/ncr" après l'adresse. Ainsi par exemple, pour visiter la page Google en allemand, il suffit d'entrer http://www.google.de/ncr.

Syntaxe avancée

Google est doté d'un langage évolué permettant de filtrer les résultats de la recherche. Le tableau qui suit fournit les éléments de cette syntaxe.

Image:info.png
Remarque
Pour plus de renseignements, consulter le site http://www.googleguide.com/.
Directive Description Exemple
site:domaine Affiche la liste de tous les liens associés au nom de domaine port site:aldeid.com affiche la liste de toutes les pages contenues sur le portail aldeid.com, et contenant le mot clé "port"
link:page Affiche la liste des sites contenant un lien vers le site cible link:aldeid.com permet d'afficher la liste des sites faisant référence à aldeid.com
intitle:termes Recherche les pages dont les mots clés sont spécifiés dans la liste des termes; Pour vérifier qe le site aldeid.com ne contient pas de répertoire indexé listant le contenu de ses fichiers, nous pouvons utiliser la syntaxe suivante : intitle:"index of" site:aldeid.com
inurl:
intext:
related:site Fournit une liste de liens similaires (algorithme Google) au site fourni en paramètre related:aldeid.com fournit une liste de liens similaires à aldeid.com
cache:page Permet de rechercher une page dans le cache de Google cache:aldeid.com
filetype:extension Permet de filtrer les liens de la recherche en fonction d'une extension filetype:pdf site:aldeid.com permet d'afficher la liste des documents au format PDF présents sur aldeid.com.
rphonebook:nom et ville ou pays Permet de requêter dans l'annuaire téléphonique des résidents (US) rphonebook:william saw NY
bphonebook:nom et ville ou pays Permet d'intérroger l'annuaire business (US) bphonebook:bob robinson LA
phonebook:nom et ville ou pays Intérroge les deux annuaires vus précédemment phonebook:william shakespeare
Correspondance litérale (" ") Inclut tous les mots fournis entre guillemets en respectant l'ordre site:aldeid.com "prise empreinte" fournit la liste des pages qui traitent de la prise d'empreinte et non de l'empreinte prise ou des deux mots pris individuellement (prise, empreinte).
Opérateur d'exclusion (-)
Opérateur d'inclusion (+)
Synonymes (~) Permet d'effectuer des recherches avec des mots approchants Une recherche sur powerpoint ~help effectuera une recherche sur powerpoint ET help ou tips, faq, tutorial, etc.
info:domaine Fournit des informations sur un domaine info:aldeid.com
Outils personnels