Référencer - A quoi sert robots.txt

Selon Google Outils pour Webmestres, robot.txt restreint l'accès des robots d'exploration à certaines pages. Les robots sérieux respectent les instructions, même si elles ne sont qu'indicatives puisqu'elles peuvent être contournées.

Les fichiers robot.txt génériques (livrés par exemple avec un cms) vont interdire l'exploration de certains répertoires et donc l'indexation de certaines urls qu'il serait parfois intéressant de libérer. Google donne la liste des urls qu'il n'indexe pas parce que c'est interdit par robot.txt.

On pourrait donc supprimer certaines lignes, voire même le fichier tout entier, comme le recommande Google Outils pour Webmestre, si l'on n'a rien à protéger contre l'indexation.

Les pages qui sont inaccessibles pour Google, soit protégées par mot de passe, comme des pages réservées aux membres, soit interdites d'indexation aux moteurs de recherche par le fichier robots.txt, ne pourront pas non plus être traduites par l'outil de traduction en ligne Google Translate.

Depuis août 2012, Google indique pourquoi une page interdite d'accès par robots.txt n'a pas de description quand elle sort dans ses résultats de recherche avec le le message suivant : "La description de ce résultat n'est pas accessible à cause du fichier robots.txt de ce site. En savoir plus"

Le fichier robots.txt peut avoir pour utilité d'indiquer aux robots l'existence et l'adresse d'un site map. En ajoutant dans robots.txt une ligne avec cette syntaxe :
SITEMAP: http://votre-site.fr/sitemap.xml

Un sitemap (ou plan de site pour les robots) répertorie les urls de votre site

Index |Info | Imprimer | | PDF Permalien

Technique

adHoc

Fabriquer le web

Sécuriser

Référencer

Astuces CSS

Piwigo

TNG

Écolibre

Écolibre

Notre univers numérique

Revue de presse RGPD

Données personnelles : comment nous avons peu à peu accepté d’en perdre le contrôle - The Conversation (11 Dec 2023, 23h12)
L'Union européenne adopte un nouveau cadre légal pour le transfert de données vers les États-Unis - RFI (10 Jul 2023, 21h36)
L’Éducation Nationale officialise l’arrêt du déploiement d’Office 365 et de Google for Education dans les écoles (16 Nov 2022, 09h20)
Meta menace de bloquer Facebook et Instagram en Europe (08 Jul 2022, 20h39)
Un éditeur mis en demeure pour avoir collecté des données personnelles avec le module Google Analytics - eWatchers.org (01 Mar 2022, 16h42)
L’utilisation de Google Analytics viole le droit européen, selon l’autorité autrichienne de protection des données – EURACTIV.fr (13 Jan 2022, 22h05)
Pour la Cnil, c'est clair : il faut lâcher les Google Docs dans l’enseignement supérieur et la recherche (31 May 2021, 10h47)
Health Data Hub: l’Assurance maladie s’oppose à Microsoft sur la gestion des données de santé (19 Feb 2021, 22h38)
La justice européenne sabre le transfert de vos données vers les USA à cause de la surveillance de masse (16 Jul 2020, 14h55)
Doctolib ne veut plus voir vos données médicales - ZDNet (29 Jun 2020, 08h52)
Le Conseil d’Etat a-t-il autorisé les sites à bloquer les utilisateurs qui refusent les cookies ? - Libération (29 Jun 2020, 08h44)
Souveraineté juridique : la soumission de la France aux lois américaines (2/11) (21 Jan 2020, 09h11)
Généalogie : la numérisation des documents d’état civil est-elle libre ? (04 Dec 2019, 14h01)
Hold-up sur les données de santé. Patients et soignants unissons-nous – Framablog (29 Nov 2019, 08h29)
La France : premier pays d'Europe à généraliser la reconnaissance faciale (13 Oct 2019, 15h37)
Les Américains accidentels attaquent la France à Bruxelles - Capital.fr (03 Oct 2019, 18h58)
En France, la reconnaissance faciale attestera bientôt de votre «identité numérique» (06 Aug 2019, 13h32)
Cookies : le drôle de jeu de la Cnil (11 Jul 2019, 21h45)
Quantcast, la société derrière les fenêtres qui vous assurent que « le respect de votre vie privée est notre priorité » (27 May 2019, 11h13)
Un cours en ligne gratuit sur la protection de la vie privée (08 May 2019, 13h19)
L'Atelier RGPD : un cours en 4 modules sur le RGPD (16 Mar 2019, 20h46)
Les défis éthiques de l’identité numérique (04 Mar 2019, 06h00)
Le FBI peut avoir accès à certains tests ADN réalisés à la maison | Slate.fr (01 Feb 2019, 19h54)
Les 3 niveaux de nos identités en ligne | InternetActu.net (30 Jan 2019, 08h41)
Internet. Il est « impossible de protéger à 100 % » nos données personnelles (20 Dec 2018, 19h33)
Entrée en vigueur de la nouvelle loi Informatique et Libertés et de son décret d’application | CNIL (13 Aug 2018, 20h52)
RGPD: la vision de la vie privée est sacrée en Europe, mercantile aux États-Unis | Slate.fr (10 Aug 2018, 20h46)
Le moment redouté est arrivé : Google Maps devient beaucoup plus cher pour les pro - Tech - Numerama (10 Aug 2018, 06h54)
RGPD et Genealogie: Les vivants et les morts | the b@rrett blog (31 Jul 2018, 09h15)
RGPD et nous et nous et nous ... (31 Jul 2018, 09h11)
Le RGPD vu des deux côtés de l’Atlantique : des divergences philosophiques inconciliables ? (31 Jul 2018, 09h03)
WHOIS et RGPD : l’Icann peine à endiguer la vague - ZDNet (16 Jul 2018, 21h40)
Le RGPD va rebooter Internet : ouvrons le combat (12 Jun 2018, 08h00)
Ce qu'il faut savoir pour tout comprendre au RGPD, le nouveau règlement de protection des données personnelles - Var-Matin (24 May 2018, 06h47)
What the General Data Protection Regulation (GDPR) Means to Genealogy Bloggers and Others | Eastman's Online Genealogy Newsletter (06 May 2018, 14h19)
Les assureurs veulent à tout prix mettre la main sur votre profil génétique | Slate.fr (04 May 2018, 07h55)
7 points d’éclaircissement sur le RGPD appliqué aux sites Internet | Alexandre Joly blog sur la sécurité informatique et la sensibilisation des entreprises et particuliers (11 Apr 2018, 14h53)