robotstiedoston
Robotstiedosto, eli robots.txt, on verkkosivustolle tarkoitettu tekstitiedosto, joka sijaitsee verkkotunnuksen juurihakemistossa ja jonka avulla ohjataan verkkokerääjien eli robottien pääsyä sivuston resursseihin. Tiedoston tavoitteena on ohjata indeksointia, helpottaa sivuston hallintaa ja estää kohtuuttoman kuormituksen kohteena olevia osia. Robotstiedosto on käytännössä vapaaehtoinen keino ja sen noudattaminen riippuu robottikoneesta.
Syntaksi koostuu ryhmistä, joilla on User-agent -määritys ja sille seuraavat Disallow- ja mahdollisesti Allow-säädökset. Esimerkki:
Tiedostoon voidaan lisätä myös Sitemap-viittaus, esimerkiksi Sitemap: https://esimerkki.fi/sitemap.xml, sekä mahdollisia lisäasetuksia, kuten Crawl-delay. Käytössä on sekä
Robotstiedosto on ratkaiseva vain indeksointiehdon näkökulmasta eikä se ole turvallisuus- tai pääsylukko. Monet hakukoneet kunnioittavat siellä
Ylläpitäjien on hyvä testata robotstiedoston toimivuutta esimerkiksi hakukoneen tarjoamilla työkaluilla ja varmistaa, ettei tärkeää aineistoa vahingossa