Internet Archive will künftig Robots.txt-Einträge ignorieren

Robots.txt ist eine kleine Textdatei, mit der Webseitenbetreiber bestimmte Teile einer Webseite vor Suchmaschinencrawlern verstecken können. Dies kann für die gesamte Webseite gelten, aber auch nur bestimmte Teile, etwa für den Loginbereich des Content-Management-Systems. Robots.txt ist kein verbindlicher technischer Standard, sondern eine Konvention, die die meisten großen Suchmaschinenbetreiber beachten.

Nachrichtenagentur Radio Utopie

Internet Archive will künftig Robots.txt-Einträge ignorieren

status reports:

search the archive dating back to 2010:

our news feed: