17
IDLJ at det kgl. Bibliotek arkiverer det danske internet
(netarkivet.dk)
For debat og nyheder omkring teknologi af alle former.
Spændende. De ignorerer stadig robots.txt da den, deres udsagn, ville forhindre dem i at opsamle nok af siderne til at kunne gendanne dem ordentligt. Dog skriver de at de som udgangspunkt laver mindre crawls for at lure om siden er aktiv og hvis den er det så besøger de den oftere