Archive.today

site web d'archivage
(Redirigé depuis Archive.is)

Archive.today, anciennement archive.is, est un site web d'archivage des pages du web. Il fonctionne en utilisant Apache Hadoop et Apache Accumulo.

Logo de Archive.today

Image illustrative de l’article Archive.today

Adresse Site officiel
Publicité non
Type de site Archivage web
Langue français
Inscription non
Lancement 2012
État actuel actif

Créateur

modifier

Parce que le site ne donne aucune indication sur son créateur ou sur son modèle économique[1], certaines personnes dont le blogueur Jani Patokallio se sont mises à la recherche de son créateur qui pourrait être un certain Denis Petrov[2] basé à New-York.

En , le site fait l'objet d'une enquête du Federal Bureau of Investigation pour identifier ses exploitants[3].

Particularité

modifier

La particularité du site est de capturer à la demande les pages web page par page afin de ne pas être affecté par l'éventuelle présence d'un fichier robots.txt[4]. Il est par conséquent impossible d'interdire l'archivage de tout site, ce qui explique les critiques fréquentes à son encontre.

Retrait des liens de Wikipédia

modifier

Début 2026, une consultation menée sur la version anglophone de Wikipédia[5] a abouti à un consensus appelant à l'inscription d'archive.today sur liste noire. Les contributeurs wikipedia procèdent à la suppression d'environ 695 000 liens vers le site pour leur substituer les sources originales ou des archives fiables, comme Wayback Machine d'Internet Archive[6].

Cette décision est la conséquence de plusieurs comportements problématiques du gestionnaire du site ; ce dernier avait inséré du code dans son captcha pour que le visiteur d'archive.today participe à une attaque par déni de service contre le blog de Jani Patokallio, un journaliste qui tentait de l'identifier[7],[8],[9].

Références

modifier
  1. (en) Archive.Today, « FAQ »  , sur Archive.Today (consulté le )
  2. (en) TrueDetective, « On which country are the creators and servers of archive.today / archive.is based? »  , sur Stack Exchange (consulté le )
  3. Raphaël Raffray, « Qui se cache derrière le mystérieux site Archive.today? Le FBI mène une enquête pour lever le voile sur ce site qui permet d'accéder gratuitement aux médias payants »  , sur BFM TV, (consulté le )
  4. (en) « Comparison of web archiving services », sur dandascalescu.com, (consulté le ).
  5. (en) « Wikipedia:Requests for comment/Archive.is RFC 5 », dans Wikipedia, (lire en ligne)
  6. (en) Jon Brodkin, « Wikipedia blacklists Archive.today, starts removing 695,000 archive links », sur Ars Technica, (consulté le )
  7. (en) jpatokal, « archive.today: On the trail of the mysterious guerrilla archivist of the Internet », sur Gyrovague, (consulté le )
  8. (en-US) Anthony Ha, « Wikipedia blacklists Archive.today after alleged DDoS attack », sur TechCrunch, (consulté le )
  9. Korben, « Wikipedia vs archive.today - 700 000 liens en sursis - Korben », sur Le site de Korben, (consulté le )

Voir aussi

modifier

Articles connexes

modifier

Liens externes

modifier