Archive.org è, a tutti gli effetti, una biblioteca online creata dalla Internet Archive di San Francisco nel 1996 con lo scopo di fornire un accesso universale alla conoscenza; questa organizzazione no profit raccoglie opere pubblicate per metterle a disposizione in formato a chiunque nel mondo abbia un accesso a Internet.
Per molti è famosa soprattutto per aver iniziato a salvare il contenuto pubblicato su siti web allo scopo di creare un enorme archivio che conta ad oggi, dopo 21 anni di attività, qualcosa come più di 305 miliardi di pagine internet rintracciabili utilizzando, nel motore di ricerca, il nome del dominio del sito per il quale siamo interessati a vedere i cambiamenti nel tempo.
Per semplificare, indicizza i siti come Google e gli archivia per data sul calendario.
Al contrario di Google, le pagine salvate risiedono sui server di Archive.org che ne restituiscono la copia fedele di come si presentavano quando sono state archiviate; per un lavoro simile è necessario uno spazio d’immagazzinamento impressionate il quale, considerando tutte le altre tipologie di risorse presenti, supera i 30 Petabytes di spazio web sul server per copia (salvano due copie di ogni pagina…).