12
ArchiveBox
🗃 Samoposlužena web-arhiva otvorenog koda.Uzima povijest / oznake preglednika / Pocket / Pinboard / itd., Sprema HTML, JS, PDF datoteke, medije i još mnogo toga.
- Besplatna
Budući da su suvremene web stranice složene i često se oslanjaju na dinamični sadržaj, ArchiveBox arhivira web mjesta u nekoliko različitih formata, osim onoga što javni arhivski servisi poput Archive.org i Archive.is mogu uštedjeti.ArchiveBox uvozi popis URL-ova sa stdina, udaljenog URL-a ili datoteke, a zatim dodaje stranice u lokalnu mapu arhive pomoću wget-a za stvaranje html klona koji se može pregledavati, youtube-dl za izdvajanje medija i puni primjerak Chromea bez glave za PDF,Snimka zaslona i deponiranje DOM-a i još više ... Korištenje više metoda i preglednik s dominantnim tržištem za izvršavanje JS-a osigurava da možemo uštedjeti čak i najsloženije, dotjerane web stranice u barem nekoliko visokokvalitetnih dugoročnih formata podataka.### Mogu uvesti veze iz: - Pocket, Pinboard, Instapaper - RSS, XML, JSON ili običnih tekstovnih popisa - Povijest preglednika ili oznake (Chrome, Firefox, Safari, IE, Opera i još mnogo toga) - Shaarli, Delicious, RedditSpremljeni postovi, Wallabag, Unmark.it i bilo koji drugi tekst s vezama u njemu!### Mogu spremiti sljedeće za svaku web lokaciju: - `favicon.ico` favicon stranice -` example.com / page-name.html` wget klon web stranice, sa .html dodatkom ako nije prisutan - `izlaz.pdf` Odštampan PDF stranice pomoću kroma bez glave - `screenshot.png` 1440x900 snimak stranice s kromom bez glave -` output.html` DOM Izbacivanje HTML-a nakon ispisa koristeći krom bez glave - `archive.org.txt` Link dospremljeno mjesto na archive.org - `warc /` za html + gzipped warc datoteku.gz - `media /` bilo koji mp4, mp3, titlovi i metapodaci pronađeni pomoću klona youtube-dl - `git /` bilo kojeg spremišta za github, bitbucket ili gitlab veze - `index.html` &` index.json`Datoteke HTML i JSON indeksa koje sadrže metapodatke i detalje Arhiviranje je aditivno, tako da možete zakazati `. / Archive` za redovno pokretanje i povlačenje novih veza u indeks.Sav spremljeni sadržaj statičan je i indeksiran s JSON datotekama, tako da živi vječno i lako se može analizirati, ne zahtijeva uvijek pokretani sigurnosni proces.
archivebox