ArchiveBox:网站归档平台
ArchiveBox 是基于 Python 的强大网页归档解决方案,可以自动把网页变成静态页面(HTML、PDF、图片),并自动提取和保存文本、音频等内容,可以用来做镜像站、档案馆、离线阅读等。
开源地址:https://github.com/ArchiveBox/ArchiveBox
使用ArchiveBox查看存档内容:
archivebox?server?0.0.0.0:8000????????????# use the interactive web UI
archivebox list?'https://example.com'?????# use the CLI commands (--help for more)
ls ./archive/*/index.json?# or browse directly via the filesystem