虽然可以通过一些文本对比的工具自己写一套代码,但感觉好麻烦。
比如保存了几百万的网页,并持续追踪内容变更,想把每个网页变更记录保存至数据库并不时查看。希望每次只保存变更而不是全文本,类似 git ,应该有类似的库吧?
比如保存了几百万的网页,并持续追踪内容变更,想把每个网页变更记录保存至数据库并不时查看。希望每次只保存变更而不是全文本,类似 git ,应该有类似的库吧?
1
jr55475f112iz2tu Nov 11, 2021
"保存了几百万的网页"
你这是爬虫数据库? |
2
jifengg Nov 11, 2021
正想说用 git ,你已经自己说了。不合适的话,找找“版本控制”还有啥的吧
|
3
sillydaddy Nov 11, 2021
用 git 吧
“将 git 版本管理,集成到自己的应用中,既可以使用多进程起「命令行」,也可以集成 git 的「库」如 libgit2”: https://git-scm.com/book/en/v2/Appendix-B%3A-Embedding-Git-in-your-Applications-Command-line-Git https://git-scm.com/book/en/v2/Appendix-B%3A-Embedding-Git-in-your-Applications-Libgit2 “将 git 用作 NoSQL 数据库,举例介绍了 git 中 commit, tree, blob 的概念”(我看了一下,还挺简单): https://www.kenneth-truyers.net/2016/10/13/git-nosql-database/ “libgit2 库还可以适配自己的后端来存储内容,比如 MySQL ,sqlite ,redis 等”: https://github.com/libgit2/libgit2-backends “libgit2 的 API 非常丰富,简直吓人”(不过应该只需要极少的几个就足够了): https://libgit2.org/libgit2/#HEAD |
4
locoz Nov 11, 2021 via Android
用工具生成.patch 文件就好了吧?
|
5
dingwen07 Nov 11, 2021 via iPhone
既然你知道什么是版本管理,那我就不说了
不过还有一个东西叫 wikipedia ,可能可以参考一下 |