作者:苍何,前大厂高级 Java 工程师,阿里云专家博主,CSDN 2023 年 实力新星,土木转码,现任部门技术 leader,专注于互联网技术分享,职场经验分享。
🔥热门文章推荐:
大家好,我是苍何。马上是和老婆结婚三周年纪念日,这些天可没少操心礼物的事情,要想一份有意义的礼物还是不容易的。
思来想去,也没有好的点子。刚好在逛 GitHub 的时候看到了一个有意思的项目,可以导出微信历史聊天记录,于是脑子灵光一闪,何不把我们结婚三年来的微信聊天记录做成一本书或是纪念册,给她一份不一样的惊喜,也是很有意义的。
除了做成纪念册,还可以单独建立一个网站,让他们实时来展示我们的所有聊天记录,也充分发挥了程序员的浪漫。
今天,纪念册到了,网站也刚好做好了,老婆看到后,很感动。哈哈,开心\(^ ^)/
也给大家看看最终效果。
从想法产生到落地,从聊天记录的全量导出到信息的筛选,再到封面的设计和书籍的排版,再到网站的搭建,前前后后花了几晚的时间,特别是因为三年的聊天记录实在太大,一共 121034 条记录,文件大小超过了 2 个 G(天知道我们到底发了多少视频和图片及语音😂)中间还是遇到了一些棘手的问题。
最头疼的还属将 HTML 转成 PDF ,因文件实在太大,市场上几乎所有付费的或免费的转换软件我都试过了,都以失败告终,用谷歌自带的转换,直接就把浏览器搞崩溃了。
后来,干脆,在开源框架的基础上做了改造,采用了「流式处理」加「分区切片」「向量分割」等一系列措施,总算是全量导出成功。
朋友圈分享后,看很多朋友对此还挺感兴趣的,纷纷表示,自己也要去给心爱的她来个大礼包,于是苍何就此做个简单分享。
其实整体而言仅要四步,即可完成.
在导出之前需要将微信聊天记录备份到电脑,大家知道,如果更换手机,聊天记录需要做迁移,因为我们的聊天信息都是存放在的本地手机,所以,要想数据不丢失,做好备份必不可少。
如果采用微信再带的备份,聊天记录文件实质上是加密的文件,是没法基于此做文章的,所以我们最需要做的是能将加密数据解密。
拿苹果生态来说,不加密备份这件事,看起来更简单。
这一步是最核心的一步,数据要能正常导出,才会有后话。
其实有不少开源软件已经实现了这个效果,在 windows 上,最火的莫过于这款软件了:https://github.com/LC044/WeChatMsg,在 GitHub 上获得了 20.5k 的 star。
我最开始了解的也是这款,看很多自媒体大佬也在强力推这软件,但我体验下来有如下一些问题:
1、无法支持 mac
2、windows 导出吃版本
3、在解密时始终卡在 97%,截止 2024-01-16,作者开源的软件说明中依旧有不少评论是和我遇到同样的问题
4、导出速度较慢(有些网友说的)
基本上体验下来,我没成功解密我的聊天记录。于是我又搜索,也找到了诸如:https://github.com/greycodee/wechat-backup 等,但都无法完全满足我的最基本的诉求。
最后还是在油管搜到一个小众博主分享的小众的开源软件,才达到我的需求。那就是 WechatExporter,特别是对 mac 简直不要太友好,由于是基于 C++写的,速度快的不行,十几万条的聊天记录一分钟不到就全部导出完了。
但软件的 star 却不多,由此可见,不是越出名的越适合你。就这样,靠着小众的博主推荐的小众的软件,我完成了第一步。
安装很简单,但也可能会遇到一些问题,这里给大避个坑。
点击仍要打开:
授权完全访问:
可以直接设置导出样式为 pdf,但大文件,直接就会爆掉,不要想着在这里直接导出 pdf。
主要用到工具是 PS 以及 AI 工具,选择好封面和背景图,进行排版和润色,这部分花了一些时间,因为对排版设计实在不很了解,也想过直接让淘宝设计算了,但店家说至少要 300,算了,还是自己来吧。
网站发布,我用了两种方式,一是利用 GitHub pages 进行发布,但访问速度有些慢,另外一种方式是,直接简单写个 web 项目来直接服务器发布,也方便之后的 AI 分析等操作。
这其实还只是第一步,下一步我打算定时上传聊天信息到后台,并用 AI 模型进行训练,将聊天记录作为知识库,AI 可以帮生成聊天年度报告,分析出这一年来,聊的最频繁的话题,出现最多的词,最晚聊天的时间, 以及各种分析报告,每年年终的时候,像各大平台一样,将我们的聊天做个年终总结。
此项目也打算放在 GitHub 上开源,方便有同样需求的小伙伴可以拿来即用,给你的她一份惊喜,也记录着你们的爱情。想想都是一件特别浪漫的事。
好了,今天的分享就到这,如果对你有帮助,还请给个小赞。
创作不易,如果本文对你有帮助,欢迎点赞、收藏加关注,你的支持和鼓励,是我创作的最大动力。