
得益于开源项目:
https://github.com/LC044/WeChatMsg 现在导出微信聊天记录已经是一件相当简单的事情了。但是这个项目跑出的词云好像有点问题,好像聊天记录不完整一样。所以我去找了可以读取 SQLite 的软件,读了他解码出来的数据库文件。
执行 SQL:
-- MicroMsg.db 文件中的 Contact 表存的用户信息,先根据备注查微信 ID SELECT UserName FROM Contact WHERE Remark=? -- Msg.db 中的 MSG 表存的历史聊天记录 SELECT StrContent, localId, datetime(CreateTime, "unixepoch", "localtime") as CreateTime FROM MSG WHERE StrTalker = ? AND Type = 1 AND StrContent NOT like "%[%" ORDER by CreateTime asc 然后发现数据是全量的,但是词云不准确,不知道什么原因。迫于不想读源码,直接找了个词云工具,重新生成。
感谢开源项目:
https://github.com/fuqiuai/wordCloud https://github.com/silsuer/wordcloud

一键提取微信聊天记录,生成 HTML 、Word 文档永久保存,还能生成微信年度聊天报告
微信聊天记录只是备份就太无聊了,一键生成属于自己的词云图,让我们玩点有意思的
所用到的工具被我放在公众号里了,如果有兄弟感觉被冒犯,那对此我感到抱歉,请联系站长帮我移动到推广节点。
赶紧出来解释一下: 词云只是根据词频把一些词生成到一起的。实际上那几个词可能并不挨着,不要太污喂! 词云只是根据词频把一些词生成到一起的。实际上那几个词可能并不挨着,不要太污喂! 词云只是根据词频把一些词生成到一起的。实际上那几个词可能并不挨着,不要太污喂!
此外,公众号在教程的链接里,这里也放一个图片吧,那就。 
1 sunny352787 2023 年 12 月 13 日 MD ,路过还能被电子脚踹一下... |
2 YaD2x 2023 年 12 月 13 日 方法学会了,请问老婆哪里找? |
3 AFOX 2023 年 12 月 13 日 via Android shit ,单身狗看不得这个,但是创意很好 |
4 littleJohn 2023 年 12 月 13 日 省流:老公 老婆 老板 哈哈哈 |
5 pianjiao 2023 年 12 月 13 日 图碎了。 公众号在哪儿 |
6 proxychains 2023 年 12 月 13 日 单身喵看不得这些 |
7 cheava 2023 年 12 月 13 日 第一张图右臂部分有点意思 |
8 vagusss 2023 年 12 月 13 日 不错 |
9 Tumblr 2023 年 12 月 13 日 |
10 webjourneyer 2023 年 12 月 13 日 这个有点意思 |
11 murmur 2023 年 12 月 13 日 我想那个了 吃了 嗯 来! 在一起 多 要 |
12 jonahtan 2023 年 12 月 13 日 有点意思 |
13 zfyime 2023 年 12 月 13 日 只看到了 老婆 老公 想要 给我 |
14 dddd1919 2023 年 12 月 13 日 老婆 你 没有 这个 |
15 miemie666 2023 年 12 月 13 日 闭眼都知道要歪楼了 |
16 graetdk 2023 年 12 月 13 日 |
24 jonahtan 2023 年 12 月 13 日 not support for macOS base on apple chip 劝退 |
26 ryan961 2023 年 12 月 13 日 单身狗手贱点进来了,你可真该死呀 |
27 billzhuang 2023 年 12 月 13 日 hahhahahahahahahahhahaha |
28 goddamhucker 2023 年 12 月 13 日 鼠人看不得这些 |
29 JARKECHONG 2023 年 12 月 13 日 |
30 Tezos 2023 年 12 月 13 日 emmmmmmm |
31 angenin 2023 年 12 月 13 日 买菜必涨价!!! |
32 RobertLyu 2023 年 12 月 13 日 行了,我知道你们很恩爱了,带着我的祝福快快离开吧。 |
33 MRG0 2023 年 12 月 13 日 qq 能实现吗,好像有消息漫游,比较狗屎 |
34 Donahue 2023 年 12 月 13 日 核凸 报警!!! |
35 wqhui 2023 年 12 月 13 日 特意切个代理看图 |
36 itianjing 2023 年 12 月 13 日 两年前求婚的时候也搞了这个,导出微信聊天记录废了好大的劲 |
38 DAGU1182810784 2023 年 12 月 13 日 哥们儿不拿咱们当外人儿啊 |
40 szyp 2023 年 12 月 13 日 https://github.com/myth984/wechat-report 两年前用过一个类似的 |
41 foreverpp50 2023 年 12 月 13 日 为什么聊天记录不用蓝奏云啊,阿里云盘还要登录才能下载 |
42 Dogergo OP @foreverpp50 蓝奏云不让我放 exe |
43 jethroX 2023 年 12 月 13 日 我的全险半挂灯好像不亮了,能不能请你帮我去看一下? |
44 foreverpp50 2023 年 12 月 13 日 @Dogergo 打包放不行吗 |
45 Dogergo OP @foreverpp50 可以去[github]( https://github.com/LC044/WeChatMsg)的 release 里下载,我回头想办法看看压缩了能不能把地址改一下 |
47 0xGnaixEuy 2023 年 12 月 13 日 via iPhone 酷酷酷 |
48 pianjiao 2023 年 12 月 13 日 看不见图 ,也不知道什么鬼 |
49 456789 2023 年 12 月 13 日 via Android 老公 老婆 我想 那个 嚯哈哈哈哈哈,呵 tui |
50 Dogergo OP @foreverpp50 good ,感谢提供,已经放上了蓝奏云的地址 |
51 Dogergo OP @pianjiao 就 https://imgur.com 图床的图,看不到的话你可以点教程里那个词云的连接,我在微信推文里也有放这个图 |
53 mh 2023 年 12 月 13 日 两年前看到过类似的帖子,当时我也弄了一下,还挺费劲的哈哈 |
54 cat9life 2023 年 12 月 13 日 这个有点意思 就是聊天记录不全了 |
56 badbye 2023 年 12 月 13 日 老婆我嗯了? |
57 idealhs 2023 年 12 月 13 日 我想那个了 |
58 shm7 2023 年 12 月 13 日 词云本身有开源的库,问题是你想从聊天记录提取些什么。 一般商业要提取一些关键词,你这都是 老婆我... ;) |
59 palxie 2023 年 12 月 13 日 我想那个了 真的一眼就看到 |
60 moeik 2023 年 12 月 13 日 op 你好 我发现教程有断层啊,聊天记录解密了 导出为?,在词云加载过程中选的聊天记录是怎样的格式? |
61 Dogergo OP @moeik 1.不用导出,解密完成之后`MemoTrace-0.2.7.exe`这个软件所在目录下会生成`app`->`dataBase`->`msg`文件夹,里边都是以.db 结尾的 Sqlite 数据库文件,把`MSG.db`和`MicroMsg.db` 2.把这两个 db 文件复制一下粘贴到词云软件解压出来的文件夹下的`db`文件夹里,然后运行词云软件就好了。可以看我生成词云那篇文章底部是有视频教程的 |
62 Martens 2023 年 12 月 13 日 支持语音吗?聊天记录有很多语音 |
63 Rorysky 2023 年 12 月 13 日 建议把 无法单独成语素的语气词过滤掉 |
65 clifftts 2023 年 12 月 13 日 我为什么会被这个帖子强行拉进来,吃一波狗粮,wtf |
66 Dogergo OP @Martens 这个要去看开源项目`https://github.com/SuxueCode/WechatBakTool`这个项目目前是已经实现了解密语音 |
68 dsggnbsp 2023 年 12 月 13 日 省流:我 你 啊 |
69 KimiArthur 2023 年 12 月 13 日 via Android 导出简单吗?有没稍微详细点的原理解释? |
70 echoyangjx 2023 年 12 月 13 日 via Android 逛 v2 还能吃狗粮 |
71 liqingyou2093 2023 年 12 月 13 日 省流: 我想那个了 |
72 lele140 2023 年 12 月 13 日 怎么屏蔽调一些语气助词,比如:啊,吧,哦 |
73 spaceman 2023 年 12 月 13 日 很酷,但是我看到了一句:“我想那个了。” |
75 Dogergo OP @KimiArthur 原理复杂,操作简单。这和搞开发是一样的,尽可能降低用户侧的学习成本。要研究原理的话,可以去参考`https://mp.weixin.qq.com/s/4DbXOS5jDjJzM2PN0Mp2JA` |
76 aitianci 2023 年 12 月 13 日 豆沙了豆沙了 |
77 StoneHuLu 2023 年 12 月 13 日 有没有 qq 聊天记录的,我和我老婆都不用微信的 |
78 lixiangyang9b319 2023 年 12 月 13 日 via iPhone 牛逼,感谢哦大哥 |
79 MilkShake 2023 年 12 月 13 日 从聊天记录,看到了很多开车的记录。 |
80 iv2ex 2023 年 12 月 13 日 好像没有 macos 的? |
83 Yasuke 2023 年 12 月 13 日 可以统计群聊的记录吗?(化身产品经理 |
84 kakki 2023 年 12 月 13 日 还好没看到 dirty talk |
85 kumastudio 2023 年 12 月 13 日 赛博狗粮 |
86 jr55475f112iz2tu 2023 年 12 月 13 日 via Android 其实在 LLM 出来之后,分词这类中文 NLP 特有的中间过程已经变得没那么必要了… |
87 Loserzhu 2023 年 12 月 13 日 我不吃牛肉(掏枪 |
88 edinina 2023 年 12 月 13 日 给我都看兴奋了 |
89 AsyncX 2023 年 12 月 13 日 我们也是你们 play 的一环吗 |
90 ovtfkw 2023 年 12 月 13 日 mac 微信不可以吗 |
91 bao3 2023 年 12 月 13 日 Geekm 的浪漫。 跳一下 tone:我和我老婆的聊天记录,全是性相关的,还聊到过我想上她姐…… |
92 hertzry 2023 年 12 月 13 日 分词之后可以手动去掉一下没用的东西,然后再画图。 |
94 ChicC 2023 年 12 月 13 日 只看到了 老婆 老公 想要 给我 |
95 ttyhtg 2023 年 12 月 14 日 via Android 作为单身狗我居然敢点开,还是祝福楼主 |
96 programMrxu 2023 年 12 月 14 日 祝福楼主了 |
97 mingring 2023 年 12 月 14 日 我跑出来怕都是敏感词 |
98 beijiaoff 2023 年 12 月 14 日 我用的飞书文档的多维表格,可以自动生成词云。 |