事情是这样的。前几天整理电脑文件,发现一个叫 “WeChat备份” 的文件夹。点开一看,全是手机微信的聊天记录。闲着也是闲着,就想着用Python跑一跑,看看自己过去一年到底聊了什么。
先说说怎么把数据弄出来。微信聊天记录需要备份到电脑。用官方工具把聊天记录导出成txt格式。文件很大,差不多有几百兆。打开一看,密密麻麻全是时间、人名和消息。
我的思路很简单。一行一行读文件,把每条消息拆开。时间、发送者、内容。写个正则匹配。把符合“哈哈哈”、“哈哈”、“haha”、“笑哭表情”这类词全抓出来。再按月份分组统计。
代码写好后,扔进去跑。大概等了三四分钟。结果出来,我自己都愣了一下。
过去一年,我一共说了 1623次 哈哈哈。平均一天说4次多。最多的是一个叫“死党群”的群聊,贡献了差不多一半的数量。里面有两个朋友,一个人就发了三百多个哈哈哈。看来大家都很会用笑声填补说话的空隙。
再看具体分布。一月和二月最少。那时正好在忙项目收尾。每天加班到很晚,根本没心思嘻哈。三月份突然暴涨,因为组了个饭局,群里一直在发搞笑视频。夏天的时候哈哈哈次数也很多。大概是因为天热,晚上常跟朋友聊天吹水。
最有意思的是,我发现自己对不同的人说话的“哈哈哈”风格完全不一样。跟家人聊天基本不怎么说哈哈哈,最多“嗯嗯知道了”。跟同事聊天,哈哈哈更多是配合气氛。“这个方案不错哈哈哈”、“周末加班吗哈哈哈”。这种属于社交型笑声。跟朋友聊天,哈哈哈就是真笑。看到搞笑段子,或者聊到以前干的蠢事,那哈哈是真的收不住。
有个细节挺戳我的。翻到十月份某一天,我看到一条消息。对方说“我妈住院了”。我当时回的是“会好的,别担心”。后面跟着一条“嗯”。翻遍那天的记录,一个哈哈哈都没有。人在真正关心别人的时候,笑是憋住的。
分析完这些数据,我对着屏幕发了一会儿呆。原来自己一年说了这么多哈哈哈。有些是真心,有些是应付。有些是尴尬,有些是开心。像一面镜子,照出了我这一年的情绪轨迹。
我又想了想,人为什么喜欢说哈哈哈。大概因为它最简单。比“我同意”轻松。比“你说得对”随意。比“你真好笑”直接。三个字一打,气氛瞬间变宽松。谁不喜欢跟一个爱笑的人聊天呢。
最后我把结果截图发到死党群里。朋友说“这不就是你的嘴替嘛哈哈哈”。我也跟着打了一个哈哈哈。这一次,是真笑。
你也要不要试试看,用Python翻翻自己的微信备份。看看过去一年,你说了多少次哈哈哈。