前言
或许年少时,总有些遗憾留在身边。
现在的人工智能越来越强大。能否用如今的技术来找回当初的那份遗憾,回顾当初的那份纯真。
当然是有办法的。
扣子是新一代的 AI Bot 开发平台,只要你有想法,都可以用扣子快速、低门槛搭建专属于你的 Chatbot,并一键发布到豆包、飞书、微信服务号等各个渠道!
做一个专门属于我们回忆的一个bot
创建bot
我们进入coze
点击创建bot
创建成功后会跳转到下面的界面
之后我们需要对知识库进行一个搭建
知识库的搭建
首先是数据整合阶段
这里用到了留痕 (memotrace.cn)
我深信有意义的不是微信,而是隐藏在对话框背后的一个个深刻故事。未来,每个人都能拥有AI的陪伴,而你的数据能够赋予它有关与你过去的珍贵记忆。我希望每个人都有将自己的生活痕迹👨👩👦👚🥗🏠️🚴🧋⛹️🛌🛀留存的权利,而不是将之遗忘💀。
首先进行数据库的一个解密
之后我们进行导出记录导出为txt
之后我们要对数据进行一个处理
把时间之类的东西给去掉
这里用到python
python
import re
# 定义函数去除非汉字字符
def remove_non_chinese(text):
return re.sub(r'[^\u4e00-\u9fa5\s]', '', text)
# 读取文件
with open('1.txt', 'r', encoding='utf-8') as file:
content = file.read()
# 使用正则表达式匹配时间戳和对话内容
pattern = r'(\d{4}-\d{2}-\d{2} \d{2}:\d{2}:\d{2} [A-Za-zʜ.]+)\n(.*?)(?=\n\d{4}-\d{2}-\d{2} \d{2}:\d{2}:\d{2} [A-Za-zʜ.]+|\Z)'
matches = re.findall(pattern, content, re.DOTALL)
# 将对话内容写入新文件,处理连续换行
with open('filtered_conversations.txt', 'w', encoding='utf-8') as new_file:
for i, match in enumerate(matches):
conversation = match[1].strip()
chinese_conversation = remove_non_chinese(conversation)
if chinese_conversation:
new_file.write(chinese_conversation)
# 如果不是最后一行对话,则添加换行
if i < len(matches) - 1:
new_file.write('\n')
# 如果不是最后一行对话且下一行对话不为空,则添加一个额外的换行
elif i < len(matches) - 1 and matches[i+1][1].strip():
new_file.write('\n')
之后创建知识库
新增单元,把之前的txt上传上去
之后等待数据处理完成就可以
当然如果你想更加的精准的话,那么需要对分片的内容进行一个更加优质的处理。
我这里就不演示了。
至此这个机器人就搭建完成了。
最后我想说,勇敢的去追求遗憾,没什么丢人的,可以怀念,但是还是要向前看的。+