coze扣子体验，搭建一个你记忆里的"他/她"的聊天机器人

前言

或许年少时，总有些遗憾留在身边。

现在的人工智能越来越强大。能否用如今的技术来找回当初的那份遗憾，回顾当初的那份纯真。

当然是有办法的。

主页 - Coze

扣子是新一代的 AI Bot 开发平台，只要你有想法，都可以用扣子快速、低门槛搭建专属于你的 Chatbot，并一键发布到豆包、飞书、微信服务号等各个渠道！

做一个专门属于我们回忆的一个bot

创建bot

www.coze.cn/

我们进入coze

点击创建bot

创建成功后会跳转到下面的界面

之后我们需要对知识库进行一个搭建

知识库的搭建

首先是数据整合阶段

这里用到了留痕 (memotrace.cn)

我深信有意义的不是微信，而是隐藏在对话框背后的一个个深刻故事。未来，每个人都能拥有AI的陪伴，而你的数据能够赋予它有关与你过去的珍贵记忆。我希望每个人都有将自己的生活痕迹👨‍👩‍👦👚🥗🏠️🚴🧋⛹️🛌🛀留存的权利，而不是将之遗忘💀。

首先进行数据库的一个解密

之后我们进行导出记录导出为txt

之后我们要对数据进行一个处理

把时间之类的东西给去掉

这里用到python

python 复制代码

import re

# 定义函数去除非汉字字符
def remove_non_chinese(text):
    return re.sub(r'[^\u4e00-\u9fa5\s]', '', text)

# 读取文件
with open('1.txt', 'r', encoding='utf-8') as file:
    content = file.read()

# 使用正则表达式匹配时间戳和对话内容
pattern = r'(\d{4}-\d{2}-\d{2} \d{2}:\d{2}:\d{2} [A-Za-zʜ.]+)\n(.*?)(?=\n\d{4}-\d{2}-\d{2} \d{2}:\d{2}:\d{2} [A-Za-zʜ.]+|\Z)'
matches = re.findall(pattern, content, re.DOTALL)

# 将对话内容写入新文件，处理连续换行
with open('filtered_conversations.txt', 'w', encoding='utf-8') as new_file:
    for i, match in enumerate(matches):
        conversation = match[1].strip()
        chinese_conversation = remove_non_chinese(conversation)
        if chinese_conversation:
            new_file.write(chinese_conversation)
            # 如果不是最后一行对话，则添加换行
            if i < len(matches) - 1:
                new_file.write('\n')
            # 如果不是最后一行对话且下一行对话不为空，则添加一个额外的换行
            elif i < len(matches) - 1 and matches[i+1][1].strip():
                new_file.write('\n')

之后创建知识库

新增单元，把之前的txt上传上去

之后等待数据处理完成就可以

当然如果你想更加的精准的话，那么需要对分片的内容进行一个更加优质的处理。

我这里就不演示了。

至此这个机器人就搭建完成了。

最后我想说，勇敢的去追求遗憾，没什么丢人的，可以怀念，但是还是要向前看的。+