coze扣子体验,搭建一个你记忆里的"他/她"的聊天机器人

前言

或许年少时,总有些遗憾留在身边。

现在的人工智能越来越强大。能否用如今的技术来找回当初的那份遗憾,回顾当初的那份纯真。

当然是有办法的。

主页 - Coze

扣子是新一代的 AI Bot 开发平台,只要你有想法,都可以用扣子快速、低门槛搭建专属于你的 Chatbot,并一键发布到豆包、飞书、微信服务号等各个渠道!

做一个专门属于我们回忆的一个bot

创建bot

www.coze.cn/

我们进入coze

点击创建bot

创建成功后会跳转到下面的界面

之后我们需要对知识库进行一个搭建

知识库的搭建

首先是数据整合阶段

这里用到了留痕 (memotrace.cn)

我深信有意义的不是微信,而是隐藏在对话框背后的一个个深刻故事。未来,每个人都能拥有AI的陪伴,而你的数据能够赋予它有关与你过去的珍贵记忆。我希望每个人都有将自己的生活痕迹👨‍👩‍👦👚🥗🏠️🚴🧋⛹️🛌🛀留存的权利,而不是将之遗忘💀。

首先进行数据库的一个解密

之后我们进行导出记录导出为txt

之后我们要对数据进行一个处理

把时间之类的东西给去掉

这里用到python

python 复制代码
import re
​
# 定义函数去除非汉字字符
def remove_non_chinese(text):
    return re.sub(r'[^\u4e00-\u9fa5\s]', '', text)
​
# 读取文件
with open('1.txt', 'r', encoding='utf-8') as file:
    content = file.read()
​
# 使用正则表达式匹配时间戳和对话内容
pattern = r'(\d{4}-\d{2}-\d{2} \d{2}:\d{2}:\d{2} [A-Za-zʜ.]+)\n(.*?)(?=\n\d{4}-\d{2}-\d{2} \d{2}:\d{2}:\d{2} [A-Za-zʜ.]+|\Z)'
matches = re.findall(pattern, content, re.DOTALL)
​
# 将对话内容写入新文件,处理连续换行
with open('filtered_conversations.txt', 'w', encoding='utf-8') as new_file:
    for i, match in enumerate(matches):
        conversation = match[1].strip()
        chinese_conversation = remove_non_chinese(conversation)
        if chinese_conversation:
            new_file.write(chinese_conversation)
            # 如果不是最后一行对话,则添加换行
            if i < len(matches) - 1:
                new_file.write('\n')
            # 如果不是最后一行对话且下一行对话不为空,则添加一个额外的换行
            elif i < len(matches) - 1 and matches[i+1][1].strip():
                new_file.write('\n')

之后创建知识库

新增单元,把之前的txt上传上去

之后等待数据处理完成就可以

当然如果你想更加的精准的话,那么需要对分片的内容进行一个更加优质的处理。

我这里就不演示了。

至此这个机器人就搭建完成了。

最后我想说,勇敢的去追求遗憾,没什么丢人的,可以怀念,但是还是要向前看的。+

相关推荐
g***B7384 小时前
Java 工程复杂性的真正来源:从语言设计到现代架构的全链路解析
java·人工智能·架构
期待のcode6 小时前
MyBatisX插件
java·数据库·后端·mybatis·springboot
AI浩8 小时前
【Labelme数据操作】LabelMe标注批量复制工具 - 完整教程
运维·服务器·前端
涔溪8 小时前
CSS 网格布局(Grid Layout)核心概念、基础语法、常用属性、实战示例和进阶技巧全面讲解
前端·css
2401_878454538 小时前
浏览器工作原理
前端·javascript
西陵9 小时前
为什么说 AI 赋能前端开发,已经不是选择题,而是必然趋势?
前端·架构·ai编程
华仔啊9 小时前
这 10 个 MySQL 高级用法,让你的代码又快又好看
后端·mysql
国科安芯9 小时前
AS32S601型MCU芯片电源管理(PMU)模块详解
单片机·嵌入式硬件·性能优化·架构·risc-v
码事漫谈9 小时前
国产时序数据库崛起:金仓凭什么在复杂场景中碾压InfluxDB
后端
上进小菜猪9 小时前
当时序数据不再“只是时间”:金仓数据库如何在复杂场景中拉开与 InfluxDB 的差距
后端