Cursor + MCP + 文档智能体,疯了,太爽了呀!!!

Cursor + MCP + 文档智能体,疯了,太爽了呀!!!

toc

一、基础信息同步

1、Cursor

Cursor是Anysphere推出的AI编程工具 ,基于微软开源代码编辑器VS Code开发,将AI融入开发人员工作流程。它能自动用自然语言写代码,从代码库获取答案,参考特定文件文档,还能预测编辑内容。开发者通过指令编写代码,简单提示词就能更新类或函数。

2、MCP

MCP 即模型上下文,在人工智能领域意义重大。它指的是在模型运行期间,为其提供的相关信息集合。这些信息能帮助模型更好地理解任务需求、处理数据和做出决策。比如在对话式 AI 中,模型上下文包含之前的对话内容,使 AI 能结合前文准确回复。在图像识别里,上下文信息可以是图像的拍摄背景等。良好的 MCP 可提升模型的准确性和泛化能力,让其在复杂多变的实际场景中更出色地完成任务,从而为用户带来更优质、智能的服务体验。

3、智能体

AI智能体是一种基于人工智能技术构建的智能系统。它能够感知环境并做出决策,以实现特定目标。通过机器学习算法,AI智能体可以从大量数据中学习规律和模式,不断提升自身的性能。它具备自主性,能够在一定范围内独立行动,还能与人类或其他智能体交互。例如,在智能家居场景中,AI智能体可以自动调节室内温度、灯光等设备,根据用户习惯提供个性化服务,为人们的生活和工作带来便利。

4、RAG知识库

RAG知识库是一种结合检索(Retrieval)和生成(Generation)技术的知识库系统。它通过检索模块从海量数据中快速找到与问题最相关的片段,然后利用生成模块对这些片段进行整合和优化,生成准确、流畅的答案。这种结合方式既利用了检索的高效性和准确性,又发挥了生成的灵活性和创造性。RAG知识库广泛应用于智能问答、文本生成等领域,能够为用户提供高质量的知识服务,帮助人们快速获取所需信息,提升工作效率和知识获取的便捷性。

二、效果图

1、概念流程图

2、实际效果展示图

三、完整流程

1、文档智能体搭建

第一步:采集目标文档

我这里使用爬虫采集,推荐爬虫框架:DrissionPage - drissionpage.cn/。

哈哈哈哈!我用它自己抓取了它自己的文档!

第二步:文档数据清洗

我自己开发了一个工具(可以分享出来,思路很简单,就是调用大模型批量重写),支持对文件批量上传、大文件切割、调取大模型批量清洗、生成清洗后新文件列表、批量下载清洗后的文档。

清洗后的文件列表
原文件
清洗后

第三步:创建文档智能体

将文档上传到知识库,简单配置下就可以了。用过扣子,觉得不太好,后来使用阿里云百炼平台,觉得很好!

阿里云百炼平台:bailian.console.aliyun.com/

上传文档
创建文档智能体

第四步:发布智能体

发布之后,可验证下API调用是否正常。推荐Apifox。

2、MCP 服务搭建

看这个教程

Model Context Protocol(MCP) 编程极速入门

github.com/liaokongVFX...

3、集成到Cursor

参考配置,这是本地的 MCP 服务。

json 复制代码
{
    "chat_with_drissionpage": {
      "command": "cmd",
      "args": [
        "/c",
        "cd /d C:\\MyGitHub\\mcp_curl && .venv\\Scripts\\python.exe main.py"
      ]
    },
}

4、享受你的作品

四、进一步交流

摸鱼写的,很是仓促,多多包涵。有问题请评论或私信。

相关推荐
丁先生qaq11 分钟前
热成像实例分割电力设备数据集(3类,838张)
人工智能·计算机视觉·目标跟踪·数据集
红衣小蛇妖33 分钟前
神经网络-Day45
人工智能·深度学习·神经网络
KKKlucifer1 小时前
当AI遇上防火墙:新一代智能安全解决方案全景解析
人工智能
DisonTangor1 小时前
【小红书拥抱开源】小红书开源大规模混合专家模型——dots.llm1
人工智能·计算机视觉·开源·aigc
浠寒AI3 小时前
智能体模式篇(上)- 深入 ReAct:LangGraph构建能自主思考与行动的 AI
人工智能·python
weixin_505154463 小时前
数字孪生在建设智慧城市中可以起到哪些作用或帮助?
大数据·人工智能·智慧城市·数字孪生·数据可视化
Best_Me074 小时前
深度学习模块缝合
人工智能·深度学习
YuTaoShao4 小时前
【论文阅读】YOLOv8在单目下视多车目标检测中的应用
人工智能·yolo·目标检测
算家计算4 小时前
字节开源代码模型——Seed-Coder 本地部署教程,模型自驱动数据筛选,让每行代码都精准落位!
人工智能·开源
伪_装4 小时前
大语言模型(LLM)面试问题集
人工智能·语言模型·自然语言处理