通过搜索引擎让大模型获取实时数据-实现类似 perplexity 的效果

文章目录


一、前言

汇报一下这周末的工作,主要是开发了一门课程:通过搜索引擎让大模型获取实时数据,第一次开发一门课程,难免会有很多不熟悉和做的不好的地方。

已经训练好的大模型有气数据的局限性,比如 GPT-4,只有 2023年4月之前的数据。关于最新发生的一些事情,它无法回答。
目前已经有一些公司在做类似的事情:让大模型获取最新数据,从而让用户得到更加满意的答案,比如 perplexity。

二、初衷

这门课其实就是简单解析 perplexity 的背后原理。perplexity 不知道有没有听说过,其估值或翻番至10亿美元

text 复制代码
Perplexity AI 提供类似于 Google Search 和 Bing Search 的搜索服务,用户可以用自然语言输入问题,可以获得类似于 ChatGPT 的答案。

整体使用的效果是这样的:
通过搜索引擎获取数据,然后通过大模型总结后进行回答。

三、实现方式

搜索引擎+大模型,目前仅仅实现了后端,前段并没有做。当然了整体的效果肯定是不如 perplexity,毕竟 perplexity 有自己训练的大模型,以及要做自己的搜索引擎,另外我也没有进行任何优化。仅仅是探索 perplexity 背后的技术

四、总结

文章汇报了新开发的课程,主要涉及通过搜索引擎实现大模型获取实时数据的过程。初衷在于解析Perplexity的原理,作者介绍了该模型以及其提供的搜索服务。同时,作者也提及目前实现的局限性和技术探索的过程。

相关推荐
冬奇Lab3 分钟前
OpenClaw 源码精读(2):Channel & Routing——一条消息如何找到它的 Agent?
人工智能·开源·源码阅读
冬奇Lab4 分钟前
一天一个开源项目(第38篇):Claude Code Telegram - 用 Telegram 远程用 Claude Code,随时随地聊项目
人工智能·开源·资讯
JavaGuide21 分钟前
7 道 RAG 基础概念知识点/面试题总结
前端·后端
桦说编程32 分钟前
从 ForkJoinPool 的 Compensate 看并发框架的线程补偿思想
java·后端·源码阅读
孟健1 小时前
Karpathy 用 200 行纯 Python 从零实现 GPT:代码逐行解析
python
canonical_entropy1 小时前
AI Agent 的演进之路:从对话到自主代理操作系统
低代码·aigc·agent
格砸1 小时前
从入门到辞职|从ChatGPT到OpenClaw,跟上智能时代的进化
前端·人工智能·后端
可观测性用观测云2 小时前
可观测性 4.0:教系统如何思考
人工智能
EdisonZhou2 小时前
MAF快速入门(18)Agent Skill 快速开始
llm·aigc·agent