通过搜索引擎让大模型获取实时数据-实现类似 perplexity 的效果

文章目录


一、前言

汇报一下这周末的工作,主要是开发了一门课程:通过搜索引擎让大模型获取实时数据,第一次开发一门课程,难免会有很多不熟悉和做的不好的地方。

已经训练好的大模型有气数据的局限性,比如 GPT-4,只有 2023年4月之前的数据。关于最新发生的一些事情,它无法回答。
目前已经有一些公司在做类似的事情:让大模型获取最新数据,从而让用户得到更加满意的答案,比如 perplexity。

二、初衷

这门课其实就是简单解析 perplexity 的背后原理。perplexity 不知道有没有听说过,其估值或翻番至10亿美元

text 复制代码
Perplexity AI 提供类似于 Google Search 和 Bing Search 的搜索服务,用户可以用自然语言输入问题,可以获得类似于 ChatGPT 的答案。

整体使用的效果是这样的:
通过搜索引擎获取数据,然后通过大模型总结后进行回答。

三、实现方式

搜索引擎+大模型,目前仅仅实现了后端,前段并没有做。当然了整体的效果肯定是不如 perplexity,毕竟 perplexity 有自己训练的大模型,以及要做自己的搜索引擎,另外我也没有进行任何优化。仅仅是探索 perplexity 背后的技术

四、总结

文章汇报了新开发的课程,主要涉及通过搜索引擎实现大模型获取实时数据的过程。初衷在于解析Perplexity的原理,作者介绍了该模型以及其提供的搜索服务。同时,作者也提及目前实现的局限性和技术探索的过程。

相关推荐
Python×CATIA工业智造3 分钟前
Pycaita二次开发基础代码解析:参数化模板创建与设计表驱动建模
python·pycharm·pycatia
这张生成的图像能检测吗4 分钟前
(论文速读)探索多模式大型语言模型的视觉缺陷
人工智能·深度学习·算法·计算机视觉·语言模型·自然语言处理
白应穷奇8 分钟前
编写高性能数据处理代码 01
后端·python
小蜜蜂爱编程12 分钟前
opencv 阈值分割函数
人工智能·opencv·计算机视觉
机器之心18 分钟前
闹玩呢!首届大模型对抗赛,DeepSeek、Kimi第一轮被淘汰了
人工智能·openai
杨充19 分钟前
03.接口vs抽象类比较
前端·后端
一只叫煤球的猫21 分钟前
基于Redisson的高性能延迟队列架构设计与实现
java·redis·后端
卡尓22 分钟前
使用 Layui 替换 Yii 基础模板的默认 Bootstrap 样式并尝试重写导航栏组件
后端
新智元23 分钟前
Claude Opus 4.1 代码实测惊人!OpenAI 开源模型却只会写屎山?
人工智能·openai
攻城狮7号26 分钟前
GPT-5的诞生之痛:AI帝国的现实危机
人工智能·深度学习·openai·gpt-5·sam altman