通过搜索引擎让大模型获取实时数据-实现类似 perplexity 的效果

文章目录


一、前言

汇报一下这周末的工作,主要是开发了一门课程:通过搜索引擎让大模型获取实时数据,第一次开发一门课程,难免会有很多不熟悉和做的不好的地方。

已经训练好的大模型有气数据的局限性,比如 GPT-4,只有 2023年4月之前的数据。关于最新发生的一些事情,它无法回答。
目前已经有一些公司在做类似的事情:让大模型获取最新数据,从而让用户得到更加满意的答案,比如 perplexity。

二、初衷

这门课其实就是简单解析 perplexity 的背后原理。perplexity 不知道有没有听说过,其估值或翻番至10亿美元

text 复制代码
Perplexity AI 提供类似于 Google Search 和 Bing Search 的搜索服务,用户可以用自然语言输入问题,可以获得类似于 ChatGPT 的答案。

整体使用的效果是这样的:
通过搜索引擎获取数据,然后通过大模型总结后进行回答。

三、实现方式

搜索引擎+大模型,目前仅仅实现了后端,前段并没有做。当然了整体的效果肯定是不如 perplexity,毕竟 perplexity 有自己训练的大模型,以及要做自己的搜索引擎,另外我也没有进行任何优化。仅仅是探索 perplexity 背后的技术

四、总结

文章汇报了新开发的课程,主要涉及通过搜索引擎实现大模型获取实时数据的过程。初衷在于解析Perplexity的原理,作者介绍了该模型以及其提供的搜索服务。同时,作者也提及目前实现的局限性和技术探索的过程。

相关推荐
会的全对٩(ˊᗜˋ*)و4 分钟前
【数据挖掘】数据挖掘综合案例—银行精准营销
人工智能·经验分享·python·数据挖掘
云渚钓月梦未杳6 分钟前
深度学习03 人工神经网络ANN
人工智能·深度学习
在美的苦命程序员9 分钟前
中文语境下的视频生成革命:百度 MuseSteamer 的“产品级落地”启示录
人工智能·百度
___波子 Pro Max.23 分钟前
GitHub Actions配置python flake8和black
python·black·flake8
kngines25 分钟前
【字节跳动】数据挖掘面试题0007:Kmeans原理,何时停止迭代
人工智能·数据挖掘·kmeans
Kali_0728 分钟前
使用 Mathematical_Expression 从零开始实现数学题目的作答小游戏【可复制代码】
java·人工智能·免费
贾全35 分钟前
第十章:HIL-SERL 真实机器人训练实战
人工智能·深度学习·算法·机器学习·机器人
每日摸鱼大王40 分钟前
互联网摸鱼日报(2025-07-01)
人工智能
时序数据说43 分钟前
为什么时序数据库IoTDB选择Java作为开发语言
java·大数据·开发语言·数据库·物联网·时序数据库·iotdb
君爱学习1 小时前
RocketMQ延迟消息是如何实现的?
后端