这就是商战?AI原生应用的纵横捭阖;预期中的LLM颠覆为何没发生?教你构建一个糟糕的RAG系统;贾扬清如约开源;生成式AI深度报告 | ShowMeAI日报


👀日报&周刊合集 | 🎡生产力工具与行业应用大全 | 🧡 点赞关注评论拜托啦!

👀 Arc 浏览器 + Perplexity 搜索引擎:新生代AI产品开启纵横捭阖

arc.net

Arc 浏览器 是由 The Browser Company 开发的一款「充满想象力和革命性 」的新产品,以其全新的标签管理模式丝滑的交互超高的颜值等等功能备受追捧。

2023年7月正式推出 Mac 版本,2023年12月 Windows 版本开启邀测 (之前申请过的伙伴可以查下邮箱 📬

其实,Arc 浏览器一直在探索与AI的结合 。2023年10月,Arc浏览器曾推出其AI版本 Arc Max,很多AI功能的演示让人眼前一亮:比如自动总结搜索结果中的某个链接、自动重命名页面标签、自动重命名下载文件等 (但是,好像,没看到后续 🤷‍♀️

Arc Search 目前仅支持 iOS 和英文,已经上架 Apple Store,感兴趣可以尝试下~

昨天,The Browser Company 推出了最新的AI移动应用 Arc Search ,把浏览器、搜索引擎、AI聊天机器人、海量网站这些本来独立的产品进行了深度整合,提供了非常独特的移动端搜索体验:

用户只输入查询内容并点击 Browse for me 按钮,就可以获得一个包含准确答案、相关链接等完整信息的网页

这与其他手机浏览器的AI功能非常不同 !谷歌、bing、百度 (简单搜索的AI版本) 等移动应用的AI功能,是其桌面功能的平行迁移。但是 Arc Search 向前走了一步,基于AI将信息进行了更深度地整合,更极致地提升了准确率和效率!目前 X 上好评非常多!各种榜单爬升也非常迅速 🎉🎉🎉

www.perplexity.ai

Wait!!! Arc Search 的搜索体验,感觉有点眼熟?! 对的,Perplexity 早几个月已经发现这种模式并将其成功产品化了 👀

然后!再往前翻,还有一则消息非常有意思。1月26日,Arc 浏览器 (桌面应用) 发推宣布与 Perplexity 展开合作,只需要在其 Search Engine 设置中选择 Perplexity,就可以默认使用了, 👆 如上图所示。

看来,关于未来的浏览器长啥样,两家公司的理念「重合度」很高啊~

search.lepton.run

github.com/leptonai/se...

上周 ShowMeAI日报 介绍了贾扬清创业公司的最新进展,以及他想通过 Lepton AI 这个云原生平台来「降低AI应用开发的门槛」的雄心。

为了展示 Lepton AI 对于开发者的助力,他亲自上手撸了 500 行代码,实现了一款生成式搜索引擎,访问上方 👆 链接可以体验~

最近两天,贾扬清在 X 平台宣布了将这款应用在 GitHub 开源 。的确如他之前所说,代码非常简洁,核心部分只用了 500 行 Python

twitter.com/jiayq

不过,这之前还有一段小小的插曲。

Perplexity CEO @AravSrinivas 发推,大概意思是「Meta 和 阿里巴巴的前高管都在参考我们的UI,说明我们出圈了 」。贾扬清转发并回帖表示,这个小项目只是为了演示 Lepton AI 如何帮助开发者更容易地构建AI应用,无意碰瓷。随后就发布了开源信息。

Lepton Search 界面设计的确跟 Perplexity 高度重合,所以被「内涵」也算事出有因。不过,正如贾扬清所说,这就是一个平台功能的演示 Demo,对方不必如此敏感。

Perplexity:你也致敬,他也致敬,麻了~

🉑 从2024到2026,关于大模型未来三年的十个假设

2023年,大模型广泛地走进了公众视野。年初,我们曾经畅想「第四次工业革命」会给人类社会带来多少颠覆;年尾发现,嘶......好像并没有啊?!

数据库没有被颠覆、企业搜索没有被颠覆、安全没有被颠覆、游戏引擎/流程软件没有被颠覆、监控没有被颠覆、图像创作没有被颠覆、代码库没有被颠覆......全都没有被颠覆

🔔 2024年预测

  1. 开始摘 Low-hanging Fruit (2024)
  • 不需要多步推理的场景,会随着成本和延迟的改善而真正到摘果子的时候

  • 提升工作流中的一个环节是最容易做到的,比如利用Summary的AI产品

  • 替换低门槛的工作是下一步的目标,例如客服、审核、Semantic Search、Copilot

  1. 我们会第一次看待AI带来的 Real Economic Impact (2024)
  • 大模型对企业的影响可以直接计算成企业级别的利润率提升,并且落地成为GDP和资本效率

  • 客服行业可以通过AI显著降低成本,年薪从50K 直接降到 5K (接近 1:10 的 ROI),很多行业将因此永久收益

  • 企业ROI的提升会显著拉升经济发展,但也会导致裁员发生,这将成为 2024 年的主流话题

  1. 下一代 Turbo 会成为很多场景的分水岭 (2024)
  • 处于商业模式跑通临界期阶段的每一次降本和性能提升,都会明显带来需求赛道的解锁

  • 越是Low-hanging Fruit的领域,对成本就越是敏感,进入可用/可用分水岭后,每一次成本优化都会拓宽相应的用户群体

  • 新一代的Turbo技术,如GPT-4.5/5 Turbo,将通过提高精确度、加快反馈速度和降低成本,推动大模型在更多场景中大规模商业化

  1. 围绕AI衍生出新的Data Stack标准 (2024)
  • 随着大模型的发展,将出现新的数据架构标准,这些标准将围绕大模型训练和推理的需求,包括端到端的解决方案

  • 数据行业里先进大公司的探索方向各不相同:Databricks、Snowflake、Elastic、MongoDB、Pinecone、Zilliz、MyScale......

🔔 2025年预测

  1. 我们可能会经历一次断层,但可能不重要 (2025)
  • 大模型在处理更复杂场景时可能会遇到技术瓶颈,导致发展放缓,但这种断层可能不会持续太久

  • 所以 Workflow 产品很难短期跑出来完整的 LLM 产品,因为老软件重新做设计、等待模型变得更聪明、解决数据格式的问题等都需要时间

  1. 2C领域成长很慢,游戏、音乐、教育可能是最先跑出来的 (2025)
  • 大模型时代,模型成本要远远高于人力成本和买量成本,因此 DAU 成了评估商业模式的结果,2C 产品要像传统 2B 一样小心且缓慢地推进 PMF

  • 但是游戏、音乐和教育等创意型内容场景,可能会率先实现突破,因为这些领域对容错率的要求相对较低

  1. Workflow很难,但单点功能可以看到 (2025)
  • 专注于单点功能的应用,可能会在2025年看到显著的价值提升,并且更易于实现和商业化

🔔 2026年预测

  1. 或许可以替代更高阶的职能 (2026)
  • 大模型会开始替代一些更高阶的职能,具体进展取决于大模型在这些领域的错误率降低程度

  • 比如电销 (客服进阶版)、数据分析师 (程序员弱化版)、运维分析师和安全分析师、项目经理

  1. 工业领域会看到很多多模态实践 (2026)
  • 工业场景对大模型落地属于容错率相对较低,行业know-how要求特别高

  • 大模型先在容错率要求较低的场景里,采用多模态技术替代简单而重复的工作,然后在更加细分的容错度比较高的场景进行渗透

  1. 基建与电力可能比GPU更稀缺 (2024-2026)
  • Elon Musk说过「2024年缺数据中心、2025年缺电」,Sam Altman说过「AI浪潮将会产生大量的能源需求」

  • 随着AI需求的增长,数据中心和电力资源可能会比GPU更加稀缺 ⋙ 强烈推荐看原文,细节爆炸

🉑 乱翻书商业圆桌播客:大模型没能颠覆什么?以及正在改变的......

www.xiaoyuzhoufm.com/episode/65b...
补充一份背景:潘乱主理的「乱翻书」是科技和互联网业内很知名的圆桌对话节目,近期关于 LLM 的几期圆桌讨论都很不错!「乱翻书」公众号也有视频版回放~

一年前 ChatGPT 发布的时候,这个技术进步可谓「惊为天人」!当时大家坚信这会对各行各业进行伤筋动骨的改造,但是一年之后我们发现,并没有,而且对大公司排位的影响也没那么显著。所以,这期播客圆桌讨论的话题由此展开:为什么预期中的颠覆没有发生

这期播客邀请到的嘉宾特别互补!分别从对冲基金、创投服务、创业者视角来回顾 2023 这一年,讨论回答了多个盘桓在我们很多人心目中的重要问题。

袁进辉:硅基流动联创,一流科技创始人

波太金:对冲基金投资人,公众号「共识粉碎机」 (日报上条内容的作者)

高宁:Linkloud 联合创始人,前 VC 投资人

播客细节很多,尤其是关于商业机会和应用场景的判断部分,推荐详细听完!这里摘录 ShowMeAI 印象最深刻的几个问题和答案~

28:56 创业公司都还是要做中国的xxx,还是copy to china,以后中国市场容得下几个大模型公司?

中国钱少且分散,目前国内大模型众多却没有区分度,但未来至少需要一家 OpenAI 级别的大模型公司,其他搞应用就好,我们也更擅长
31:58 ChatGPT全球用户到2亿之后就不怎么上涨了,是否意味着生成式 AI 不能像预期那样变成一个超级应用?

需要使用 ChatGPT 的知识工作者本来就那些,所以2亿用户已经很多了!
36:18 微软野心勃勃推出AI搜索之后,Bing却没有获得增长 (3.4%),更别提撼动谷歌 (90%以上),为什么AI 没能颠覆搜索?

也许 Bing 做得不对,还没做到位
65:33 如果搜索是把信息从大脑放在了云上,不用背了,那大模型是可以把什么放在外面?

大模型本身就是一个外脑,用全世界所有语料进行了训练,因此使用者需要一定技巧将这些智能提取出来,但掌握技巧本身对使用者也是一种挑战
78:24 以后内容平台里面可能会有非常多AI 生成。如果才华不稀缺了,到底是什么是稀缺的?

从更长的历史维度来看,内容创作是劣币驱逐良币的过程,从古典乐 → 流行乐 → 抖音神曲 → AI生成音乐,创作门槛是越来越低的,创作频率越来越高,AI生成符合这一大的历史趋势

现在的机制是推荐机制,而未来将是用AI生成更为定制的内容
94:41 阿里字节等大厂都想往微软那条AI道路走,但到底有多大决心?难在哪里?

微软有大量的触角可以挣钱,但是国内大厂2B产品的盈利能力较弱并且成本控制难点很多,因此大投入不一定能有大产出,后顾之忧很多
111:03 完美的大模型跟完全的自动驾驶,哪个会更先到来?

大模型。完全的自动驾驶需要很多配套的东西,而大模型更加通用

🉑 如何构建一个糟糕的 RAG 系统:开发者最常犯的错误清单

jxnl.github.io/blog/writin...
补充一份背景:RAG (Retrieval Augmented Generation,检索增强生成) 是一种人工智能框架,将预先训练的语言模型与检索机制相结合,从广泛的知识源或结构化数据库中提取信息来生成上下文相关且精确的响应

这篇文章超有意思!标题是「How to build a terrible RAG system」,提供了一系列的反面建议,手把手教你搞出一个糟糕的 RAG 系统 🤣

  1. 忽略延迟问题 / Don't worry about latency

  2. 隐藏中间过程 / Don't show intermediate results

  3. 不展示源文档 / Don't Show Them the Source Document

  4. 忽视用户流失率 / We Should Not Worry About Churn

  5. 使用通用搜索索引 / We Should Use a Generic Search Index

  6. 不开发定制界面 / We Should Not Develop Custom UI

  7. 不微调嵌入向量 / We Should Not Fine-Tune Our Embeddings

  8. 训练大型语言模型(LLM) / We Should Train an LLM

  9. 不手动策划内容库存 / We Should Not Manually Curate Our Inventory

  10. 不分析用户查询 / We Should Not Analyze Inbound Queries

  11. 机器学习工程师不参与数据摄取 / Machine Learning Engineers Should Not Be Involved in Ingestion

  12. 使用知识图谱 / We Should Use a Knowledge Graph

  13. 平等对待所有内容库存 / We should treat all inbound inventory the same

  14. 不需要特殊数据摄取管道 / We should not have to build special injestion pipelines

  15. 不要求数据提供者提供完整数据 / We should never have to ask the data provider for clean data

  16. 不进行库存聚类 / We should never have to cluster our inventory

  17. 专注于本地评估而非A/B测试 / We should focus on local evals and not A/B tests

🉑 CB Insights 生成式AI深度报告:来自何方又将去往何处

ShowMeAI知识星球资源编码:R200
补充一份背景:CB Insights 是一家位于纽约的风险投资数据公司,会定期发布经济发展趋势以及独角兽公司名单,服务于大量公司、投资人和媒体

CB Insights 近期发布了这本「Generative AI Bible: The ultimate guide to genAI disruption」,非常详细地汇总了生成式AI的发展历程、市场动态、关键公司、投资趋势以及行业应用。

而且!整份报告颜值爆表!时间轴、公司、数据图标、行业地图等清晰美观量大,还提供了CB Insights 专家精选 (Expert Collection) 资源,带你用 120 页看清楚 GenAI 的过去和未来~

这是报告目录页,整份报告分为4个部分,分别展示了 GenAI 的发展时间轴、关键事件、关键公司、爆发现状、未来判断等等:

生成式人工智能的繁荣

逐步发展

突然之间

现在突然加速

数百家初创公司涌入生成式AI领域

随着投资者的涌入,资金激增

大型科技公司全力以赴,准备竞争

那么生成式AI将走向何方?

1. 争夺生成式AI基础设施的主导地位

2. 跨行业应用面临大型玩家的压力

3. 在垂直领域的机遇:医疗保健与生命科学、金融服务与保险、零售

值得关注的有前景的公司



The generative AI boom

生成式人工智能的繁荣


And now suddenly is accelerating

现在突然加速


So where is generative AI headed?

那么生成式AI将走向何方?

Promising companies to watch

值得关注的有前景的公司
感谢贡献一手资讯、资料与使用体验的 ShowMeAI 社区同学们!

◉ 点击 👀日报&周刊合集,订阅话题 #ShowMeAI日报,一览AI领域发展前沿,抓住最新发展机会!

◉ 点击 🎡生产力工具与行业应用大全,一起在信息浪潮里扑腾起来吧!

相关推荐
技术无疆37 分钟前
【Python】Streamlit:为数据科学与机器学习打造的简易应用框架
开发语言·人工智能·python·深度学习·神经网络·机器学习·数据挖掘
xuehaishijue1 小时前
红外画面空中目标检测系统源码分享
人工智能·目标检测·计算机视觉
羊小猪~~1 小时前
机器学习/数据分析--用通俗语言讲解时间序列自回归(AR)模型,并用其预测天气,拟合度98%+
人工智能·python·机器学习·数据挖掘·数据分析·回归·时序数据库
浊酒南街1 小时前
吴恩达深度学习笔记:卷积神经网络(Foundations of Convolutional Neural Networks)2.7-2.8
人工智能·深度学习·神经网络
DuoRuaiMiFa1 小时前
ChatGPT全新功能Canvas上线:开启智能编程与写作新篇章
人工智能·chatgpt
DisonTangor2 小时前
Windows 11将新增基于AI的搜索、生成式填充和其它AI功能
人工智能
soso19682 小时前
【AI自然语言处理应用】通过API调用通义晓蜜CCAI-对话分析AIO应用
人工智能·自然语言·ccai
网安-搬运工2 小时前
RAG再总结之如何使大模型更好使用外部数据:四个不同层级及查询-文档对齐策略
人工智能·自然语言处理·大模型·llm·大语言模型·ai大模型·rag
大模型八哥2 小时前
大模型扫盲系列——大模型实用技术介绍(上)
人工智能·程序人生·ai·大模型·llm·llama·ai大模型