国内大模型 T1 —— Kimi,解析二百万上下文无压力

两位百万?怎么做到的?

前段时间写过一篇文章:# GPT4-Turbor 128k ? 还不够?还不够!记得 GPT4-T 的上下文参数量 128k,也就大概 100 万英文字符、50 万汉字字符,kimi 是如何做到 double 的?

真的能做到吗?

上下文的扩充有尽头吗?

在前面文章里提到了 RAG 技术,即 生成式检索增强,它能通过 API 调用,请求页面或读取文件,优化检索数据,缩小文本或标记梳理,同时保留必要信息;然后使用文本分割器,将文档转换为段落、代码块,确定每段落大小;接着进行语义索引、并存储在向量数据库;在回复用户生成的内容前,选择与用户初始请求语义相关的段落块,插入到提示中。

白话来说就是将上下文提示语分块、分析、加权重、插入到提示,那么:如果能无限扩充上下文长度,RAG 技术还有意义吗?

Kimi 背后原理,官网做出了解释:# Kimi Chat 公布"大海捞针"长文本压测结果

这里的"针"就是"大上下文提示语"的核心,我们需要提取的、解析的核心:

有几个有意思的数据:

1、GPT-4 Turbo(128K)在语料长度超过 72K 且句子("针")藏在文本头部的时候,准确率不佳。(这也是我们前面提到过的)

2、而Claude 2.1似乎在语料长度超过20K 之后就开始准确率不佳,而且句子( 针)藏在语料靠前的位置时,准确率尤其差。

而 Kimi Chat 在"大海捞针"实验中的测试结果是这样的:

kimi 的测试结果好的让人意外!

那... kimi 究竟做对了什么?

官方也没明说,只是最后给了个这样的结论:

具体技术实现细节,背后是大量复杂的工程优化和算法创新设计,这也是 kimi 团队核心技术壁垒,不得而知。

内部成员的回复:

思考:

以后的大模型比拼什么?两点:

1、数据的精准性-各行业

2、计算能力、解析能力-这里的大文本上下文解析就算!


说到这里,我们不难发现:成长与发展是工作与生活的主旋律 ~ 最后,自荐一下我和机械工业出版社联合出版的 《程序员成长手记》 一书:全书分为3大模块、8个章节:从入门程序员到程序员自驱成长,回归纸质阅读,相信能给你一个更全局的程序员视野,提供成长帮助。京东搜"程序员成长手记"

OK,以上便是本次分享,希望各位喜欢~ 欢迎点赞、收藏、评论 🤟 我是安东尼 🤠 人气技术博主 💥 坚持千日更文 ✍ 关注我,安东尼陪你一起度过漫长编程岁月

相关推荐
ting94520003 小时前
Tornado 全栈技术深度指南:从原理到实战
人工智能·python·架构·tornado
怕浪猫3 小时前
决定命运的,从来不是市场,而是你看待市场的方式
aigc·ai编程
果汁华3 小时前
Browserbase Skills:让 Claude Agent 真正“看见“网页世界
人工智能·python
ZhengEnCi3 小时前
04-缩放点积注意力代码实现 💻
人工智能·python
小碗细面4 小时前
13种Agent、129套设计系统:Open Design 开源项目完全指南
aigc·ai编程
HackTwoHub4 小时前
AI大模型网关存在SQL注入、附 POC 复现、影响版本LiteLLM 1.81.16~1.83.7(CVE-2026-42208)
数据库·人工智能·sql·网络安全·系统安全·网络攻击模型·安全架构
段一凡-华北理工大学4 小时前
【高炉炼铁领域炉温监测、预警、调控智能体设计与应用】~系列文章08:多模态数据融合:让数据更聪明
人工智能·python·高炉炼铁·ai赋能·工业智能体·高炉炉温
万粉变现经纪人4 小时前
如何解决 pip install llama-cpp-python 报错 未安装 CMake/Ninja 或 CPU 不支持 AVX 问题
开发语言·python·开源·aigc·pip·ai写作·llama
网络工程小王5 小时前
【LangChain 大模型6大调用指南】调用大模型篇
linux·运维·服务器·人工智能·学习
HIT_Weston5 小时前
63、【Agent】【OpenCode】用户对话提示词(示例)
人工智能·agent·opencode