通往AGI的大模型MultiAgent的RL是对的但HF有上限

OpenAI高管Mira Murati周三告诉员工,一封关于AI取得突破的信件促使董事会采取了解雇行动。一位消息人士透露,OpenAI在Q*项目上取得了进展,内部人士认为这可能是OpenAI在超级智能领域的突破。这名消息人士称,虽然Q*的数学成绩只是小学生的水平,但在测试中取得优异成绩让研究人员对它未来的成功非常乐观

有人说:奥特曼不用斯派修姆光线把解雇他的OpenAI给消灭吗?

人类终将打开AGI(Artificial General Intelligence)通用人工智能的魔盒。

  1. scaling up 是接近 AGI 的正确方向,虽然不一定是最佳方向。

  2. 架构层面上,相信肯定有比 transformer 更好架构,但现在大家已经在这个架构上做了很多工作了,也能用。

  3. 同行Meta 没有做到位,Llama 还是差的挺多的,远远没有做好, meta 没有train 好。

  4. 学术界大模型研究与工业界差距大,一个问题是 gpu 算力集群不够,学术界不能做pretrain,很难下决心 all in 某个研究方向,另一个问题是学术界研究不能在生产中验证

  5. gpt 5什么时候出来不知道。

  6. 这一年来 gpt 底层model 并没换,只不过人的错觉认为变弱了

  7. 很多开源社区都是重复的造轮子,所以 OpenAI内部 就自己做掉这部分轮子

  8. RLHF(基于人类反馈(Human Feedback)对语言模型进行强化学习(Reinforcement Learning))不一定是AGI 的必经路径,因为RLHF是hf部分决定了上限,怎么会通往 AGI?

  9. 但RL是正确的,看好 multi agent,类比阿法狗,可以左脚踩右脚把能力提上去。

  10. GPTs是为了方便开发者而零时发布的一个产品,这不是OpenAI公司的重点

相关推荐
LilySesy1 小时前
【案例总结】幽灵单据——消失的交货单号
数据库·ai·oracle·编辑器·sap·abap
Easy数模1 小时前
使用llm进行高级主题建模:通过利用 BERTopic 的表示模型和生成式 AI 深入探讨主题建模
人工智能·llm·nlp
你可以叫我仔哥呀2 小时前
Java程序员学从0学AI(七)
java·开发语言·人工智能·ai·spring ai
AI4Sci.2 小时前
在云服务器上基于lora微调Qwen2.5-VL-7b-Instruct模型(下)
人工智能·算法·机器学习·大模型·lora微调·大模型本地部署·qwen2.5-vl-7b
陈敬雷-充电了么-CEO兼CTO3 小时前
字节跳动开源Coze,开启AI Agent开发新时代?
人工智能·gpt·chatgpt·开源·大模型·agi·coze
DM今天肝到几点?3 小时前
【7.26-7.28胜算云AI日报:首个开源3D世界生成模型腾讯混元、微软预示 8 月 GPT-5 发布、Nemotron推理、商汤悟能、DM夺金】
人工智能·vscode·microsoft·3d·ai·chatgpt
Eastmount4 小时前
[AI Coding] 一.腾讯CodeBuddy IDE内测、安装及基本用法(国产AI IDE启航)
人工智能·大模型·腾讯·ai coding·codebuddy ide
山顶夕景15 小时前
【LLM】Kimi-K2模型架构(MuonClip 优化器等)
大模型·llm·agent·强化学习·智能体
哥本哈士奇(aspnetx)15 小时前
Dify快速搭建问答系统
大模型
威化饼的一隅17 小时前
【多模态】天池AFAC赛道四-智能体赋能的金融多模态报告自动化生成part2-报告输出
大模型·agent·多模态·智能体