AI大模型日报#0420：开源模型击败GPT-4、西湖大学蛋白质通用大模型、GPT的七条经验

导读：欢迎阅读《AI大模型日报》，内容基于Python爬虫和LLM自动生成。目前采用"文心一言"生成了每条资讯的摘要。

标题: 开源模型打败GPT-4！LLM竞技场最新战报，Cohere Command R+上线

摘要: GPT-4在LLM竞技场被开源模型Cohere的Command R+超越，后者在排行榜上获得高票数，与GPT-4早期版本并列第7位。然而，OpenAI很快发布了新版本GPT-4-Turbo，重夺榜首，导致所有模型排名下降。尽管如此，Command R+作为首个击败GPT-4的开源模型，仍备受关注。
网址: 开源模型打败GPT-4！LLM竞技场最新战报，Cohere Command R+上线|azure_新浪新闻

标题: GPT Store都开不下去，这家平台怎么敢走这条路的？？
摘要: Dify公司CEO张路宇是拥有11年互联网从业经验的创业者，他带领团队在开源LLM应用程序开发平台领域取得了显著成就，公司推出了超过1000种大模型接入和可视化AI工作流等功能，受到用户热烈欢迎。Dify成为该领域的佼佼者，GitHub上获得超22k星标。张路宇的丰富经验和独到见解为公司的发展注入了强大动力。
网址: GPT Store都开不下去，这家平台怎么敢走这条路的？？ | 量子位

标题: 4000万蛋白结构训练，西湖大学开发基于结构词表的蛋白质通用大模型，已开源

摘要: 这段文字主要介绍了西湖大学研究人员利用Foldseek处理蛋白质结构，形成结构感知词表，以此增强模型的表征能力。他们使用大量蛋白质结构进行预训练，最终开源了具备强大参数量的模型SaProt。实验结果表明，SaProt在各种蛋白质任务上表现优异。该研究的预印版本已发布在bioRxiv预印平台，并提供了论文链接。
网址: 4000万蛋白结构训练，西湖大学开发基于结构词表的蛋白质通用大模型，已开源 | 机器之心

标题: 5亿个token之后，我们得出关于GPT的七条宝贵经验

摘要: ChatGPT的正确使用姿势包括：精炼prompt，确保信息非常必要且不是常识；理解模型的能力与局限性，避免超出其处理范围；注重数据的质量与多样性，以提升模型的准确性和泛化能力；合理规划token的使用，避免浪费和不必要的成本；保持与OpenAI社区的紧密联系，获取最新信息和支持；以及持续优化与调整，以获得最佳的大模型使用体验。
网址: 5亿个token之后，我们得出关于GPT的七条宝贵经验 | 机器之心

标题: MLLM真能看懂数学吗？MathVerse来了次摸底测评，放出当天登热榜

摘要: AIxiv是机器之心发布学术技术内容的专栏，已报道2000多篇全球顶级实验室内容，促进学术交流。现邀投稿，邮箱：liyazhou@jiqizhixin.com；zhaoyunfeng@jiqizhixin.com。大语言模型（LLM）发展迅速，研究机构探索构建多模态大语言模型（MLLMs）。现有视觉测评benchmark不足以评估MLLMs的深度认知和逻辑推理能力，多模态数学题求解能力才是真正的试金石，但目前仍缺乏相关测评。
网址: MLLM真能看懂数学吗？MathVerse来了次摸底测评，放出当天登热榜 | 机器之心

标题: 活动报名｜大模型Agent操作系统，支持多Agent并行，实现有"灵魂"的管理，罗格斯大学教授分享

摘要: 报告主题：AIOS，大模型智能体操作系统。报告将介绍该操作系统如何解决大模型智能体在集成、部署和管理方面的挑战，如资源分配、上下文管理和异构智能体整合等。AIOS将大模型嵌入操作系统，优化资源分配，实现智能体并发执行和访问控制，为未来AIOS生态系统的发展奠定基础。报告嘉宾为张永锋教授，其在机器学习、自然语言处理等领域有深入研究。
网址: 活动报名｜大模型Agent操作系统，支持多Agent并行，实现有"灵魂"的管理，罗格斯大学教授分享 - 智源社区