本周LLM新鲜事

LLM Weekly 2024-5-W5

🎉 新品速递

  1. Baichuan 4:百川智能发布的新一代基座大模型,结合首款AI助手「百小应」,具备多轮搜索和定向搜索能力,可以解决各种问题,并将搜索结果嵌入回答中。Baichuan 4在SuperCLUE评测中以80.64分登顶国内第一,文科任务更是全球第一。

  2. 日日新5.0粤语版:商汤科技发布的日日新5.0粤语版,继4月发布「日日新SenseNova 5.0」后的迭代。在中文大模型测评基准SuperCLUE中,成为首个超越GPT-4 Turbo的国产大模型;在OpenCompass的基准表现中,客观评测超过GPT-4 Turbo,主观评测已超过GPT-4o位列第一。

  3. 九天智能基座:中国移动自研的全栈国产化生态大模型,包括万卡算力、千亿模型及百汇平台三部分。

  4. 可图大模型产品:快手自研的大模型产品"可图"(Kolors)正式对外开放,支持文生图和图生图两类功能,已上线20余种AI图像玩法。

🥳 重磅更新

  • 九天千亿多模态基座大模型:中国移动在2024年5月25日的数字中国建设峰会上发布的模型,在风趣畅聊方面堪比GPT-4o,标志着中国移动在通用大模型领域的进一步突破。
  • 建筑行业AI大模型:广联达在2024年5月26日的中国数字建筑大会上发布的模型,旨在推动建筑业的数字化转型和高质量发展,是企业数字化转型的关键技术之一。
  • 百度移动生态业务升级:百度在2024年5月30日举办的万象大会上宣布,其搜索、文心一言APP、百度文库、百度电商、文心智能体平台和百度APP等移动生态业务都基于大模型和智能体进行了能力升级,全面降低了大模型应用门槛。

🔥 热门项目

  1. ollama / ollama:一个开源项目,提供轻量级、可扩展的框架,用于在本地机器上构建和运行大型语言模型(LLMs)。支持MacOS、Linux和Windows平台,提供简单API创建、运行和管理模型,并有预构建模型库。
  2. geekan / MetaGPT:创新的元编程框架,结合大语言模型和多智能体协作系统,编码标准化操作程序(SOPs)为提示序列,提高工作效率和减少错误。提供产品文档、架构设计、任务列表、代码,以及完整的软件公司流程和SOPs。
  3. QuivrHQ / quivr:开源个人知识管理工具,通过AI技术帮助存储、检索和共享非结构化信息。支持多种文件格式,可在本地或云端部署,具备快速数据访问、安全性和跨操作系统兼容性。
  4. run-llama / llama_index:为大型语言模型(LLMs)应用构建的数据框架,支持在线加载模型,增强灵活性和实用性。
  5. mlabonne / llm-course:关于大型语言模型(LLM)的课程,从基础到高级逐步掌握LLM知识。分为LLM Fundamentals、The LLM Scientist和The LLM Engineer三部分,提供路线图和Colab笔记本,便于学习和实践。
相关推荐
后端小肥肠22 分钟前
别再眼馋 10w + 治愈漫画!Coze 工作流 3 分钟出成品,小白可学
人工智能·aigc·coze
唐某人丶3 小时前
教你如何用 JS 实现 Agent 系统(2)—— 开发 ReAct 版本的“深度搜索”
前端·人工智能·aigc
FIT2CLOUD飞致云4 小时前
九月月报丨MaxKB在不同规模医疗机构的应用进展汇报
人工智能·开源
阿里云大数据AI技术4 小时前
【新模型速递】PAI-Model Gallery云上一键部署Qwen3-Next系列模型
人工智能
袁庭新4 小时前
全球首位AI机器人部长,背负反腐重任
人工智能·aigc
机器之心4 小时前
谁说Scaling Law到头了?新研究:每一步的微小提升会带来指数级增长
人工智能·openai
算家计算4 小时前
AI配音革命!B站最新开源IndexTTS2本地部署教程:精准对口型,情感随心换
人工智能·开源·aigc
量子位4 小时前
马斯克周末血裁xAI 500人
人工智能·ai编程
算家计算5 小时前
OpenAI最强编程模型GPT-5-Codex发布!可独立编程7小时,编程效率提升10倍
人工智能·ai编程·资讯
聚客AI6 小时前
🌟大模型为什么产生幻觉?预训练到推理的漏洞全揭秘
人工智能·llm·掘金·日新计划