LLM Weekly 2024-5-W5
🎉 新品速递
-
Baichuan 4:百川智能发布的新一代基座大模型,结合首款AI助手「百小应」,具备多轮搜索和定向搜索能力,可以解决各种问题,并将搜索结果嵌入回答中。Baichuan 4在SuperCLUE评测中以80.64分登顶国内第一,文科任务更是全球第一。
-
日日新5.0粤语版:商汤科技发布的日日新5.0粤语版,继4月发布「日日新SenseNova 5.0」后的迭代。在中文大模型测评基准SuperCLUE中,成为首个超越GPT-4 Turbo的国产大模型;在OpenCompass的基准表现中,客观评测超过GPT-4 Turbo,主观评测已超过GPT-4o位列第一。
-
九天智能基座:中国移动自研的全栈国产化生态大模型,包括万卡算力、千亿模型及百汇平台三部分。
-
可图大模型产品:快手自研的大模型产品"可图"(Kolors)正式对外开放,支持文生图和图生图两类功能,已上线20余种AI图像玩法。
🥳 重磅更新
- 九天千亿多模态基座大模型:中国移动在2024年5月25日的数字中国建设峰会上发布的模型,在风趣畅聊方面堪比GPT-4o,标志着中国移动在通用大模型领域的进一步突破。
- 建筑行业AI大模型:广联达在2024年5月26日的中国数字建筑大会上发布的模型,旨在推动建筑业的数字化转型和高质量发展,是企业数字化转型的关键技术之一。
- 百度移动生态业务升级:百度在2024年5月30日举办的万象大会上宣布,其搜索、文心一言APP、百度文库、百度电商、文心智能体平台和百度APP等移动生态业务都基于大模型和智能体进行了能力升级,全面降低了大模型应用门槛。
🔥 热门项目
- ollama / ollama:一个开源项目,提供轻量级、可扩展的框架,用于在本地机器上构建和运行大型语言模型(LLMs)。支持MacOS、Linux和Windows平台,提供简单API创建、运行和管理模型,并有预构建模型库。
- geekan / MetaGPT:创新的元编程框架,结合大语言模型和多智能体协作系统,编码标准化操作程序(SOPs)为提示序列,提高工作效率和减少错误。提供产品文档、架构设计、任务列表、代码,以及完整的软件公司流程和SOPs。
- QuivrHQ / quivr:开源个人知识管理工具,通过AI技术帮助存储、检索和共享非结构化信息。支持多种文件格式,可在本地或云端部署,具备快速数据访问、安全性和跨操作系统兼容性。
- run-llama / llama_index:为大型语言模型(LLMs)应用构建的数据框架,支持在线加载模型,增强灵活性和实用性。
- mlabonne / llm-course:关于大型语言模型(LLM)的课程,从基础到高级逐步掌握LLM知识。分为LLM Fundamentals、The LLM Scientist和The LLM Engineer三部分,提供路线图和Colab笔记本,便于学习和实践。