本周LLM新鲜事

LLM Weekly 2024-5-W5

🎉 新品速递

  1. Baichuan 4:百川智能发布的新一代基座大模型,结合首款AI助手「百小应」,具备多轮搜索和定向搜索能力,可以解决各种问题,并将搜索结果嵌入回答中。Baichuan 4在SuperCLUE评测中以80.64分登顶国内第一,文科任务更是全球第一。

  2. 日日新5.0粤语版:商汤科技发布的日日新5.0粤语版,继4月发布「日日新SenseNova 5.0」后的迭代。在中文大模型测评基准SuperCLUE中,成为首个超越GPT-4 Turbo的国产大模型;在OpenCompass的基准表现中,客观评测超过GPT-4 Turbo,主观评测已超过GPT-4o位列第一。

  3. 九天智能基座:中国移动自研的全栈国产化生态大模型,包括万卡算力、千亿模型及百汇平台三部分。

  4. 可图大模型产品:快手自研的大模型产品"可图"(Kolors)正式对外开放,支持文生图和图生图两类功能,已上线20余种AI图像玩法。

🥳 重磅更新

  • 九天千亿多模态基座大模型:中国移动在2024年5月25日的数字中国建设峰会上发布的模型,在风趣畅聊方面堪比GPT-4o,标志着中国移动在通用大模型领域的进一步突破。
  • 建筑行业AI大模型:广联达在2024年5月26日的中国数字建筑大会上发布的模型,旨在推动建筑业的数字化转型和高质量发展,是企业数字化转型的关键技术之一。
  • 百度移动生态业务升级:百度在2024年5月30日举办的万象大会上宣布,其搜索、文心一言APP、百度文库、百度电商、文心智能体平台和百度APP等移动生态业务都基于大模型和智能体进行了能力升级,全面降低了大模型应用门槛。

🔥 热门项目

  1. ollama / ollama:一个开源项目,提供轻量级、可扩展的框架,用于在本地机器上构建和运行大型语言模型(LLMs)。支持MacOS、Linux和Windows平台,提供简单API创建、运行和管理模型,并有预构建模型库。
  2. geekan / MetaGPT:创新的元编程框架,结合大语言模型和多智能体协作系统,编码标准化操作程序(SOPs)为提示序列,提高工作效率和减少错误。提供产品文档、架构设计、任务列表、代码,以及完整的软件公司流程和SOPs。
  3. QuivrHQ / quivr:开源个人知识管理工具,通过AI技术帮助存储、检索和共享非结构化信息。支持多种文件格式,可在本地或云端部署,具备快速数据访问、安全性和跨操作系统兼容性。
  4. run-llama / llama_index:为大型语言模型(LLMs)应用构建的数据框架,支持在线加载模型,增强灵活性和实用性。
  5. mlabonne / llm-course:关于大型语言模型(LLM)的课程,从基础到高级逐步掌握LLM知识。分为LLM Fundamentals、The LLM Scientist和The LLM Engineer三部分,提供路线图和Colab笔记本,便于学习和实践。
相关推荐
阿坡RPA12 小时前
手搓MCP客户端&服务端:从零到实战极速了解MCP是什么?
人工智能·aigc
用户277844910499312 小时前
借助DeepSeek智能生成测试用例:从提示词到Excel表格的全流程实践
人工智能·python
机器之心13 小时前
刚刚,DeepSeek公布推理时Scaling新论文,R2要来了?
人工智能
算AI15 小时前
人工智能+牙科:临床应用中的几个问题
人工智能·算法
凯子坚持 c15 小时前
基于飞桨框架3.0本地DeepSeek-R1蒸馏版部署实战
人工智能·paddlepaddle
你觉得20516 小时前
哈尔滨工业大学DeepSeek公开课:探索大模型原理、技术与应用从GPT到DeepSeek|附视频与讲义下载方法
大数据·人工智能·python·gpt·学习·机器学习·aigc
8K超高清16 小时前
中国8K摄像机:科技赋能文化传承新图景
大数据·人工智能·科技·物联网·智能硬件
hyshhhh16 小时前
【算法岗面试题】深度学习中如何防止过拟合?
网络·人工智能·深度学习·神经网络·算法·计算机视觉
薛定谔的猫-菜鸟程序员16 小时前
零基础玩转深度神经网络大模型:从Hello World到AI炼金术-详解版(含:Conda 全面使用指南)
人工智能·神经网络·dnn
币之互联万物17 小时前
2025 AI智能数字农业研讨会在苏州启幕,科技助农与数据兴业成焦点
人工智能·科技