本周LLM新鲜事

LLM Weekly 2024-5-W5

🎉 新品速递

  1. Baichuan 4:百川智能发布的新一代基座大模型,结合首款AI助手「百小应」,具备多轮搜索和定向搜索能力,可以解决各种问题,并将搜索结果嵌入回答中。Baichuan 4在SuperCLUE评测中以80.64分登顶国内第一,文科任务更是全球第一。

  2. 日日新5.0粤语版:商汤科技发布的日日新5.0粤语版,继4月发布「日日新SenseNova 5.0」后的迭代。在中文大模型测评基准SuperCLUE中,成为首个超越GPT-4 Turbo的国产大模型;在OpenCompass的基准表现中,客观评测超过GPT-4 Turbo,主观评测已超过GPT-4o位列第一。

  3. 九天智能基座:中国移动自研的全栈国产化生态大模型,包括万卡算力、千亿模型及百汇平台三部分。

  4. 可图大模型产品:快手自研的大模型产品"可图"(Kolors)正式对外开放,支持文生图和图生图两类功能,已上线20余种AI图像玩法。

🥳 重磅更新

  • 九天千亿多模态基座大模型:中国移动在2024年5月25日的数字中国建设峰会上发布的模型,在风趣畅聊方面堪比GPT-4o,标志着中国移动在通用大模型领域的进一步突破。
  • 建筑行业AI大模型:广联达在2024年5月26日的中国数字建筑大会上发布的模型,旨在推动建筑业的数字化转型和高质量发展,是企业数字化转型的关键技术之一。
  • 百度移动生态业务升级:百度在2024年5月30日举办的万象大会上宣布,其搜索、文心一言APP、百度文库、百度电商、文心智能体平台和百度APP等移动生态业务都基于大模型和智能体进行了能力升级,全面降低了大模型应用门槛。

🔥 热门项目

  1. ollama / ollama:一个开源项目,提供轻量级、可扩展的框架,用于在本地机器上构建和运行大型语言模型(LLMs)。支持MacOS、Linux和Windows平台,提供简单API创建、运行和管理模型,并有预构建模型库。
  2. geekan / MetaGPT:创新的元编程框架,结合大语言模型和多智能体协作系统,编码标准化操作程序(SOPs)为提示序列,提高工作效率和减少错误。提供产品文档、架构设计、任务列表、代码,以及完整的软件公司流程和SOPs。
  3. QuivrHQ / quivr:开源个人知识管理工具,通过AI技术帮助存储、检索和共享非结构化信息。支持多种文件格式,可在本地或云端部署,具备快速数据访问、安全性和跨操作系统兼容性。
  4. run-llama / llama_index:为大型语言模型(LLMs)应用构建的数据框架,支持在线加载模型,增强灵活性和实用性。
  5. mlabonne / llm-course:关于大型语言模型(LLM)的课程,从基础到高级逐步掌握LLM知识。分为LLM Fundamentals、The LLM Scientist和The LLM Engineer三部分,提供路线图和Colab笔记本,便于学习和实践。
相关推荐
科技小E14 分钟前
EasyRTC嵌入式音视频通信SDK打造带屏IPC全场景实时通信解决方案
人工智能·音视频
ayiya_Oese19 分钟前
[模型部署] 3. 性能优化
人工智能·python·深度学习·神经网络·机器学习·性能优化
仙人掌_lz21 分钟前
机器学习与人工智能:NLP分词与文本相似度分析
人工智能·机器学习·自然语言处理
jndingxin41 分钟前
OpenCV CUDA模块中矩阵操作------归一化与变换操作
人工智能·opencv
ZStack开发者社区1 小时前
云轴科技ZStack官网上线Support AI,智能助手助力高效技术支持
人工智能·科技
每天都要写算法(努力版)1 小时前
【神经网络与深度学习】通俗易懂的介绍非凸优化问题、梯度消失、梯度爆炸、模型的收敛、模型的发散
人工智能·深度学习·神经网络
Blossom.1181 小时前
Web3.0:互联网的去中心化未来
人工智能·驱动开发·深度学习·web3·去中心化·区块链·交互
kyle~1 小时前
计算机视觉---目标检测(Object Detecting)概览
人工智能·目标检测·计算机视觉
hao_wujing1 小时前
YOLOv8在单目向下多车辆目标检测中的应用
人工智能·yolo·目标检测
王学政21 小时前
LlamaIndex 第九篇 Indexing索引
人工智能·python