AI大模型日报#0409:Llama 3下周发布、特斯联20亿融资、Karpathy新项目

导读: 欢迎阅读《AI大模型日报》,内容基于Python爬虫和LLM自动生成。目前采用"文心一言"生成了每条资讯的摘要。

标题: 120亿Stable LM 2上线即开源!2万亿token训练,碾压Llama 2 70B

摘要: Stable LM 2 12B参数版本发布,性能更强,包含基础模型和指令微调模型,训练于七种多语言和2万亿Token数据集上。在基准测试中赶超Llama 2 70B等开源模型,兼顾性能、效率、内存和速度。虽然目前支持4K上下文窗口,但Stability AI将很快推出更长版本。Stable LM 2 12B是一个高效开源模型,专为处理多语言任务设计。
网址: 120亿Stable LM 2上线即开源!2万亿token训练,碾压Llama 2 70B|基准测试|模型|训练_新浪新闻

标题: AI大模型搜索之战开启,胜出黑马竟是ta?

摘要: 要点提炼: ChatGPT等AI工具的免注册使用引发了关于AI取代搜索引擎的讨论。互联网可能正进入Gen AI时代,AI工具正在改变我们查询和消费信息的方式。然而,AI要取代搜索引擎,需确保信息来源的相关性和可信度,以及时效性。文章提出通过实测PK来比较AI大模型和搜索引擎在各项任务上的表现,首先考核的就是时效性。
网址: AI大模型搜索之战开启,胜出黑马竟是ta?|模型|搜索引擎|谷歌_新浪新闻

标题: OpenAI创始大神手搓千行C代码训练GPT,附PyTorch迁移教程

摘要: OpenAI大神卡帕西用纯C语言手写了千行代码来训练GPT模型,发布了几小时内就获得2.3k星。该项目可立即编译运行,与PyTorch完全兼容,并提供了从PyTorch迁移到C的教程。卡帕西使用了GPT-2作为示例,但该项目也适用于Llama 2和Gemma等大模型。他手动实现了每个层的前向/反向传播,该项目在C/CUDA上训练LLM的速度接近PyTorch,通过使用SIMD指令加速了CPU版本。
网址: OpenAI创始大神手搓千行C代码训练GPT,附PyTorch迁移教程 | 量子位

标题: 特斯联完成20亿元D轮融资,推领域大模型,促AGI落地
摘要: 特斯联完成20亿D轮融资,由国内外知名投资机构和产业基金共同领投,多家新老股东跟投。资金将用于多模态能力的大模型在多场景应用、智算基础设施建设和技术壁垒构建。特斯联提出"大模型+系统"产业落地路径,通过领域模型和场景定义系统融合多模态数据和知识,实现大模型在场景中快速落地。此举有助于特斯联在AIoT领域形成产业化、集群化效应,提升国际竞争力。
网址: 特斯联完成20亿元D轮融资,推领域大模型,促AGI落地 | 机器之心

标题: Meta 下周发布 Llama3 两个版本!
摘要: Meta计划下周推出Llama 3的两个小版本,作为今年夏天推出的最大版本的先行者。这两个模型虽不是多模态,但更便宜、运行更快,对移动设备上构建AI软件的开发者有价值。Llama 3旨在与OpenAI的GPT-4竞争,最大版本将能理解和生成文本和图像。此前,Meta发布了三个版本的Llama 2,最大版本拥有700亿个参数。
网址: Meta 下周发布 Llama3 两个版本!|meta|应用程序|插件功能|算法_手机网易网

相关推荐
yzx991013几秒前
WorkBuddy 使用指南:解锁几大核心功能,提升工作效率
人工智能·python
蛐蛐蛐几秒前
在昇腾310P推理服务器上安装CANN和PyTorch
人工智能·pytorch·python·npu
科技林总1 分钟前
如何安全地使用龙虾[特殊字符]
人工智能·安全
szxinmai主板定制专家4 分钟前
基于 STM32 + FPGA 船舶电站控制器设计与实现
arm开发·人工智能·stm32·嵌入式硬件·fpga开发·架构
lucky_syq8 分钟前
Mac电脑部署OpenClaw保姆级教程(2026最新版)
人工智能·macos·开源·电脑·openclaw
猿小猴子13 分钟前
主流 AI IDE 之一的 华为云码道「CodeArts」 介绍
ide·人工智能·ai·华为云
Xpower 1718 分钟前
OpenClaw实战:从零开发电商小程序(2)
人工智能·语言模型·小程序·gateway
PNP Robotics18 分钟前
PNP机器人亮相第二届机器人灵巧手国际创新大会
人工智能·学习·机器人·开源
凤年徐18 分钟前
保姆级教程:从零搭建AI系统权限控制系统
人工智能
( ˶˙⚇˙˶ )୨⚑︎20 分钟前
深度学习与机器学习如何选择?
人工智能·深度学习·机器学习