Google Gemini Pro:AI模型的新里程碑,开放API访问;Octo: 一个开源通用的机器人策略

🦉 AI新闻

🚀 Google Gemini Pro:AI模型的新里程碑,开放API访问

摘要:Google宣布推出了名为Gemini的AI模型,旨在使AI更加有用。Gemini分为Ultra、Pro和Nano三个版本,并已开始在产品中使用。Gemini Pro现已提供给开发者和企业使用,支持多种功能和语言,并提供SDK帮助开发应用程序。此外,Google还提供了Google AI Studio和Vertex AI等开发工具和平台。Gemini Pro目前免费使用,但将来可能会收费。

🚀 OpenAI重新开放ChatGPT Plus注册,周活用户数超过1亿

摘要:OpenAI首席执行官宣布重新开放ChatGPT Plus订阅,之前因使用量激增而暂停新用户注册。调查显示,ChatGPT被访问超过146亿次,占比超过60%。OpenAI还发布了GPTs和GPT-4 Turbo模型的预览,拥有更大的上下文窗口和更快的速度。ChatGPT已经成为流行的AI工具,被超过92%的财富500强企业使用。此举对于AI领域具有重要意义。

🚀 华中科技大学发布多模态大模型Monkey,实现对世界的"观察"

摘要:华中科技大学软件学院的VLRLab团队发布了名为"Monkey"的多模态大模型,能够对世界进行观察,对图片进行深入的问答交流和精确描述。Monkey模型在18个数据集上的实验中表现出色,特别是在图像描述和视觉问答任务方面超越了众多知名的模型。Monkey具有"看图说话"的能力,能够察觉其他多模态大模型所忽略的图像细节并进行准确的描述。此外,Monkey还能处理更大尺寸的图像,达到了其他模型所不能的分辨率。该模型代码已在GitHub开源。

🚀 南京农业大学发布"荀子"古籍大语言模型,支持古籍处理与研究

摘要:南京农业大学信息管理学院王东波教授研究团队发布了"荀子"古籍大语言模型,该模型包含了绝大多数传世古籍文献,拥有超过20亿字的大型语料库。该模型具备多项亮点,包括可以进行智能标引、信息抽取、诗歌生成、高质量翻译、阅读理解、词法分析和自动标点等功能。该模型可作为开源公益研究成果使用。本次发布受到了关注并具有重要性,对古籍研究和文化传承有着积极的影响。

🚀 谷歌发布AI神器Imagen 2 实现简单文本转图像

摘要:谷歌最新发布的AI模型Imagen 2,通过简单的自然语言描述,能够生成逼真的高清图像。Imagen 2拥有强大的机器学习算法和复杂的神经网络架构,能够理解并可视化复杂抽象的概念。与此前的模型相比,Imagen 2具有更高的准确性和细腻程度,能够以惊人的保真度生成各种场景的图像。这一技术的应用将深刻改变内容创作行业的规则,大大提高内容制作的效率和质量。Imagen 2的发布引起了广泛关注,被认为是文本到图像技术的巅峰之作。

🗼 AI知识

🔥 Octo: 一个开源通用的机器人策略

这篇文章介绍了名为Octo的开源通用机器人策略模型。Octo采用了Transformer-based的扩散策略,通过预训练和微调的方式,可以适应不同的机器人和任务。通过训练大量的数据集,Octo在多个真实机器人环境中进行了评估,表现优于其他已有模型,并且可以适应新的观测和动作空间。该模型的设计使其可以广泛应用于不同的机器人控制问题。

🔥 分析transformer模型的参数量、计算量、中间激活、KV cache

最近,OpenAI推出的ChatGPT展现出了卓越的性能,引发了大规模语言模型(Large Language Model, LLM)的研究热潮。大规模语言模型的"大"体现在两个方面:模型参数规模大,训练数据规模大。以GPT3为例,GPT3的参数量为1750亿,训练数据量达到了570GB。进而,训练大规模语言模型面临两个主要挑战:显存效率和计算效率。

更多AI工具,参考国内AiBard123Github-AiBard123

相关推荐
kobesdu5 小时前
【ROS2实战笔记-12】rosshow:终端里的盲文可视化与无头机器人的现场调试
笔记·机器人·ros·移动机器人
马丁聊GEO5 小时前
解码AI用户心智,筑牢可信GEO根基——悠易科技深度参与《中国AI用户态度与行为研究报告(2026)》发布会
人工智能·科技
nap-joker5 小时前
Fusion - Mamba用于跨模态目标检测
人工智能·目标检测·计算机视觉·fusion-mamba·可见光-红外成像融合·远距离/伪目标问题
一只幸运猫.5 小时前
2026Java 后端面试完整版|八股简答 + AI 大模型集成技术(最新趋势)
人工智能·面试·职场和发展
Promise微笑6 小时前
2026年国产替代油介损测试仪:油介损全场景解决方案与技术演进
大数据·网络·人工智能
深海鱼在掘金6 小时前
深入浅出 LangChain —— 第三章:模型抽象层
人工智能·langchain·agent
生信碱移6 小时前
PACells:这个方法可以鉴定疾病/预后相关的重要细胞亚群,作者提供的代码流程可以学习起来了,甚至兼容转录组与 ATAC 两种数据类型!
人工智能·学习·算法·机器学习·数据挖掘·数据分析·r语言
workflower6 小时前
具身智能行业应用-生活服务业
大数据·人工智能·机器人·动态规划·生活
GitCode官方6 小时前
基于昇腾 MindSpeed LLM 玩转 DeepSeekV4-Flash 模型的预训练复现部署
人工智能·开源·atomgit
大刘讲IT6 小时前
AI重塑企业信息价值标准:从“系统供给”到“用户定义”的企业数字化新范式
人工智能·经验分享·ai·制造