人工智能

BFT白芙堂11 分钟前
人工智能·机器学习·机器人·协作机器人·复合机器人·睿尔曼机器人
睿尔曼系列机器人——以创新驱动未来,重塑智能协作新生态(上)在工业自动化与智能服务深度融合的浪潮中,协作机器人凭借其安全、灵活、易部署的特性,成为推动产业升级的核心力量。
aneasystone本尊17 分钟前
人工智能
使用 MCP 让 Claude Code 集成外部工具MCP(Model Context Protocol,模型上下文协议) 是 Anthropic 于 2024 年 11 月 25 日 推出的开放协议,用于标准化大模型与各类外部工具和数据源之间的交互。
静心问道27 分钟前
人工智能·语音识别
SEW:无监督预训练在语音识别中的性能-效率权衡本文研究了自动语音识别(ASR)中预训练模型的性能-效率权衡问题。我们聚焦于 wav2vec 2.0,并形式化了多种影响模型性能和效率的架构设计。基于所有观察结果,我们提出了 SEW(Squeezed and Efficient Wav2vec)这一预训练模型架构,在多种训练设置中在性能和效率两个维度上都取得了显著改进。例如,在 LibriSpeech 的 100h-960h 半监督设置下,SEW 相比 wav2vec 2.0 实现了 1.9 倍的推理速度提升,同时词错误率相对降低了 13.5%。在相似的
xwz小王子34 分钟前
人工智能·语言模型·自然语言处理
从LLM到WM:大语言模型如何进化成具身世界模型?1.引言这学期在方老师开设的《机器人大模型基础和前沿》选修课上接触并学习了具身智能方面的相关知识。作为交互组的组长,我和组员们在幻尔机器狗的功能开发上有切身的实践与探索,在张江具身智能大会上,也见识到了前沿的技术和行业的发展现状和无限的潜力,这些不仅对我个人能力有提升,还让我有未来在具身智能方面进一步投入的热忱。近年来,大语言模型取得了突破性的进展,人们在工作生活中或多或少地和它们打交道,但其缺乏对物理世界的感知和环境交互的经验,使其无法直接应用在具身智能体上作为“大脑”,这也就引出了世界模型(World
我爱一条柴ya34 分钟前
人工智能·ai·ai作画·ai编程·ai写作
【AI大模型】深入理解 Transformer 架构:自然语言处理的革命引擎Transformer 架构彻底颠覆了自然语言处理(NLP)领域,取代了长期主导的循环神经网络(RNN)和卷积神经网络(CNN)。其核心思想完全摒弃了循环和卷积操作,完全依赖自注意力机制(Self-Attention Mechanism) 来建模序列中元素之间的全局依赖关系,实现了前所未有的并行化能力和对长距离依赖的精准捕获。
静心问道35 分钟前
人工智能·语言模型·自然语言处理
FLAN-T5:规模化指令微调的语言模型在将数据集表述为指令的形式上进行语言模型微调,已被证明能够提升模型性能及其对未见任务的泛化能力。本文探讨了指令微调,特别关注以下三个方面:(1) 任务数量的扩展,(2) 模型规模的扩展,以及 (3) 基于链式思维(chain-of-thought)数据的微调。我们发现,结合上述方面的指令微调显著提升了多种模型类别(如PaLM、T5、U-PaLM)、提示设置(如零样本、少样本、链式思维)以及评估基准(如MMLU、BBH、TyDiQA、MGSM、开放式生成、RealToxicityPrompts)的性能。例如
李师兄说大模型36 分钟前
人工智能·深度学习·机器学习·语言模型·自然语言处理·大模型·deepseek
KDD 2025 | 地理定位中的群体智能:一个多智能体大型视觉语言模型协同框架今天跟大家分享一篇被KDD 25录用的多模态大模型智能体协同框架,该文章提出了一种多智能体大模型协作机制以及一种大模型智能体之间关系的动态学习策略,有效减少了大模型智能体之间冗余的交互次数,从而提高了系统的地理定位效率。具体而言,该论文参考审稿机制与流程来尽最大可能发挥不同大模型智能体对于不同地标的定位能力。同时,根据不同图像定位请求,自适应生成智能体社交网络结构,来规划哪些智能体之间的讨论可以产生对准确定位图像产生正面促进作用的结果。提出的框架在3个数据集上的实验表明,该框架表现显著优于其他目前最先进的
静心问道37 分钟前
人工智能·计算机视觉·自然语言处理
SqueezeBERT:计算机视觉能为自然语言处理在高效神经网络方面带来哪些启示?人类每天阅读和撰写数千亿条消息。得益于大规模数据集、高性能计算系统和更优的神经网络模型,自然语言处理(NLP)技术在理解、校对和组织这些消息方面取得了显著进展。因此,将 NLP 部署于各类应用中,以帮助网页用户、社交网络和企业具有重要价值。特别是,我们认为智能手机和其他移动设备是大规模部署 NLP 模型的关键平台。然而,当今高精度的 NLP 神经网络模型(如 BERT 和 RoBERTa)计算开销极大,例如在 Pixel 3 手机上运行 BERT-base 对一个文本片段进行分类需要约 1.7 秒。本文观
Sherlock Ma37 分钟前
人工智能·百度·自然语言处理·开源·大模型·文心一言·多模态
百度开源文心一言4.5:论文解读和使用入门近日,百度ERNIE团队发布的ERNIE 4.5模型家族。该家族包含10种不同的大规模多模态模型变体,涵盖了47B和3B激活参数的混合专家(MoE)模型,以及拥有424B总参数的模型和一个0.3B的密集模型。这些模型采用了新颖的异构模态结构,支持跨模态的参数共享,同时允许每个模态拥有独立的参数,以增强多模态理解能力,且不会损害文本相关任务的性能。所有模型均使用PaddlePaddle深度学习框架进行高效训练,实现了高性能推理和简化部署。
John_今天务必休息一天1 天前
人工智能·语言模型·自然语言处理·gpt-3
大语言模型预训练数据——数据采样方法介绍以GPT3为例这是 GPT - 3 训练时的数据集配置,核心是非等比例采样——不按数据集原始大小分配训练占比,而是人工设定不同数据集在训练中被抽取的概率(Weight in training mix ),让小数据集也能被多次学习,大数据集适当降低重复度,平衡模型学习广度与深度。
weisian15142 分钟前
人工智能·语言模型·自然语言处理
人工智能-基础篇-18-什么是RAG(检索增强生成:知识库+向量化技术+大语言模型LLM整合的技术框架)RAG(Retrieval-Augmented Generation,检索增强生成)是一种结合外部知识检索与大语言模型(LLM)生成能力的技术框架,旨在提升生成式AI在问答、内容创作等任务中的准确性、实时性和领域适应性。
DataCastle1 小时前
人工智能
第三届Bio-OS AI开源大赛启动会隆重举行2025年7月1日,第三届Bio-OS AI开源大赛启动会在广州国家实验室成功举办,本次活动汇聚了来自广州国家实验室、中山大学、华南理工大学、南方医科大学、中国电信股份有限公司广东分公司、华为技术有限公司、超聚变数字技术有限公司,成都数聚城堡科技有限公司的顶级专家齐聚一堂,共同见证这一生物医学与AI交叉创新大赛的启动。
后端小肥肠1 小时前
人工智能·aigc·coze
躺赚必备!RPA+Coze+豆包:公众号自动发文,AI率0%亲测有效(附AI率0%提示词)大家好,我是小肥肠,专注 AI 干货知识分享!今天手把手教你用 Coze+ RPA +豆包搞定公众号自动采集加发布全流程,全流程保姆级拆解,文内附把AI率降为0的宝藏提示词,感兴趣就往下看!!
摘星编程1 小时前
人工智能·腾讯云·ai代码远征季#h5应用·ai医疗应用·cloudbase开发
CloudBase AI ToolKit实战:从0到1开发一个智能医疗网站🌟 嗨,我是IRpickstars!🌌 总有一行代码,能点亮万千星辰。🔍 在技术的宇宙中,我愿做永不停歇的探索者。
锅挤1 小时前
人工智能·深度学习·神经网络
深度学习5(深层神经网络 + 参数和超参数)深层神经网络是机器学习中一种重要的模型,它通过增加网络的“深度”(即隐藏层的数量)来提升模型对复杂数据的表示和学习能力。同浅层类似,也分为三个部分:
一支烟一朵花1 小时前
人工智能·百度·开源·文心一言
630,百度文心大模型4.5系列开源!真香2025年被普遍认为是AI Agent商业化的关键之年,而大模型正是Agent能力的核心支撑。当开发成本大幅降低,我们很可能看到各种垂直领域的Agent应用如雨后春笋般涌现。
网安INF1 小时前
人工智能·深度学习·神经网络·机器学习
深层神经网络:原理与传播机制详解本文探讨的深层神经网络结构如下:前向传播是数据从输入层流向输出层的过程,计算步骤如下:第一隐藏层: Z [ 1 ] = W [ 1 ] X + b [ 1 ] Z^{[1]} = W^{[1]}X + b^{[1]} Z[1]=W[1]X+b[1] A [ 1 ] = g [ 1 ] ( Z [ 1 ] ) A^{[1]} = g^{[1]}(Z^{[1]}) A[1]=g[1](Z[1])
AIbase20242 小时前
运维·服务器·人工智能
国内MCP服务平台推荐!aibase.cn上线MCP服务器集合平台在当今数字化时代,人工智能技术正以前所未有的速度发展,深刻地改变着我们的生活和工作方式。而要充分发挥AI的强大能力,离不开高效的工具和服务支持。今天,就让我们来了解一下一个专注于MCP(Model Context Protocol)服务的优质平台 —— AIbase。
喜欢吃豆3 小时前
服务器·人工智能·python·深度学习·大模型·github·fastmcp
快速手搓一个MCP服务指南(九): FastMCP 服务器组合技术:构建模块化AI应用的终极方案在AI应用开发中,随着功能复杂度的提升,如何将庞大的系统拆分为可复用、易维护的模块成为关键挑战。FastMCP(Fast Multi-Channel Processing)框架推出的服务器组合(Server Composition)功能,通过import_server和mount两种核心机制,实现了AI服务的静态复制与动态链接,为构建模块化、可扩展的AI系统提供了全新思路。本文将深入解析这一技术的核心原理、应用场景及最佳实践。
星融元asterfusion3 小时前
人工智能·负载均衡·异常路径
基于路径质量的AI负载均衡异常路径检测与恢复策略AI流量往往具有突发性、大象流(大规模数据流)占比高的特点,极易造成网络拥塞热点。一条质量不佳(如高延迟、高丢包、带宽受限)的路径,不仅自身无法有效传输数据,如果ECMP继续向其分发流量,还可能导致该路径上的拥塞加剧,形成恶性循环,进而“污染”整条路径上的流量,波及更多正常应用。因此,构建一个能够实时感知路径质量、动态规避异常路径的智能负载均衡机制,成为支撑高性能AI计算的关键基础设施之一。