语言模型

J_Xiong01173 小时前
人工智能·机器学习·语言模型
【VLNs篇】05:TGS-在无地图室外环境中使用视觉语言模型进行轨迹生成和选择具体实现流程该论文提出的TGS(Trajectory Generation and Selection)算法流程如下:
DisonTangor5 小时前
人工智能·语言模型·自然语言处理
MMaDA——开源首个多模态大扩散语言模型MMaDA是一个全新的多模态扩散基础模型家族,旨在文本推理、多模态理解和文生图等多个领域实现卓越性能。该模型凭借三大创新点脱颖而出:
Jamence5 小时前
论文阅读·人工智能·计算机视觉·语言模型·论文笔记
多模态大语言模型arxiv论文略读(八十八)➡️ 论文标题:MammothModa: Multi-Modal Large Language Model ➡️ 论文作者:Qi She, Junwen Pan, Xin Wan, Rui Zhang, Dawei Lu, Kai Huang ➡️ 研究机构: ByteDance, Beijing, China ➡️ 问题背景:多模态大型语言模型(MLLMs)在理解视觉输入并生成语言方面表现出色,广泛应用于图像描述、视觉问答和视频分析等领域。然而,这些模型在处理高分辨率和长时间视觉输入时,仍面临有效结合复
一点.点5 小时前
人工智能·语言模型
视觉语言模型(Vision-Language Model, VLM)的简单介绍目录1. 起源与历史2. 核心技术与原理3. 优势4. 应用领域5. 技术难点与挑战6. 学习方法与路径
kebijuelun6 小时前
人工智能·深度学习·语言模型·aigc·transformer
BLIP3-o:理解和生成统一的多模态模型随着gpt4o图像生成和编辑的应用火爆,如何构造能够同时处理图像理解和生成任务的统一多模态模型,成为研究的热点。
一点.点7 小时前
人工智能·语言模型
VLA视觉语言动作大模型的简单介绍目录1. 起源与历史背景2. 技术架构与核心优势3. 应用领域与典型案例4. 技术难点与挑战5. 学习路径建议
天天爱吃肉82189 小时前
语言模型·汽车·llama
【 大模型技术驱动智能网联汽车革命:关键技术解析与未来趋势】关键词总结:2024年,智能网联汽车市场渗透率突破35%(数据来源:中国汽车工业协会),大模型技术已成为车企争夺的“技术制高点”。从ChatGPT到华为盘古,大模型凭借千亿级参数规模和多模态推理能力,正在重构汽车智能化的技术栈。本文将深度解析大模型在感知、决策、交互等场景的落地逻辑,并揭示未来技术演进方向。
小爷毛毛(卓寿杰)12 小时前
人工智能·深度学习·语言模型·自然语言处理·架构
深入解读Qwen3技术报告(三):深入剖析Qwen3模型架构重磅推荐专栏: 《大模型AIGC》 《课程大纲》 《知识星球》本专栏致力于探索和讨论当今最前沿的技术趋势和应用领域,包括但不限于ChatGPT和Stable Diffusion等。我们将深入研究大型模型的开发和应用,以及与之相关的人工智能生成内容(AIGC)技术。通过深入的技术解析和实践经验分享,旨在帮助读者更好地理解和应用这些领域的最新进展
Panesle13 小时前
人工智能·语言模型·自然语言处理·开源·大模型·语音识别
开源轻量级语音合成和语音克隆模型:OuteTTS-1.0-0.6BOuteTTS Version 1.0 在语音合成和语音克隆方面带来了重大改进,提供了更强大、准确且用户友好的体验,同时保持了紧凑的体积。
聚客AI1 天前
人工智能·pytorch·深度学习·神经网络·语言模型·自然语言处理·transformer
PyTorch高阶技巧:构建非线性分类器与梯度优化全解析本文较长,建议点赞收藏,以免遗失。更多AI大模型应用开发学习视频及资料,尽在聚客AI学院。线性回归模型定义为:
摩尔线程1 天前
算法·语言模型·大模型·gpu算力·gpu·摩尔线程
推测解码算法在 MTT GPU 的应用实践目前主流的大模型自回归解码每一步都只生成一个token, 尽管kv cache等技术可以提升解码的效率,但是单个样本的解码速度依然受限于访存瓶颈,即模型需要频繁从内存中读取和写入数据,此时GPU的利用率有限。为了解决这种问题,VLLM框架中提出的continues batching的推理方式则是充分利用批量推理来缓解或避免访存瓶颈,极大的提升了推理系统的吞吐量。不同于VLLM等框架在系统层面的加速优化,本文所想要介绍的推测解码(speculative decoding)技术则是聚焦于算法层面的加速优化,其
西西阿西哥1 天前
人工智能·语言模型·自然语言处理
【人工智障生成日记1】从零开始训练本地小语言模型本项目旨在以学习为目的,从头构建一个完整的本地语言模型训练管线。目标是:自定义实现 MiniGPTPrompt: "Once upon a time" Output: time time time time time time...
脚踏实地的大梦想家1 天前
语言模型·大模型·prompt·提示词·上下文学习·提示词工程·icl
【ICL】上下文学习随着模型参数规模与训练数据量的持续增长,大语言模型涌现出上下文学习(In-Context Learning,ICL)能力。该能力,使语言模型无需再针对某个任务特定训练一个模型或者在预训练模型上微调,而是通过上下文,快速适应下游任务。 这种通过页面或者 API 能够及其快速适应下游任务的模式,也被称为“语言模型即服务(LLM as Service)”。
正在走向自律1 天前
人工智能·语言模型·自然语言处理·llm·didy
探索Dify:开启大语言模型应用开发新时代摘要:在AI技术迅速发展的背景下,Dify作为一款开源的大语言模型应用开发平台,为开发者提供了便捷高效的解决方案。Dify支持多种主流大语言模型,如GPT、Mistral、Llama3等,并通过低代码/无代码开发方式,降低了开发门槛。其核心特性包括多模型支持、丰富的功能组件和灵活的应用编排,适用于智能客服、内容生成、数据分析等多个应用场景。Dify通过可视化的界面和强大的RAG引擎,帮助开发者快速构建和优化AI应用,显著提高了开发效率和应用质量。与同类产品相比,Dify在API优先、灵活应用编排和插件生态
_Tenk_1 天前
java·spring boot·语言模型·ai编程·智能体·coze扣子
Java SpringBoot 扣子CozeAI SseEmitter流式对话完整实战 打字机效果书接上回:springBoot 整合 扣子cozeAI 智能体 对话https://blog.csdn.net/weixin_44548582/article/details/147457236
Panesle1 天前
人工智能·语言模型·ffmpeg·开源·音视频·语音识别
ten-vad:低延迟、轻量化且高性能的流式语音活动检测系统TEN VAD 是一款面向企业级应用的实时语音活动检测系统,能够提供精准的帧级语音活动检测。与行业内常用的 WebRTC VAD 和 Silero VAD 相比,TEN VAD 展现出了更优越的精度。同时,相较于 Silero VAD,TEN VAD 具备更低的计算复杂度和更少的内存占用。其架构的时间效率优势使得语音活动检测速度极快,大幅降低了对话式 AI 系统中的端到端响应延迟和轮次检测延迟。
路人与大师2 天前
大数据·语言模型·策略模式
构建基于全面业务数据的大数据与大模型企业护城河战略引言:数据与AI驱动的专精企业未来在数字化浪潮和人工智能技术飞速发展的今天,对于“专精特新”型企业而言,如何利用自身积累的深厚行业知识和独特的业务数据,结合大数据分析与大模型能力,构建难以被复制的竞争壁垒(即“护城河”),是实现可持续增长和行业领导地位的核心议题。本战略旨在阐述如何围绕全面的专精业务数据,系统性地设计和构建这一护城河。
武子康2 天前
数据库·redis·语言模型
大语言模型 18 - MCP Model Context Protocol 基本项目 测试案例官方地址:● MCP 主机(MCP Hosts):像 Claude Desktop、IDE 或 AI 工具等程序,它们希望通过 MCP 访问数据。 ● MCP 客户端(MCP Clients):维护与服务器 1:1 连接的协议客户端。 ● MCP 服务器(MCP Servers):轻量级程序,它们通过标准化的模型上下文协议(Model Context Protocol)公开特定的功能。 ● 本地数据源(Local Data Sources):你的计算机上的文件、数据库和服务,MCP 服务器可以安全地访问这
Jamence2 天前
论文阅读·人工智能·语言模型·自然语言处理·论文笔记
多模态大语言模型arxiv论文略读(八十九)➡️ 论文标题:MMRo: Are Multimodal LLMs Eligible as the Brain for In-Home Robotics? ➡️ 论文作者:Jinming Li, Yichen Zhu, Zhiyuan Xu, Jindong Gu, Minjie Zhu, Xin Liu, Ning Liu, Yaxin Peng, Feifei Feng, Jian Tang ➡️ 研究机构: Midea Group、Shanghai University、University of
芷栀夏2 天前
人工智能·语言模型·自然语言处理
Dify大语言模型应用开发环境搭建:打造个性化本地LLM应用开发工作台各位小伙伴们,大家好!今天我们要来一场技术大冒险,手把手教你如何在Linux Ubuntu系统上使用Docker快速部署大语言模型应用开发平台Dify,并且借助神奇的内网穿透工具cpolar,在没有公网IP或云服务器的情况下也能让朋友们轻松访问你的本地Dify服务。是不是听起来很带劲?