技术栈
自然语言处理
2501_94812015
2 小时前
人工智能
·
语言模型
·
自然语言处理
基于量化感知训练的大语言模型压缩方法
随着信息技术的飞速发展,人工智能技术取得了显著的进步,尤其在自然语言处理(NLP)领域,大语言模型(LLMs)如BERT、GPT等展现出卓越的性能。然而,这些模型往往伴随着巨大的计算资源消耗和存储需求,限制了其在实际应用中的普及和推广。为此,本研究旨在探讨基于量化感知训练的大语言模型压缩方法,以下为具体内容:
MARS_AI_
2 小时前
人工智能
·
自然语言处理
·
信息与通信
·
agi
大模型赋能客户沟通,云蝠大模型呼叫实现问题解决全链路闭环
当客户焦急询问订单物流,却在冗长的IVR菜单中反复切换;当人工坐席被重复的咨询耗尽精力,却仍难以保证每一次回复的标准化;当企业为居高不下的客服成本发愁,却始终找不到效率与体验的平衡点——这正是当下多数企业客服服务的真实困境。
名为沙丁鱼的猫729
2 小时前
人工智能
·
深度学习
·
神经网络
·
机器学习
·
自然语言处理
·
nlp
【MCP 协议层(Protocol layer)详解】:深入分析MCP Python SDK中协议层的实现机制
大家好,最近在看MCP Python SDK 的源代码文件https://github.com/modelcontextprotocol/python-sdk/blob/main/src/mcp
阿杰学AI
5 小时前
人工智能
·
ai
·
语言模型
·
自然语言处理
·
agent
·
多智能体协作
·
mas
AI核心知识75——大语言模型之MAS (简洁且通俗易懂版)
多智能体协作 (Multi-Agent Systems,简称 MAS) 是目前 AI 应用架构的“版本答案” 。
shangjian007
9 小时前
人工智能
·
语言模型
·
自然语言处理
AI-大语言模型LLM-概念术语-Dropout
为避免一学就会、一用就废,这里做下笔记Dropout 是一种在神经网络训练过程中使用的正则化技术,通过随机临时丢弃(禁用)一部分神经元来防止模型过拟合。
余俊晖
10 小时前
人工智能
·
语言模型
·
自然语言处理
多模态视觉语言模型:Molmo2训练数据、训练配方
如果想打造自己的VLM模型,不妨看看Molmo2,训练数据、训练配方均开源。最核心的还是这份开源数据。
阿杰学AI
10 小时前
人工智能
·
ai
·
语言模型
·
自然语言处理
·
rag
·
检索增强生成
·
rag2.0
AI核心知识76——大语言模型之RAG 2.0(简洁且通俗易懂版)
RAG 2.0 是对第一代检索增强生成(Retrieval-Augmented Generation, RAG)技术的重大升级,代表了从“拼凑式” 系统向“一体化端到端” 系统的进化。
jay神
11 小时前
人工智能
·
深度学习
·
自然语言处理
·
数据集
·
计算机毕业设计
基于深度学习的交通流量预测系统
本项目为《基于深度学习的交通流量预测系统》,基于真实VANET车辆轨迹数据,实现从数据处理到模型训练、对比分析、可视化展示、预测服务的完整闭环。适用于:本科生研究生课程设计、b设、答辩演示、作品集展示、交流学习。项目为个人原创,禁止商用!
大模型任我行
12 小时前
人工智能
·
语言模型
·
自然语言处理
·
论文笔记
上海AI Lab:构建诊断型Agent守门员
📖标题:AgentDoG: A Diagnostic Guardrail Framework for AI Agent Safety and Security 🌐来源:arXiv, 2601.18491v1
shangjian007
12 小时前
人工智能
·
语言模型
·
自然语言处理
AI-大语言模型LLM-概念术语-Causal LM
为避免一学就会、一用就废,这里做下笔记Causal LM,也称为自回归语言模型,是一种只关注单向上下文的语言模型。在预测下一个词时,它只能看到前面的词,不能看到后面的词。
shangjian007
12 小时前
人工智能
·
语言模型
·
自然语言处理
AI-大语言模型LLM-模型微调2-BitFit微调
为避免一学就会、一用就废,这里做下笔记
玄同765
12 小时前
人工智能
·
语言模型
·
自然语言处理
·
中间件
·
langchain
·
agent
·
智能体
LangChain v1.0 中间件深度解析:从 Callback 到 Middleware 的演进
【个人主页:玄同765】大语言模型(LLM)开发工程师|中国传媒大学·数字媒体技术(智能交互与游戏设计)
量子-Alex
12 小时前
人工智能
·
语言模型
·
自然语言处理
【大模型技术报告】通义千问-VL:一款多功能视觉语言模型,支持理解、定位、文本识别等广泛任务
Qwen-VL: A Versatile Vision-Language Model for Understanding, Localization, Text Reading, and Beyond 通义千问-VL:一款多功能视觉语言模型,支持理解、定位、文本识别等广泛任务
vlln
1 天前
人工智能
·
语言模型
·
自然语言处理
【论文速读】递归语言模型 (Recursive Language Models): 将上下文作为环境的推理范式
论文标题: Recursive Language Models作者: Alex L. Zhang 1 {^1} 1, Tim Kraska 1 {^1} 1, Omar Khattab 1 {^1} 1 (MIT CSAIL)
玄同765
1 天前
人工智能
·
语言模型
·
自然语言处理
·
langchain
·
nlp
·
agent
·
智能体
告别 AgentExecutor:LangChain v1.0+ Agent 模块深度迁移指南与实战全解析
【个人主页:玄同765】大语言模型(LLM)开发工程师|中国传媒大学·数字媒体技术(智能交互与游戏设计)
阿杰学AI
1 天前
人工智能
·
ai
·
语言模型
·
自然语言处理
·
aigc
·
agent
·
react范式
AI核心知识74——大语言模型之ReAct 范式(简洁且通俗易懂版)
ReAct 范式 是 Reasoning(推理)+ Acting(行动)的缩写。它是目前构建 AI Agent(智能体) 最主流、最核心的模式。
DisonTangor
1 天前
人工智能
·
语言模型
·
自然语言处理
·
开源
·
aigc
美团龙猫开源LongCat-Flash-Lite
我们推出LongCat-Flash-Lite——一款具备256k上下文窗口(通过YaRN方法实现)的非思考型混合专家模型(MoE),总参数量达685亿,其中激活参数量约30亿。该模型在LongCat-Flash架构基础上创新性地融合了N元嵌入表技术,不仅显著提升模型性能,更实现了推理速度的突破性进展。尽管为嵌入层分配了超过300亿参数,LongCat-Flash-Lite不仅超越了同等参数规模的MoE基线模型,更在智能体应用与代码生成领域展现出与同量级模型的卓越竞争力。
AI浩
1 天前
人工智能
·
语言模型
·
自然语言处理
PaddleOCR-VL-1.5:迈向用于鲁棒真实场景文档解析的多任务9亿参数视觉语言模型
程翠、孙挺、梁素银、高庭荃、张泽伦、刘嘉轩、王雪晴、周常达、刘鸿恩、林曼慧、张越、张玉波、刘毅、余殿海、马艳军
童话名剑
1 天前
人工智能
·
深度学习
·
机器学习
·
自然语言处理
·
nlp
·
词嵌入
自然语言处理(吴恩达深度学习笔记)
目录1.词表示 / 词表征(1)引言2.词嵌入(word embeddings)(1)简介(2)t-SNE算法
Blossom.118
2 天前
人工智能
·
python
·
深度学习
·
fpga开发
·
自然语言处理
·
矩阵
·
django
从数字大脑到物理实体:具身智能时代的大模型微调与部署实战
2025年,人工智能正在经历一场从"数字大脑"到"物理实体"的深刻变革。随着宇树科技H1机器人完成"韦伯斯特空翻"、智元远征A1进入蔚来汽车产线、优必选Walker S2在比亚迪工厂实训,具身智能(Embodied Intelligence)已从实验室概念加速走向产业化落地。