自然语言处理

玄同76512 分钟前
人工智能·语言模型·自然语言处理·langchain·nlp·agent·智能体
告别 AgentExecutor:LangChain v1.0+ Agent 模块深度迁移指南与实战全解析【个人主页:玄同765】大语言模型(LLM)开发工程师|中国传媒大学·数字媒体技术(智能交互与游戏设计)
阿杰学AI39 分钟前
人工智能·ai·语言模型·自然语言处理·aigc·agent·react范式
AI核心知识74——大语言模型之ReAct 范式(简洁且通俗易懂版)ReAct 范式 是 Reasoning(推理)+ Acting(行动)的缩写。它是目前构建 AI Agent(智能体) 最主流、最核心的模式。
DisonTangor1 小时前
人工智能·语言模型·自然语言处理·开源·aigc
美团龙猫开源LongCat-Flash-Lite我们推出LongCat-Flash-Lite——一款具备256k上下文窗口(通过YaRN方法实现)的非思考型混合专家模型(MoE),总参数量达685亿,其中激活参数量约30亿。该模型在LongCat-Flash架构基础上创新性地融合了N元嵌入表技术,不仅显著提升模型性能,更实现了推理速度的突破性进展。尽管为嵌入层分配了超过300亿参数,LongCat-Flash-Lite不仅超越了同等参数规模的MoE基线模型,更在智能体应用与代码生成领域展现出与同量级模型的卓越竞争力。
AI浩6 小时前
人工智能·语言模型·自然语言处理
PaddleOCR-VL-1.5:迈向用于鲁棒真实场景文档解析的多任务9亿参数视觉语言模型程翠、孙挺、梁素银、高庭荃、张泽伦、刘嘉轩、王雪晴、周常达、刘鸿恩、林曼慧、张越、张玉波、刘毅、余殿海、马艳军
童话名剑8 小时前
人工智能·深度学习·机器学习·自然语言处理·nlp·词嵌入
自然语言处理(吴恩达深度学习笔记)目录1.词表示 / 词表征(1)引言2.词嵌入(word embeddings)(1)简介(2)t-SNE算法
Blossom.1189 小时前
人工智能·python·深度学习·fpga开发·自然语言处理·矩阵·django
从数字大脑到物理实体:具身智能时代的大模型微调与部署实战2025年,人工智能正在经历一场从"数字大脑"到"物理实体"的深刻变革。随着宇树科技H1机器人完成"韦伯斯特空翻"、智元远征A1进入蔚来汽车产线、优必选Walker S2在比亚迪工厂实训,具身智能(Embodied Intelligence)已从实验室概念加速走向产业化落地。
言無咎9 小时前
人工智能·机器学习·自然语言处理
海量数据下的审计困境:基于AI系统的财务新解法在一次大型企业的年度审计中,审计团队发现一笔数额巨大的财务支出存在异常。传统审计系统在面对复杂交易和海量数据时,只能进行简单的规则匹配和数据比对,无法深入分析业务逻辑和潜在风险。审计人员花费了大量时间进行人工核查,才发现是由于业务部门与财务部门沟通不畅,导致财务记录与实际业务不符。这一事件暴露了传统审计系统缺乏“业务理解”和智能分析能力的硬伤,不仅耗费了大量的人力和时间,还可能遗漏重要的审计风险。
MARS_AI_9 小时前
人工智能·自然语言处理·信息与通信·agi
AI重构企业沟通:云蝠智能大模型如何重塑客户服务生态企业主最恐惧的不是疯狂涌进的咨询量,而是流失的客户可能正在用1次占线体验抵消10次广告投放的努力。传统客服系统已成为企业运营效率的“绞肉机”,吞噬着利润与客户信任。
hans汉斯9 小时前
人工智能·深度学习·算法·机器学习·自然语言处理·硬件架构·汉斯出版社
基于语义增强与规则引导的弱监督视频异常检测方法视频异常检测(Video Anomaly Detection, VAD)旨在从长时间监控视频中自动识别异常事件,是智能安防与智能交通等场景中的关键技术。受限于异常事件的稀有性与标注成本,现有方法多采用弱监督学习范式,但仍普遍面临异常语义表达不足、跨模态对齐失效以及标签噪声导致训练不稳定等问题。针对上述挑战,本文提出基于语义增强与规则引导的SAGE-VAD (Semantic-Augmented & Guided Enhancement for VAD)框架。设计混合提示集成(Hybrid Prompt E
薛定谔的猫19829 小时前
人工智能·深度学习·自然语言处理·分类·bert·大模型 训练 调优
十一、基于 BERT 的中文文本情感分类模型训练全解析在自然语言处理(NLP)领域,中文文本情感分类是一项兼具实用价值与技术代表性的任务,广泛应用于电商评论分析、舆情监控、客户反馈处理等场景。传统机器学习模型难以捕捉中文的深层语义与语境信息,而预训练语言模型的出现,为该任务提供了高效、高精度的解决方案。
阿杰学AI9 小时前
人工智能·机器学习·ai·语言模型·自然语言处理·aigc·共享向量空间
AI核心知识73——大语言模型之Shared Vector Space(简洁且通俗易懂版)共享的向量空间 (Shared Vector Space) 是多模态大模型能够“看图说话”、“听音画图”或者“跨语言思考”的根本数学基础。
阿龙AI日记21 小时前
深度学习·自然语言处理·nlp·bert
快速学会BERT模型!在开始学习BERT之前,我们来简要回顾一下Transformer模型。我们需要将输入转化为模型可以理解的数学形式。具体过程为: 首先将单词或者句子转换为一个固定维度的向量,得到词嵌入,这个过程采用的方法有比如Word2Ved、Glove等。
Loo国昌1 天前
人工智能·后端·深度学习·算法·语言模型·自然语言处理·transformer
【Transformer解析】第二阶段:深度解析Encoder、Decoder与Encoder-Decoder架构了解不同架构的特长,选择最适合你任务的模型。在第1阶段中,我们深入学习了Transformer的核心机制——注意力、位置编码、前馈网络。但你是否好奇:为什么BERT擅长理解文本,而GPT擅长生成文本?为什么有的模型既能理解又能生成?
Hugging Face1 天前
人工智能·语言模型·自然语言处理
推出 AnyLanguageModel:在 Apple 平台统一本地与远程大语言模型的 API大语言模型 (LLM) 已成为构建现代软件不可或缺的工具。 但对于 Apple 平台的开发者来说,集成这些模型仍然不够友好。
YMWM_1 天前
人工智能·语言模型·自然语言处理
LoRA论文分析:低秩适应大型语言模型这篇论文针对大型预训练语言模型(如GPT-3 175B)在下游任务微调时面临的几个关键挑战:参数效率问题:完全微调需要为每个下游任务保存一个完整模型副本,对GPT-3这样的超大规模模型来说,存储成本极其高昂。
一招定胜负1 天前
人工智能·自然语言处理·nlp
回顾:cbow连续词袋与词嵌入目录一、先明确核心目标:二、逐段拆解:代码的每一步,都藏着知识点第一步:导入依赖库,做好准备工作第二步:语料预处理——把原始文本变成模型能“看懂”的数据
玄同7651 天前
人工智能·语言模型·自然语言处理·langchain·nlp·知识图谱·向量数据库
LangChain v1.0+ Memory 全类型指南:构建上下文感知大模型应用的核心方案【个人主页:玄同765】大语言模型(LLM)开发工程师|中国传媒大学·数字媒体技术(智能交互与游戏设计)
AIGC_ZY1 天前
人工智能·语言模型·自然语言处理
从LLM2Vec到语义对齐:大语言模型作为文本编码器的双重突破标题: LLM2Vec: Large Language Models Are Secretly Powerful Text Encoders
阿杰学AI1 天前
人工智能·ai·语言模型·自然语言处理·aigc·prompt caching·提示词缓存
AI核心知识71——大语言模型之Prompt Caching (简洁且通俗易懂版)Prompt Caching (提示词缓存) 是 2024 年下半年开始在各大模型厂商(如 Anthropic, Google, DeepSeek)中普及的一项“降本增效”黑科技 。
阿杰学AI2 天前
人工智能·ai·语言模型·自然语言处理·aigc·数据处理·上下文工程
AI核心知识70——大语言模型之Context Engineering(简洁且通俗易懂版)上下文工程 (Context Engineering) 是随着大模型上下文窗口(Context Window)越来越大(从 4k 到 100万+ Token)而诞生的一门“信息整理术” 。