自然语言处理

shangjian0073 小时前
人工智能·语言模型·自然语言处理
AI-大语言模型LLM-概念术语-Dropout为避免一学就会、一用就废,这里做下笔记Dropout 是一种在神经网络训练过程中使用的正则化技术,通过随机临时丢弃(禁用)一部分神经元来防止模型过拟合。
余俊晖3 小时前
人工智能·语言模型·自然语言处理
多模态视觉语言模型:Molmo2训练数据、训练配方如果想打造自己的VLM模型,不妨看看Molmo2,训练数据、训练配方均开源。最核心的还是这份开源数据。
阿杰学AI4 小时前
人工智能·ai·语言模型·自然语言处理·rag·检索增强生成·rag2.0
AI核心知识76——大语言模型之RAG 2.0(简洁且通俗易懂版)RAG 2.0 是对第一代检索增强生成(Retrieval-Augmented Generation, RAG)技术的重大升级,代表了从“拼凑式” 系统向“一体化端到端” 系统的进化。
jay神4 小时前
人工智能·深度学习·自然语言处理·数据集·计算机毕业设计
基于深度学习的交通流量预测系统本项目为《基于深度学习的交通流量预测系统》,基于真实VANET车辆轨迹数据,实现从数据处理到模型训练、对比分析、可视化展示、预测服务的完整闭环。适用于:本科生研究生课程设计、b设、答辩演示、作品集展示、交流学习。项目为个人原创,禁止商用!
大模型任我行5 小时前
人工智能·语言模型·自然语言处理·论文笔记
上海AI Lab:构建诊断型Agent守门员📖标题:AgentDoG: A Diagnostic Guardrail Framework for AI Agent Safety and Security 🌐来源:arXiv, 2601.18491v1
shangjian0075 小时前
人工智能·语言模型·自然语言处理
AI-大语言模型LLM-概念术语-Causal LM为避免一学就会、一用就废,这里做下笔记Causal LM,也称为自回归语言模型,是一种只关注单向上下文的语言模型。在预测下一个词时,它只能看到前面的词,不能看到后面的词。
shangjian0075 小时前
人工智能·语言模型·自然语言处理
AI-大语言模型LLM-模型微调2-BitFit微调为避免一学就会、一用就废,这里做下笔记
玄同7655 小时前
人工智能·语言模型·自然语言处理·中间件·langchain·agent·智能体
LangChain v1.0 中间件深度解析:从 Callback 到 Middleware 的演进【个人主页:玄同765】大语言模型(LLM)开发工程师|中国传媒大学·数字媒体技术(智能交互与游戏设计)
量子-Alex6 小时前
人工智能·语言模型·自然语言处理
【大模型技术报告】通义千问-VL:一款多功能视觉语言模型,支持理解、定位、文本识别等广泛任务Qwen-VL: A Versatile Vision-Language Model for Understanding, Localization, Text Reading, and Beyond 通义千问-VL:一款多功能视觉语言模型,支持理解、定位、文本识别等广泛任务
vlln16 小时前
人工智能·语言模型·自然语言处理
【论文速读】递归语言模型 (Recursive Language Models): 将上下文作为环境的推理范式论文标题: Recursive Language Models作者: Alex L. Zhang 1 {^1} 1, Tim Kraska 1 {^1} 1, Omar Khattab 1 {^1} 1 (MIT CSAIL)
玄同76521 小时前
人工智能·语言模型·自然语言处理·langchain·nlp·agent·智能体
告别 AgentExecutor:LangChain v1.0+ Agent 模块深度迁移指南与实战全解析【个人主页:玄同765】大语言模型(LLM)开发工程师|中国传媒大学·数字媒体技术(智能交互与游戏设计)
阿杰学AI1 天前
人工智能·ai·语言模型·自然语言处理·aigc·agent·react范式
AI核心知识74——大语言模型之ReAct 范式(简洁且通俗易懂版)ReAct 范式 是 Reasoning(推理)+ Acting(行动)的缩写。它是目前构建 AI Agent(智能体) 最主流、最核心的模式。
DisonTangor1 天前
人工智能·语言模型·自然语言处理·开源·aigc
美团龙猫开源LongCat-Flash-Lite我们推出LongCat-Flash-Lite——一款具备256k上下文窗口(通过YaRN方法实现)的非思考型混合专家模型(MoE),总参数量达685亿,其中激活参数量约30亿。该模型在LongCat-Flash架构基础上创新性地融合了N元嵌入表技术,不仅显著提升模型性能,更实现了推理速度的突破性进展。尽管为嵌入层分配了超过300亿参数,LongCat-Flash-Lite不仅超越了同等参数规模的MoE基线模型,更在智能体应用与代码生成领域展现出与同量级模型的卓越竞争力。
AI浩1 天前
人工智能·语言模型·自然语言处理
PaddleOCR-VL-1.5:迈向用于鲁棒真实场景文档解析的多任务9亿参数视觉语言模型程翠、孙挺、梁素银、高庭荃、张泽伦、刘嘉轩、王雪晴、周常达、刘鸿恩、林曼慧、张越、张玉波、刘毅、余殿海、马艳军
童话名剑1 天前
人工智能·深度学习·机器学习·自然语言处理·nlp·词嵌入
自然语言处理(吴恩达深度学习笔记)目录1.词表示 / 词表征(1)引言2.词嵌入(word embeddings)(1)简介(2)t-SNE算法
Blossom.1181 天前
人工智能·python·深度学习·fpga开发·自然语言处理·矩阵·django
从数字大脑到物理实体:具身智能时代的大模型微调与部署实战2025年,人工智能正在经历一场从"数字大脑"到"物理实体"的深刻变革。随着宇树科技H1机器人完成"韦伯斯特空翻"、智元远征A1进入蔚来汽车产线、优必选Walker S2在比亚迪工厂实训,具身智能(Embodied Intelligence)已从实验室概念加速走向产业化落地。
言無咎1 天前
人工智能·机器学习·自然语言处理
海量数据下的审计困境:基于AI系统的财务新解法在一次大型企业的年度审计中,审计团队发现一笔数额巨大的财务支出存在异常。传统审计系统在面对复杂交易和海量数据时,只能进行简单的规则匹配和数据比对,无法深入分析业务逻辑和潜在风险。审计人员花费了大量时间进行人工核查,才发现是由于业务部门与财务部门沟通不畅,导致财务记录与实际业务不符。这一事件暴露了传统审计系统缺乏“业务理解”和智能分析能力的硬伤,不仅耗费了大量的人力和时间,还可能遗漏重要的审计风险。
MARS_AI_1 天前
人工智能·自然语言处理·信息与通信·agi
AI重构企业沟通:云蝠智能大模型如何重塑客户服务生态企业主最恐惧的不是疯狂涌进的咨询量,而是流失的客户可能正在用1次占线体验抵消10次广告投放的努力。传统客服系统已成为企业运营效率的“绞肉机”,吞噬着利润与客户信任。
hans汉斯1 天前
人工智能·深度学习·算法·机器学习·自然语言处理·硬件架构·汉斯出版社
基于语义增强与规则引导的弱监督视频异常检测方法视频异常检测(Video Anomaly Detection, VAD)旨在从长时间监控视频中自动识别异常事件,是智能安防与智能交通等场景中的关键技术。受限于异常事件的稀有性与标注成本,现有方法多采用弱监督学习范式,但仍普遍面临异常语义表达不足、跨模态对齐失效以及标签噪声导致训练不稳定等问题。针对上述挑战,本文提出基于语义增强与规则引导的SAGE-VAD (Semantic-Augmented & Guided Enhancement for VAD)框架。设计混合提示集成(Hybrid Prompt E
薛定谔的猫19821 天前
人工智能·深度学习·自然语言处理·分类·bert·大模型 训练 调优
十一、基于 BERT 的中文文本情感分类模型训练全解析在自然语言处理(NLP)领域,中文文本情感分类是一项兼具实用价值与技术代表性的任务,广泛应用于电商评论分析、舆情监控、客户反馈处理等场景。传统机器学习模型难以捕捉中文的深层语义与语境信息,而预训练语言模型的出现,为该任务提供了高效、高精度的解决方案。