自然语言处理

海边夕阳200635 分钟前
人工智能·深度学习·计算机视觉·语言模型·自然语言处理
【每天一个AI小知识】:什么是自然语言处理?目录一、小明的智能助手:从故事说起二、自然语言处理的基本概念2.1 什么是自然语言处理?2.2 自然语言处理的核心任务
钛投标免费AI标书工具19 小时前
人工智能·深度学习·自然语言处理·知识图谱
银奖·钛投标荣获华为技术有限公司主办昇腾AI大赛华中区决赛银奖2025年11月26日,由华为技术有限公司主办的昇腾AI创新大赛2025华中区域赛在武汉光谷圆满收官。景网数据服务(武汉)有限公司自主研发的“钛投标AI解决方案”,从343支参赛团队中突围,斩获企业赛道银奖,以硬核技术实力赢得华为这一民营硬科技顶流企业的权威肯定,成为招投标AI领域与昇腾生态深度融合的标杆案例。
q_302381955619 小时前
华为·自然语言处理·bert
华为Atlas310意图识别如何实现?✨ 前言:为啥选Atlas310做BERT意图识别?在NLP落地场景中,意图识别是智能客服、智能音箱等产品的核心模块,而BERT模型虽精度出色,但部署时的性能与资源占用问题一直是痛点。华为Atlas 310作为面向边缘场景的高能效AI处理器,凭借昇腾310芯片的强大算力,能完美平衡BERT推理的速度与成本,特别适合边缘端轻量化部署需求。
Kyln.Wu1 天前
人工智能·python·自然语言处理
【python实用小脚本-315】跨界应用 | 烹饪爱好者如何用Python改造传统选菜流程?自然语言处理×美食推荐的化学反应,轻松实现AI菜谱生成作为HR,我曾用整整3小时手动匹配一份"Python工程师"岗位的200份简历——直到发现"关键词漏筛"让我错过一位优质候选人,直接损失15万年薪的猎头返佣。那个瞬间我意识到:重复性文本匹配必须交给算法。
小陈phd1 天前
人工智能·语言模型·自然语言处理
大模型从入门到精通(一)——大语言模型微调的前沿技术与应用大模型(以 LLaMA-65B 为代表)是参数规模超十亿级的 AI 模型,核心特点是 “大参数 + 大数据训练”: 它通过海量数据(文本、图像等)学习通用规律,能处理复杂任务(如对话、创作、推理); 对比传统模型(如 ResNet50 仅 2500 万参数),大模型参数量(650 亿)和内存需求(780GB)呈指数级增长,代价是更高算力成本,但能实现更强的泛化能力与智能表现。
阿杰学AI2 天前
人工智能·ai·语言模型·自然语言处理·语音识别·asr·自动语音识别
AI核心知识33——大语言模型之ASR(简洁且通俗易懂版)ASR 是 Automatic Speech Recognition(自动语音识别)的缩写。在人工智能和大语言模型的生态系统中,ASR 的角色非常简单明确:它是 AI 的“耳朵”。
kebijuelun2 天前
人工智能·语言模型·自然语言处理
Nemotron-Flash: Towards Latency-Optimal Hybrid Small Language ModelsPaper nameNemotron-Flash: Towards Latency-Optimal Hybrid Small Language Models
阿杰学AI2 天前
人工智能·ai·语言模型·自然语言处理·aigc·语音识别·多模态语音
AI核心知识32——大语言模型之多模态语音(简洁且通俗易懂版)多模态语音(Multimodal Voice / Audio) 是指大语言模型不仅能“看懂”文字和图片,还能直接“听懂”声音并“说出”声音的能力。
极客BIM工作室2 天前
人工智能·语言模型·自然语言处理
AI导读AI论文: DeepSeek-V3.2: Pushing the Frontier of Open Large Language ModelsDeepSeek-V3.2是DeepSeek-AI推出的开源大语言模型,核心突破在于通过DeepSeek Sparse Attention (DSA) 机制将长上下文场景下的计算复杂度从O(L2)O(L^2)O(L2)降至O(Lk)O(Lk)O(Lk)(k为选中token数),在保证性能的同时提升计算效率;依托可扩展强化学习(RL)框架(后训练计算量超预训练成本10%),其基础版在推理任务上与GPT-5表现相当,高计算变体DeepSeek-V3.2-Speciale更超越GPT-5,在2025年国际数学奥
辰阳星宇2 天前
人工智能·算法·自然语言处理
【Agent】rStar2-Agent: Agentic Reasoning Technical Report论文:https://arxiv.org/pdf/2508.20722 代码:rStar简介:rStar2-Agent 是微软研究院推出的 14B 数学推理模型,通过智能体强化学习(agentic RL)实现前沿性能,核心是让模型 “更智能思考” 而非仅 “更长思考”。 其关键创新包括三点:一是高效 RL 基础设施,支持 45K 并发 Python 工具调用,平均延迟 0.3 秒,搭配负载均衡调度器提升 GPU 利用率;二是 GRPO-RoC 算法,通过 “正确轨迹重采样” 策略过滤代码环境噪声,解决仅结
玖日大大3 天前
人工智能·自然语言处理
NLP—— 让机器读懂人类语言的艺术与科学https://www.captainbed.cn/jrhttps://www.captainbed.cn/jr
Sheffi663 天前
人工智能·语言模型·自然语言处理
大语言模型 (LLM) 在 App 中的集成方式随着 ChatGPT、Claude、文心一言、讯飞星火等大语言模型的爆发式增长,越来越多的 App 开始集成 AI 能力。无论是智能客服、内容生成、代码辅助还是个性化推荐,LLM 都能带来革命性的用户体验提升。
中國龍在廣州3 天前
人工智能·深度学习·算法·语言模型·自然语言处理·chatgpt·机器人
李飞飞最新思考:语言模型救不了机器人过去几年里,AI 行业的节奏快得近乎失真。模型一次次刷新极限,产品迭代像在抢时间,讨论从“推理成本”到“智能涌现”再到“AGI 时间表”,情绪在乐观与焦虑之间来回摆动。
蛋王派3 天前
深度学习·机器学习·自然语言处理
深度解析 Qwen大语言模型流程:全流程算子逻辑与维度变换详解在大语言模型的应用与优化中,深入理解其推理流程和算子逻辑是核心前提。Qwen2.5-32B 作为一款性能优异的开源大模型,具备以下核心架构参数:
lxmyzzs3 天前
人工智能·自然语言处理
vLLM、SGLang 与 TensorRT-LLM 综合对比分析报告注:SGLang 本身是调度层,可后接 vLLM 或 TensorRT-LLM 作为执行后端。实测参考(Llama-3-8B,A100 80GB):
阿杰学AI3 天前
人工智能·语言模型·自然语言处理·aigc·agi·cot·思维链
AI核心知识30——大语言模型之CoT(简洁且通俗易懂版)CoT 是 Chain-of-Thought(思维链)的缩写。它是提示工程(Prompt Engineering)中最著名、最有效、也是最神奇的一种技术。
阿杰学AI3 天前
人工智能·ai·语言模型·自然语言处理·aigc·embedding·多模态理解
AI核心知识31——大语言模型之Multimodal Understanding(简洁且通俗易懂版)多模态理解 (Multimodal Understanding) 是多模态技术中侧重于 “输入” 和 “感知” 的那一面。
AI浩4 天前
人工智能·语言模型·自然语言处理
DeepSeek-V3.2:推动开源大型语言模型的前沿发展我们介绍了DeepSeek-V3.2,这是一个在高效计算与卓越推理及智能体性能之间取得平衡的模型。DeepSeek-V3.2的关键技术突破如下:(1) DeepSeek稀疏注意力(DSA):我们引入了DSA,这是一种高效注意力机制,在保持长上下文场景中模型性能的同时,大幅降低了计算复杂度。(2) 可扩展的强化学习框架:通过实施稳健的强化学习协议并扩展后训练计算,DeepSeek-V3.2的表现与GPT-5相当。值得注意的是,我们的高计算变体DeepSeek-V3.2-Speciale超越了GPT-5,其推
二号小明5 天前
人工智能·计算机视觉·自然语言处理·github
Google & GitHub OAuth 第三方注册、登录快速配置指南!最近在做些项目,用到了第三方的注册登录方式,包括通过Google 以及Github、QQ微信等接入,通过单点可以快速的进行登录注册,以下是我总结整理的注册步骤,实测有效,可以帮助小伙伴快速的进行应用的接入。
青云交4 天前
机器学习·自然语言处理·java 大数据·知识融合·跨语言信息检索·多语言知识图谱·低资源语言处理
Java 大视界 -- Java 大数据机器学习模型在自然语言处理中的跨语言信息检索与知识融合嘿,亲爱的 Java 和 大数据爱好者们,大家好!我是CSDN(全区域)四榜榜首青云交!在全球化浪潮下,世界贸易组织(WTO)数据显示,跨国企业日均处理的多语言商业文档超 1.5 亿份,国际学术数据库每日新增跨语言文献达 200 万篇。然而,传统跨语言信息检索系统面临三大困境:语义鸿沟导致检索准确率不足 45%(《2024 年全球自然语言处理白皮书》)、低资源语言覆盖缺失、知识孤岛难以打通。Java 凭借其分布式计算优势(单集群支持 PB 级数据处理)、丰富的机器学习生态(DL4J、Apache MXNe