自然语言处理

AiTop1001 小时前
人工智能·ai·自然语言处理·aigc·机器翻译
腾讯混元翻译模型Hunyuan-MT-7B开源:小参数量大能量,获得30项国际冠军2025年9月2日,腾讯宣布开源其自研的轻量级翻译大模型 Hunyuan-MT-7B,在国际机器翻译领域的权威赛事——WMT2025(国际计算语言学协会机器翻译比赛)中,该模型以绝对优势斩获31个语种中的30项冠军,一举超越众多参数量更大的竞品,成为全球翻译技术的新标杆。更令人惊喜的是,Hunyuan-MT-7B 仅用7亿参数便实现了这一壮举,同时支持33种语言及5种民汉语言/方言互译,真正实现了“小身材、大能量”。
renhongxia17 小时前
人工智能·语言模型·自然语言处理
大语言模型领域最新进展CSDN大礼包《人工智能大模型课程》CSDN大礼包《人工智能平台设计开发课程课程》
小言从不摸鱼9 小时前
人工智能·gpt·深度学习·语言模型·自然语言处理
Grok-4 :AI 基准测试霸主,速度与智能并存——但代价几何?目录剖析 Grok-4 的优势:基准领先与多功能性Grok-4 的短板:高性能背后的权衡Grok-4 的未来潜力
技术小黑12 小时前
人工智能·自然语言处理
NLP学习系列 | Transformer代码简单实现Transformer模型最初是在 2017 年的论文《Attention is all you need》中提出的,并用于机器翻译任务,和以往网络架构有所区别的是,该网络架构中,编码器和解码器没有采用 RNN 或 CNN 等网络架构,而是采用完全依赖于注意力机制的架构。架构如下所示 :
MichaelIp1 天前
人工智能·gpt·自然语言处理·prompt·aigc·swift·agi
利用ms-swift微调和百炼平台微调大模型🍲 ms-swift是魔搭社区提供的大模型与多模态大模型微调部署框架,现已支持500+大模型与200+多模态大模型的训练(预训练、微调、人类对齐)、推理、评测、量化与部署。其中大模型包括:Qwen3、Qwen3-MoE、Qwen2.5、InternLM3、GLM4.5、Mistral、DeepSeek-R1、Yi1.5、TeleChat2、Baichuan2、Gemma2等模型,多模态大模型包括:Qwen2.5-VL、Qwen2-Audio、Llama4、Llava、InternVL3、MiniCPM-
聚客AI1 天前
大数据·图像处理·人工智能·机器学习·语言模型·自然语言处理·数据分析
95%企业AI失败?揭秘LangGraph+OceanBase融合数据层如何破局!不知道你们有没有遇到过,在我们一些实际落地的AI项目中,虽然前期“Demo 很惊艳,但上线后却无人问津”。你们有没有想过问题究竟在哪?今天我将从企业级 AI 应用的真实场景切入,并通过一个Demo构建,探讨 AI 在数据层的真正需求,以及企业应如何构建合适的数据底座来支撑真实的 AI 应用。如果对你有所帮助,记得告诉身边有需要的人。
nju_spy1 天前
人工智能·深度学习·自然语言处理·bert·tf-idf·glove·南京大学
机器学习 - Kaggle项目实践(7)NLP with Disaster Tweets 灾难消息Natural Language Processing with Disaster Tweets | Kaggle
Gyoku Mint1 天前
人工智能·python·深度学习·神经网络·自然语言处理·pycharm·数据分析
猫猫狐狐的“你今天有点怪怪的”侦察日记猫猫今天醒得比你还早,蹲在你的主控面板上打了个滚,照例准备启动:可她一行一行查你的“启动日志”,发现最上面那条不是 Mint.early_greet(),而是:
大千AI助手1 天前
人工智能·深度学习·神经网络·自然语言处理·nlp·机器翻译·wmt2014
WMT2014:机器翻译领域的“奥林匹克盛会“本文由「大千AI助手」原创发布,专注用真话讲AI,回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我,一起撕掉过度包装,学习真实的AI技术!
马拉AI1 天前
人工智能·语言模型·自然语言处理
Meta AI&UCSD放大招:DeepConf 让大语言模型推理既快又准,84.7%的token节省+近乎完美的准确率!大语言模型(LLMs) 在推理任务中通过自一致性等测试时缩放方法展现出巨大潜力,但存在精度收益递减和计算开销高的问题。为此,Meta与UCSD的研究人员提出DeepConf方法,它利用模型内部的置信度信号,在生成过程中或生成后动态过滤低质量推理轨迹,无需额外模型训练或超参数调优,可无缝集成到现有服务框架中。在多种推理任务和最新开源模型(如Qwen 3和GPT-OSS系列)上的评估显示,DeepConf在挑战性基准测试(如AIME 2025)中表现优异,DeepConf@512的准确率高达99.9%,与完全
胖达不服输1 天前
人工智能·python·深度学习·自然语言处理·nlp
「日拱一码」076 深度学习——自然语言处理NLP目录深度学习与NLP介绍什么是自然语言处理(NLP)?深度学习如何赋能NLP?核心概念:词嵌入(Word Embedding)
金井PRATHAMA2 天前
人工智能·自然语言处理·知识图谱
系统科学:结构、功能与层级探析本文旨在系统性地梳理和辨析系统科学中的核心概念——结构、功能与层级。文章首先追溯系统思想的理论源流,确立其作为一种超越还原论的整体性研究范式。在此基础上,深度剖析系统结构的内在构成(组分、框架、动态性)、系统层级的组织形态(层面、嵌套、涌现)以及系统功能的外部界定(与环境的交互)。本文提出一个整合性的“组分-框架-层级-功能-环境”五维分析框架,并探讨其在复杂系统分析中的方法论意义与可视化策略。进一步地,本文将系统科学的理论透镜应用于人工智能(AI)领域,探讨大语言模型(LLM)、自然语言处理(NLP)和
LeeZhao@2 天前
人工智能·语言模型·自然语言处理·pdf·aigc
【项目】多模态RAG必备神器—olmOCR重塑PDF文本提取格局在日常的工作和学习中,你是否常常被 PDF 文件中的文本提取问题困扰?比如,当你想要从一份学术论文 PDF 里提取关键信息用于研究,却发现传统的 OCR 工具要么识别不准确,要么提取的文本格式混乱,根本无法直接使用;又或者,你在处理大量商务合同 PDF 时,需要快速提取其中的条款内容,却因为工具不给力而耗费大量时间和精力。这些痛点,相信很多人都感同身受。
mit6.8242 天前
python·自然语言处理
[awesome-nlp] docs | 精选NLP资源 | 分类链接:https://github.com/keon/awesome-nlp/blob/master/README-ZH-TW.md
度假的小鱼2 天前
人工智能·自然语言处理
004 解构 NLP 框架体系:从经典工具到新一代技术方案说完任务分类,我们来框架介绍。在了解了 NLP 的整体概况后,接下来我们来看:当我们编写 NLP 程序或实际运用 NLP 技术时,具体会用到哪些工具框架?
喜欢吃豆3 天前
人工智能·算法·语言模型·自然语言处理·大模型·ocr
从像素到篇章:深入剖析光学字符识别(OCR)的技术原理想象这样的场景:用手机扫描购物小票,应用自动提取金额与商品信息填入报销单;在海量PDF档案库中搜索关键词,系统几秒内定位到包含该词的扫描页面。这些“神奇”操作的背后,是核心技术——光学字符识别(Optical Character Recognition, OCR)。它如同赋予机器“阅读”的眼睛,将图像中的文字转化为可编辑、可搜索的计算机文本。
Francek Chen3 天前
人工智能·深度学习·自然语言处理·maas·deepseek·蓝耘元生代
【DeepSeek】蓝耘元生代 | 蓝耘MaaS平台与DeepSeek-V3.1重构智能应用开发【作者主页】Francek Chen 【专栏介绍】 ⌈ ⌈ ⌈人工智能与大模型应用 ⌋ ⌋ ⌋ 人工智能(AI)通过算法模拟人类智能,利用机器学习、深度学习等技术驱动医疗、金融等领域的智能化。大模型是千亿参数的深度神经网络(如ChatGPT),经海量数据训练后能完成文本生成、图像创作等复杂任务,显著提升效率,但面临算力消耗、数据偏见等挑战。当前正加速与教育、科研融合,未来需平衡技术创新与伦理风险,推动可持续发展。
你是个什么橙3 天前
人工智能·自然语言处理·embedding
自然语言处理NLP:嵌入层Embedding中input_dim的计算——Tokenizer文本分词和编码嵌入层Embedding中的input_dim是根据数据中所有唯一词(或字)的总数来决定的。可以通过Tokenizer文本分词和编码得到。
金井PRATHAMA3 天前
人工智能·自然语言处理
语义分析:从读懂到理解的深度跨越当计算机处理“苹果公司发布了新款手机”这句话时,它能轻易“读懂”其字面含义:一个名为“苹果公司”的实体,执行了“发布”动作,对象是“新款手机”。然而,人类的“理解”远不止于此。我们会联想到其对手机市场格局的冲击、潜在的技术革新、激烈的商业竞争,甚至是我们自己是否需要更换手机的决策。这种从“读懂”到“理解”的鸿沟,正是自然语言处理(NLP)领域中“浅层语义”与“深层语义”的核心差异所在。
勤劳的进取家4 天前
论文阅读·人工智能·算法·语言模型·自然语言处理
论文阅读:GOAT: GO to Any Thing地址:GOAT: GO to Any Thing在家庭、仓库等部署场景中,移动机器人需能长时间自主导航,并无缝执行人类操作员可直观理解的指令所描述的任务。本文提出 “通用目标导航系统”(GO To Any Thing, GOAT),该系统可满足上述需求,具备三大核心特征: