自然语言处理

野生面壁者章北海9 小时前
人工智能·语言模型·自然语言处理
ICML2025|基于Logits的大语言模型端到端文本水印方法由澳门大学研究者联合完成的论文《An End-to-End Model for Logits-Based Large Language Models Watermarking》发表于2025年ICML国际机器学习大会。该研究针对当前大语言模型生成内容在版权溯源与真实性验证方面的难题,提出了一种创新性的端到端logits扰动水印模型。论文首次实现了编码器与解码器的联合优化,显著提升了水印检测的鲁棒性与文本质量之间的平衡。为解决端到端训练中的非可微问题,研究者提出了一种“在线提示”技术,使模型能够通过运行时大
野生面壁者章北海13 小时前
人工智能·语言模型·自然语言处理
NeurIPS 2024|大语言模型高保真文本水印新范式由法国雷恩大学研究者联合完成的论文《WaterMax: Breaking the LLM Watermark Detectability–Robustness–Quality Trade-off》发表于2024年NeurIPS大会。该研究聚焦于大语言模型文本生成的可追溯性与版权保护难题,提出了一种全新的水印框架WaterMax,突破了以往检测性–鲁棒性–文本质量三者无法兼得的瓶颈。与现有通过修改 logits 或采样分布的方案不同,该方法完全不改变模型权重与采样机制,而是通过多候选文本生成与选择策略实现水
Francek Chen17 小时前
人工智能·pytorch·深度学习·自然语言处理·子词嵌入
【自然语言处理】预训练06:子词嵌入【作者主页】Francek Chen 【专栏介绍】 ⌈ ⌈ ⌈PyTorch深度学习 ⌋ ⌋ ⌋ 深度学习 (DL, Deep Learning) 特指基于深层神经网络模型和方法的机器学习。它是在统计机器学习、人工神经网络等算法模型基础上,结合当代大数据和大算力的发展而发展出来的。深度学习最重要的技术特征是具有自动提取特征的能力。神经网络算法、算力和数据是开展深度学习的三要素。深度学习在计算机视觉、自然语言处理、多模态数据分析、科学探索等领域都取得了很多成果。本专栏介绍基于PyTorch的深度学习算法实现
Ma04071320 小时前
人工智能·语言模型·自然语言处理
【论文阅读17】-LLM-TSFD:一种基于大型语言模型的工业时间序列人机回路故障诊断方法题目:Brain-Like Cognition-Driven Model Factory for IIoT Fault Diagnosis by Combining LLMs With Small Models
喜欢吃豆1 天前
人工智能·语言模型·自然语言处理·大模型·parquet
Parquet 范式:大语言模型训练数据格式优化的基础解析将数据格式转换为 Apache Parquet 并非一种随意的偏好,而是针对大规模数据处理(尤其是大语言模型 (LLM) 训练)的一项基础性能优化。Parquet 格式通过其列式存储架构,在 I/O 效率、存储成本和查询性能方面提供了数量级的提升。
电科_银尘1 天前
人工智能·语言模型·自然语言处理
【大语言模型】-- 私有化部署文章目录一、按交付形态 一体机 整机柜出厂即交付,插电即用 纯软件 仅授权模型+推理框架,客户自购服务器 私有化 SaaS 模型以容器/Helm 包交付,部署在客户私有 K8s 上
大千AI助手1 天前
人工智能·神经网络·自然语言处理·llm·prefix-tuning·大千ai助手·前缀微调
Prefix-Tuning:大语言模型的高效微调新范式本文由「大千AI助手」原创发布,专注用真话讲AI,回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我,一起撕掉过度包装,学习真实的AI技术!
雾江流1 天前
人工智能·语言模型·自然语言处理·软件工程
RikkaHub 1.6.11 | 开源的本地大型语言模型聚合应用,支持多种AI服务提供商RikkaHub是一款专为Android设计的一体化AI助手应用。作为一款开源的本地大型语言模型聊天客户端,它让用户可以自由配置多种AI服务提供商(例如OpenAI、Anthropic、Google等),并支持文字、图片、文档等多种形式的输入。该应用不仅内置了Markdown渲染、Latex支持、代码高亮显示以及Mermaid流程图绘制等功能,还提供了诸如消息分支、Prompt变量设定、搜索引擎集成及角色卡导入等高级功能,极大地丰富了用户的对话与创作体验。
2401_841495641 天前
人工智能·python·自然语言处理·规则·文本·语言·句子边界检测算法
【自然语言处理】基于规则基句子边界检测算法目录一、引言二、核心类与初始化:RuleBasedSentenceSplitter三、辅助方法:规则判断的具体实现
leafff1232 天前
设计模式·自然语言处理·系统架构
一文读懂:如何选择适合的RAG系统架构设计模式?RAG(检索增强生成)系统核心架构模式可归为 4 类,核心逻辑是 “检索外部知识 + 生成式 AI 融合”,解决大模型知识滞后、事实不准确的问题。选择 RAG 架构模式的核心逻辑是 “需求优先级排序 + 资源约束匹配”,优先根据查询复杂度、知识库规模、精准度要求筛选,再结合开发成本、迭代需求最终确定。
蓝海星梦2 天前
论文阅读·人工智能·深度学习·自然语言处理·大型推理模型
【论文笔记】R-HORIZON:重塑长周期推理评估与训练范式原文链接:《R-Horizon: How Far Can Your Large Reasoning Model Really Go in Breadth and Depth?》
DisonTangor2 天前
语言模型·自然语言处理·ai作画·开源
FIBO是首个基于长结构化描述训练、专为JSON设计的开源文本生成图像模型。多数文生图模型擅长想象——而非控制。FIBO专为专业工作流打造,非日常使用。通过长达1000+单词的结构化JSON标注训练,FIBO能精准可复现地控制光照、构图、色彩及相机参数。结构化标注促进原生解耦能力,支持针对性迭代优化而无需担心提示偏移。仅凭80亿参数,FIBO即实现高画质、强提示遵循与专业级控制——完全基于授权数据训练。
Ma0407132 天前
人工智能·语言模型·自然语言处理
【论文阅读15】-DiagLLM:基于大型语言模型的多模态推理,用于可解释的轴承故障诊断题目:DiagLLM: multimodal reasoning with large language model for explainable bearing fault diagnosis
啥都鼓捣的小yao2 天前
人工智能·语言模型·自然语言处理
一、什么是语言模型?各位读者好,欢迎收看我的新专栏大语言模型实战系列,本专栏主要讲述大模型实际操作部门内容,不会特别涉及底层概念,主要是了解和用,这次为第一节,什么是语言模型?
带电的小王2 天前
人工智能·语言模型·自然语言处理
【AI大模型技术】4.预训练语言模型(PLMs,Pre-trained Langue Models);5.Transformers Tutorial更多内容:XiaoJ的知识星球.几个PLMs:word2vec(第一个PLM),GPT,BERT,…PLMs具有强大可移植性。
AI大模型学徒2 天前
自然语言处理·nlp
NLP基础(一)_简介NLP,全称是 Natural Language Processing,即自然语言处理。它是人工智能(AI)和计算语言学的一个重要分支,研究的是计算机如何理解、解释、生成和与人类语言互动的技术。
郭庆汝3 天前
笔记·自然语言处理·transformer
(三)自然语言处理笔记——Transformer
渡我白衣3 天前
网络·c++·人工智能·自然语言处理·智能路由器·信息与通信·caffe
字符串的陷阱与艺术——std::string全解析在 C++ 的世界里,字符串远不止是“文字”的代名词。它们是内存的艺术、标准库的深水区,也是新手与老手之间那条看不见的分界线。std::string 看似温顺,却暗藏着拷贝、引用、内存、性能的重重陷阱;但也正因为如此,它成了理解 C++ 思想的绝佳切口。
Allen200003 天前
人工智能·语言模型·自然语言处理
Hello-Agents task2 大语言模型基础参考链接:hello-agents/docs/chapter3 at main · datawhalechina/hello-agents
snakecy3 天前
人工智能·算法·自然语言处理
自然语言处理(NLP)算法原理与实现--Part 1Naïve Bayes基于贝叶斯定理,假设特征之间相互独立。通过计算先验概率和条件概率,对文本进行分类。 MaxEnt(最大熵模型)通过最大化熵值,在给定约束条件下找到最优概率分布。 HMM(隐马尔可夫模型)用于序列标注,通过状态转移和观测概率建模序列数据。 CRF(条件随机场)是判别式图模型,直接建模条件概率,适合处理长距离依赖关系。 LDA(潜在狄利克雷分配)是主题模型,通过文档-主题-词的三层结构挖掘文本主题分布。 以下是几种经典机器学习模型的Python实现示例,涵盖文本分类和序列标注任务: