nlp

AI大模型学徒1 天前
自然语言处理·nlp
NLP基础(一)_简介NLP,全称是 Natural Language Processing,即自然语言处理。它是人工智能(AI)和计算语言学的一个重要分支,研究的是计算机如何理解、解释、生成和与人类语言互动的技术。
PKNLP3 天前
微调·nlp
17.模型微调——微调数据集构建一般来说,一个经过指令格式化的数据实例包括任务描述(也称为指令)、任务输入、任务输出以及可选的示例。公开的数据集:https://www.waytoagi.com/zh/question/51049
0小豆03 天前
python·nlp·算法设计·spacy·ai算法·时间序列对齐
智能字幕校准系统实战(二):6级匹配算法从精确到模糊的全链路解析系列文章:《智能字幕校准系统实战:从架构到算法的全栈技术解析》 本文为第2篇:6级智能校准算法深度解析 阅读时间:20分钟 难度:(中高级) 标签:算法设计 NLP Python Spacy 时间序列对齐
菠菠萝宝4 天前
人工智能·深度学习·大模型·llm·nlp·attention·llama
【AI应用探索】-7- LLaMA-Factory微调模型我们统一使用conda来管理我们的python环境创建python环境为3.10的conda环境并激活
黑唐僧5 天前
nlp
Transformer架构:手撸源码实践(附带仓库地址)Transformer架构自2017年在论文《Attention Is All You Need》中被提出以来,彻底改变了自然语言处理(NLP)领域。它摒弃了传统的循环神经网络(RNN)和卷积神经网络(CNN),完全基于注意力机制构建,成为现代大语言模型(如BERT、GPT系列)的基础架构。
AI人工智能+5 天前
nlp·ocr·表格识别
表格识别技术,通过目标检测、结构分析和文字识别三步骤,实现对纸质档案表格的智能解析在布满尘埃的档案库房中,厚重的册籍与泛黄的表格静静沉睡,其中蕴藏的经营数据、人员信息、历史记录构成了一座座未被开采的“数据金矿”。然而,将这些非结构化的纸质表格转化为可计算、可分析的数字资产,始终是横亘在档案数字化面前的巨大挑战。中科逸视(北京)科技有限公司以其前沿的表格识别技术,正如同一位技艺高超的“数据炼金师”,为破解这一难题提供了精准而高效的解决方案,彻底改变了传统档案管理的生态。
AI人工智能+6 天前
nlp·ocr·rpa·文档抽取
告别手动录入:文档抽取技术如何让RPA处理非结构化数据?当大多数企业还在为RPA机器人能够7×24小时不间断处理重复性工作而欣喜时,一个尖锐的问题已经浮出水面:为什么这些号称“数字化员工”的机器人,遇到一份简单的发票或合同时,依然表现得像个“文盲”?
AI人工智能+8 天前
nlp·ocr·文档抽取
文档抽取技术:通过OCR、关键信息抽取和数据标准化三大环节,实现了对银行流水的高效解析在金融领域,银行流水是记录企业或个人资金往来最核心、最真实的凭证。无论是信贷风控、财务审计、合规监管还是企业自身的财务管理,都离不开对银行流水的深度分析。然而,传统依赖人工肉眼审阅、手动录入和核对的方式,正面临着效率低下、成本高昂、易出错等严峻挑战。近年来,随着人工智能技术的成熟,文档抽取技术正成为破解这一难题的关键利器,为银行流水分析带来了革命性的变革。
0小豆08 天前
spring boot·python·nlp·微服务架构·实战项目·spacy·ai算法
【系列开篇】从零构建智能字幕校准系统:一个AI+微服务的完整实战之旅系列名称:《智能字幕校准系统实战:从架构到算法的全栈技术解析》 作者:小豆 发布日期:2025年11月 难度:中高级 标签:Spring Boot Python NLP 微服务 AI算法 Spacy Redis AWS
大千AI助手12 天前
人工智能·自然语言处理·nlp·分词·bpe·大千ai助手·字节对编码
BPE(Byte Pair Encoding)详解:从基础原理到现代NLP应用本文由「大千AI助手」原创发布,专注用真话讲AI,回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我,一起撕掉过度包装,学习真实的AI技术!
故事挺秃然13 天前
语言模型·nlp
大型语言模型(LLM)架构大比拼从 DeepSeek-V3 到 MiniMax-M2:现代 LLM 架构设计一览自原始 GPT 架构问世至今已过去七年。乍看之下,从 GPT-2(2019 年)到DeepSeek-V3 与 Llama 4(2024–2025 年),人们或许会惊讶于这些模型在结构上竟仍如此相似。
苦瓜汤补钙13 天前
论文阅读·图像处理·人工智能·nlp·ai编程
论文阅读——Segment Anything(Meta AI)——SAMSAM (Segment Anything Model) 是一个可提示的通用图像分割基础模型,其核心目标是通过统一的提示接口实现对任意对象的零样本分割能力。
合作小小程序员小小店14 天前
开发语言·pytorch·qt·自然语言处理·nlp
舆情,情感微博系统demo,基于python+qt+nlp,开发语言python,界面库qt,无数据库版,数据来自第三方网站获取,经验心得帮助客户修改桌面开发微博舆情情感分析Demo时,咱们用Python当主力,Qt当界面,虽然不是很熟悉QT但是咱们可以试着根据界面中的控件找到对应的控件事件锁定咱们需要修改,添加内容地方就行!数据直接爬第三方网站,没搞数据库省了不少事,但得注意爬取频率,不然容易被限制。核心是NLP做情感判定,直接调用对应库就行。跑通全流程时特开心,看着屏幕上蹦出的正负情感标签,感觉之前踩的坑都值了!
故事挺秃然14 天前
人工智能·自然语言处理·nlp
NLP模型优化模型优化是指将机器学习模型进行系统化转换,以在目标部署环境中实现高效执行,同时保持可接受的准确性和功能性。该学科涵盖了管理竞争性目标之间权衡的技术,包括计算复杂度、内存利用率、推理延迟和能源效率。该领域通过参数减少消除冗余、通过数值表示优化提高精度、通过算法和架构改进提高计算效率。模型优化使得复杂的机器学习能力能够在不同的计算环境中部署,从高性能云基础设施到资源受限的边缘设备,从而扩展了机器学习系统的实际应用范围。
wangqiaowq14 天前
nlp
采用 Trie 树结合 RoaringBitmap 技术,构建高效的子串倒排索引Trie 树(发音为 "try")是一种专门用于处理字符串的树形数据结构,特别适合做前缀匹配和快速查找。
合作小小程序员小小店15 天前
数据库·python·自然语言处理·flask·nlp·echarts·知识图谱
web网页,在线%抖音,舆情%分析系统demo,基于python+web+echart+nlp+知识图谱,数据库mysql经验心得帮助客户做这个舆情分析系统Demo时,咱们使用Python+Web的基础框架,MySQL存抖音等平台的舆情数据。接着整合ECharts做可视化,能直观展示数据趋势;再加入NLP处理文本情感,结合知识图谱梳理关联关系。整个过程踩过不少坑,但最终实现了客户需要核心功能。
缘友一世15 天前
人工智能·自然语言处理·nlp·transformer·llama
LLama3架构原理浅浅学学模块组成:你可能会问,这看起来像个简单的数学技巧,为什么说它非常独特和重要呢?原因有三点:如果使用两个独立的矩阵,就相当于:
合作小小程序员小小店17 天前
后端·python·flask·nlp·echarts
大屏开发,在线歌词舆情分析系统demo,基于python,flask,web,echart,nlp,自然语言数据库mysql。经验心得 第一次帮助客户做大屏版歌词舆情分析系统Demo,用Python+Flask搭后端,ECharts画大屏图表还挺新鲜的,用NLP分析歌词情感倾向,存到MySQL里,再用ECharts把舆情趋势做成可视化图表,调图表样式花了不少心思。虽然是 demo,但看着大屏上数据实时刷新、情感标签清晰显示,特别有成就感,也摸清了NLP和可视化结合的小技巧。
烟袅17 天前
javascript·nlp
在浏览器中做 NLP?用 JavaScript 实现文本分类的实用探索我们通常认为 NLP(自然语言处理)是后端或数据科学的领域——用 Python 写模型、跑在服务器上、通过 API 提供服务。
AI人工智能+18 天前
人工智能·nlp·ocr·文本抽取
智能文本抽取:通过OCR、自然语言处理等多项技术,将非结构化文档转化为可读、可分析的数据资产当一份份合同在扫描仪上堆积成山,当关键的客户需求淹没在浩如烟海的邮件中,当财务人员日复一日地手工录入上百张发票——这正是无数企业文件管理现状的真实写照。据统计,知识工作者平均要花费近20%的工作时间在寻找和整理信息上。在这场与信息的博弈中,文本抽取技术正悄然带来一场革命性转变,它像一位不知疲倦的智能助手,让沉默的文件开口说话,让无序的数据产生价值。