nlp

kida_yuan2 天前
数据结构·python·nlp
【从零开始】13. 数据增强(Data Augmentation)书接上回,上一章我们简单地过了一遍如何获取训练数据并通过代码将数据保存到 Elasticsearch 中了,但是保存下来后发现数据量还是不够(总数据量 22w+),这个时候可以选择采用数据增强技术来补充训练数据。
A尘埃3 天前
人工智能·自然语言处理·nlp
NLP(自然语言处理, Natural Language Processing)让计算机能够理解、解释、操纵和生成人类语言,从而执行有价值的任务。 关注社区:Hugging Face、Papers With Code、GitHub 是现代NLP学习不可或缺的资源。许多最新模型和代码都在这里开源。
kida_yuan3 天前
python·架构·nlp
【从零开始】12. 一切回归原点各位新老朋友,好久不见了。距最后一次更新已有差不多一年的时间了。这期间发生了很多事儿,一度让我走进了人生低谷。现在,一切都已经过去,热爱分享、与君共勉仍是我的初心。一切都“从零开始”吧,这样也不错。
老姜洛克4 天前
算法·nlp
自然语言处理(NLP)之n-gram从原理到实战自然语言处理(NLP)之n-gram从原理到实战内容概要:n-gram都能做什么n-gram的数学原理
老马啸西风4 天前
性能优化·开源·nlp·github·敏感词
v0.29.2 敏感词性能优化之基本类型拆箱、装箱的进一步优化的尝试v0.29.0 敏感词性能优化提升 14 倍全过程v0.29.1 敏感词性能优化之内部类+迭代器内部类
老马啸西风5 天前
性能优化·开源·nlp·github·敏感词
v0.29.1 敏感词性能优化之内部类+迭代器内部类v0.29.0 敏感词性能优化提升 14 倍全过程v0.29.1 敏感词性能优化之内部类+迭代器内部类
Gyoku Mint5 天前
人工智能·pytorch·深度学习·神经网络·语言模型·自然语言处理·nlp
提示词工程(Prompt Engineering)的崛起——为什么“会写Prompt”成了新技能?🐾猫猫扒着屏幕:“喵?咱写的这句 Prompt 怎么又跑偏啦?明明只是想让它帮忙写一段 Python 代码,它偏要给咱写论文摘要……” 🦊狐狐眯着眼,声音带点冷意:“因为你的提示词不够清晰,模型在无限空间里乱游走了。Prompt 工程,不是随便说一句‘帮我写’就够的。”
老马啸西风6 天前
安全·开源·nlp·word·敏感词·sensitive-word
sensitive-word 敏感词性能提升14倍优化全过程 v0.28.0有一天,群里收到小伙伴提的一个问题,为什么程序 sensitive-word 第一次执行这么慢?sensitive-word-131
和鲸社区7 天前
人工智能·python·深度学习·计算机视觉·语言模型·自然语言处理·nlp
《斯坦福CS336》作业1开源,从0手搓大模型|代码复现+免环境配置人工智能领域,斯坦福CS336课程(全称:CS 336 - Foundations of Large Language Models and Their Applications)被许多学习者视为“大模型学习的必修课”,不仅因为课程本身由一流学者讲授,更因为它以从零构建大语言模型为主线,让学习者真正看清楚大模型的底层运作机制。
nju_spy9 天前
人工智能·深度学习·机器学习·nlp·tf-idf·glove·南京大学
机器学习 - Kaggle项目实践(8)Spooky Author Identification 作者识别Spooky Author Identification | KaggleApproaching (Almost) Any NLP Problem on Kaggle (参考)
Go_Zezhou10 天前
线性代数·算法·机器学习·nlp
在线性代数里聊聊word embedding最近在复习线性代数,学到线性相关、线性无关和向量空间这里,突然想到word embedding训练出来的向量是什么样呢?是否满秩?是n维空间中的m维向量(m<=n吗?)
冰糖猕猴桃10 天前
人工智能·ai·nlp·transformer
【AI - nlp】Transformer输入部分要点本篇文章主要介绍Transformer左侧输入部分三个关键细节:看不懂我在说什么?没关系,下面我们先来看一下Transformer架构中的输入部分 --> 词嵌入层 和 位置编码的一个简单的代码演示。
大千AI助手10 天前
人工智能·深度学习·神经网络·自然语言处理·nlp·机器翻译·wmt2014
WMT2014:机器翻译领域的“奥林匹克盛会“本文由「大千AI助手」原创发布,专注用真话讲AI,回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我,一起撕掉过度包装,学习真实的AI技术!
胖达不服输11 天前
人工智能·python·深度学习·自然语言处理·nlp
「日拱一码」076 深度学习——自然语言处理NLP目录深度学习与NLP介绍什么是自然语言处理(NLP)?深度学习如何赋能NLP?核心概念:词嵌入(Word Embedding)
uncle_ll11 天前
nlp·wavenet·语音模型·vocoder·waveglow
李宏毅NLP-13-Vocoder无论频谱来自 TTS 还是 VC,都通过Vocoder将 “频域特征” 逆转为 “时域声波”,得到可听的语音。
数据智能老司机13 天前
python·nlp
精通文本分析——自然语言处理导论本章作为全书的导言,介绍了接下来章节将如何借助机器(例如计算机和机器人)来处理语言。为什么自然语言处理(NLP)重要? NLP 能够分析语言的意义。这里的“语言”指人们日常交流中使用的语言,如英语、德语、法语和印地语等。借助机器(主要是计算机系统),自然语言处理长期以来扮演着许多有用的角色:这些系统可以校正语法、将语音转换为文本,甚至实现语言之间的翻译。Google 翻译就是此类翻译系统的典型代表。NLP 可以帮助机器用人的语言与人沟通。借助这项技术,机器可以自动读取文本、识别并理解语音,并在社交媒体平台
MisterZhang66613 天前
java·人工智能·机器学习·自然语言处理·nlp·聚类
Java使用apache.commons.math3的DBSCAN实现自动聚类K-Means: 如果你能大致估计出类别的数量,K-Means通常也是一个高效的选择。但它对异常值敏感,且要求簇是球状的。对于一些不知道数据可能会有多少类别的时候,可用试试DBSCAN算法,因为你通常无法预先知道文章会自动分成多少类(K值未知),用DBSCAN是非常不错的,能自动判断拿出类别数量,这里讲解一下java的math3里面自带方法
2501_9065196715 天前
人工智能·nlp
NLP:驱动人工智能迈向 “理解” 与 “对话” 的核心引擎在人工智能技术的发展浪潮中,自然语言处理(NLP)始终扮演着至关重要的角色。它不仅是连接人类与机器的“语言桥梁”,更是推动人工智能从“感知”走向“认知”,实现真正“理解”与“对话”能力的核心引擎。从早期简单的文本检索到如今能生成流畅文章、进行情感交流的智能系统,NLP的每一次突破,都在重塑人类与人工智能的互动方式,为各行各业的智能化转型注入强大动力。
AI人工智能+15 天前
人工智能·nlp·ocr·竣工验收备案识别
竣工验收备案识别技术:通过AI和OCR实现智能化文档处理,提升效率与准确性,推动建筑行业数字化转型。竣工验收备案是建设工程项目投入使用的最终法定程序,是确保工程符合规划、质量、消防、环保等各项要求的核心关口。传统的备案流程依赖大量纸质文档和人工审核,效率低下且易出错。随着人工智能与大数据技术的崛起,竣工验收备案识别技术应运而生,正深刻地变革着这一传统领域,为建筑行业的数字化转型提供关键动力。
、水水水水水20 天前
人工智能·python·深度学习·nlp
RAG学习(五)——查询构建、Text2SQL、查询重构与分发在前面的章节中,我们探讨了如何通过向量嵌入和相似度搜索来从非结构化数据中检索信息。然而,在实际应用中,我们常常需要处理更加复杂和多样化的数据,包括结构化数据(如SQL数据库)、半结构化数据(如带有元数据的文档)以及图数据。用户的查询也可能不仅仅是简单的语义匹配,而是包含复杂的过滤条件、聚合操作或关系查询。