nlp

技术狂人1681 天前
人工智能·深度学习·算法·nlp
(三)模型微调技术 20 题!LoRA/Q-LoRA/PPO/DPO 落地细节,面试说清微调全流程(实战篇)上篇多模态笔记发完,很多朋友说 “GPT-4V 的设计逻辑直接背,二面真的被问到了”—— 其实多模态之后,微调是面试的 “落地能力核心” !大厂招大模型工程师,最看重 “能不能把模型调好用”,我带的 500 + 求职者里,能说清 Q-LoRA 微调 13B 模型踩坑的,三面通过率直接提升 70%。
橘色的狸花猫3 天前
java·nlp
简历与岗位要求相似度分析系统本系统是一个基于 NLP(自然语言处理)技术的简历与岗位匹配分析平台,采用 TF-IDF 算法提取关键词,结合余弦相似度计算文本相似度,按多维度加权评估简历与岗位的匹配程度。
小马过河R3 天前
人工智能·语言模型·架构·nlp
混元世界模型1.5架构原理初探元旦好呀,新年的第一天祝大家新的一年顺顺利利,财源滚滚。 12月中旬,国内首个开放体验的实时世界模型 - 混元世界模型1.5(HY World 1.5)正式发布及开源!3D大模型乃至3D世界模型这块属于是小马的新草地,一发现这个消息小马就迫不及待地去体验了一番,不得不说效果真的很哇塞,交互世界和360度全景都好震撼。(漫游场景还没申请通过~~ 看起来也很挺)
玄同7654 天前
开发语言·人工智能·python·自然语言处理·正则表达式·nlp·知识图谱
Python 异常捕获与处理:从基础语法到工程化实践的万字深度指南核心目标:系统掌握 Python 异常的底层原理、语法细节、高级特性与生产级处理方案,避免 “吞异常”“乱捕获” 等致命错误
庚昀◟4 天前
人工智能·ai·nlp·持续部署
用AI来“造AI”!Nexent部署本地智能体的沉浸式体验目录一、极速体验二、轻量快速安装部署三、环境配置1.应用配置2.模型配置四、智能体再体验五、结语在打造属于我们自己的智能体之前,我们先体验一下来自ModelEngine官方的强大智能体——Nexent!体验地址:一个提示词,无限种可能。
玄同7655 天前
人工智能·python·自然语言处理·正则表达式·nlp·知识图谱·rag
Python 正则表达式:LLM 噪声语料的精准清洗(专栏:Python 从真零基础到纯文本 LLM 全栈实战・第 8 篇 | 字数:10000 字 | 零基础友好 | LLM 场景深度绑定 | 代码可运行)
natide5 天前
人工智能·深度学习·机器学习·自然语言处理·nlp
表示/嵌入差异-5-皮尔森相关系数(Pearson Correlation Coefficient)皮尔森相关系数(简称PCC)用于量化两个连续变量 XXX 和 YYY 之间的线性相关程度,取值范围为 [−1,1][-1, 1][−1,1]:
云雾J视界7 天前
人工智能·docker·nlp·复盘·技术架构·工业级设计
年终复盘2.0:NLP自动萃取经验教训,构建可执行策略库每年12月,科技公司纷纷启动年终复盘。然而,IDC《2024企业知识管理报告》揭示了一个残酷现实:87%的复盘最终止步于PPT归档。管理者面对成百上千条员工反馈,只能凭直觉提炼“加强协作”“提升效率”等模糊结论。更严峻的是,麦肯锡同期研究指出,76%的企业将问题错误归因于“执行力不足”,却忽略了流程设计、工具缺失等真实根因。
weixin_437497777 天前
人工智能·nlp
读书笔记:Context Engineering 2.0 (上)阅读论文“Context Engineering 2.0:The Context of Context Engineering”的一个初步笔记。
极客小云7 天前
python·机器学习·nlp
【生物医学NLP信息抽取:药物识别、基因识别与化学物质实体识别教程与应用】github地址:https://github.com/xy200303/bioner访问地址: https://librairy.github.io/bio-ner/.
玄同7658 天前
开发语言·人工智能·python·自然语言处理·llm·nlp·知识图谱
Python 数据类型:LLM 语料与 API 参数的底层处理逻辑专栏:Python 从真零基础到纯文本 LLM 全栈实战・第 2 篇 | 字数:9600 字左右| 零基础友好・全函数覆盖・LLM 实战绑定
玄同7658 天前
人工智能·python·语言模型·自然语言处理·llm·nlp·prompt
Python 真零基础入门:从 “什么是编程” 到 LLM Prompt 模板生成你可能听过 “编程”“代码”,但不知道它们到底是什么 —— 其实编程就是「人类用计算机能懂的 “极简语言”,给计算机写 “任务清单”」。
C嘎嘎嵌入式开发9 天前
人工智能·python·自然语言处理·nlp
语言学:自然语言处理 (NLP) 的底层逻辑自然语言处理(NLP)是人工智能皇冠上的明珠,而语言学则是这顶皇冠的基石。如果说深度学习提供了“算力”和“算法”,那么语言学则提供了“数据逻辑”和“解构规则”。
Elaine33610 天前
python·机器学习·nlp·scikit-learn·词云
【基于 Scikit-learn 本地数据集的垂直领域词云生成】在自然语言处理(NLP)的探索性数据分析(EDA)阶段,词云(Word Cloud) 依然是快速直观地展示语料库特征分布、捕捉高频关键词的有效手段。
natide11 天前
大数据·人工智能·深度学习·算法·自然语言处理·nlp·知识图谱
词汇/表达差异-8-Token Overlap(词元重叠度)首先明确**词元(Token)**的概念:词元是文本经过分词/切分后得到的最小语义单元,可分为:Token Overlap的核心思想是:两个文本的相似程度,取决于它们之间共同词元的数量(或占比)。根据计算方式的不同,可分为集合型重叠度和频率型重叠度两类,其中集合型是基础。
胡伯来了11 天前
人工智能·自然语言处理·nlp·transformer·transformers
13 Transformers - 使用Pipelien处理自然语言处理NLP 任务是最常见的类型之一,因为文本是我们进行交流的自然方式。为了让文本变成模型识别的格式,需要对其进行分词。这意味着将一段文本分成单独的单词或子词(tokens),然后将这些tokens转换为数字。因此,可以将一段文本表示为一系列数字,一旦有了一系列的数字,就可以将其输入到模型中以解决各种 NLP 任务!
老鱼说AI13 天前
人工智能·分布式·深度学习·神经网络·自然语言处理·nlp·transformer
经典论文精读第一期:DeepSeek-R1-Zero ——RL奇迹论文地址:https://arxiv.org/pdf/2501.12948通常我们训练 LLM 的范式流程是:Pretrain -> SFT (教会格式/指令) -> RLHF (对齐人类偏好)。
ys~~14 天前
git·vscode·python·深度学习·学习·nlp·github
git学习仓库就是一个目录(文件夹),这个目录里面的所有文件都可以被git管理起来,共三种工作区域共四种文件状态
C嘎嘎嵌入式开发14 天前
人工智能·python·自然语言处理·nlp
NLP 入门:从原理到实战的个人经验总结自然语言处理(NLP)这两年因为 ChatGPT 火得一塌糊涂,但抛开热度,它本质上就做两件事:教计算机听懂人话,以及让计算机像人一样说话。
阿杰学AI14 天前
人工智能·ai·语言模型·自然语言处理·nlp·aigc·agi
AI核心知识60——大语言模型之NLP(简洁且通俗易懂版)自然语言处理 (Natural Language Processing,简称 NLP) 是人工智能(AI)皇冠上最璀璨的一颗明珠。