技术栈
nlp
技术狂人168
1 天前
人工智能
·
深度学习
·
算法
·
nlp
(三)模型微调技术 20 题!LoRA/Q-LoRA/PPO/DPO 落地细节,面试说清微调全流程(实战篇)
上篇多模态笔记发完,很多朋友说 “GPT-4V 的设计逻辑直接背,二面真的被问到了”—— 其实多模态之后,微调是面试的 “落地能力核心” !大厂招大模型工程师,最看重 “能不能把模型调好用”,我带的 500 + 求职者里,能说清 Q-LoRA 微调 13B 模型踩坑的,三面通过率直接提升 70%。
橘色的狸花猫
3 天前
java
·
nlp
简历与岗位要求相似度分析系统
本系统是一个基于 NLP(自然语言处理)技术的简历与岗位匹配分析平台,采用 TF-IDF 算法提取关键词,结合余弦相似度计算文本相似度,按多维度加权评估简历与岗位的匹配程度。
小马过河R
3 天前
人工智能
·
语言模型
·
架构
·
nlp
混元世界模型1.5架构原理初探
元旦好呀,新年的第一天祝大家新的一年顺顺利利,财源滚滚。 12月中旬,国内首个开放体验的实时世界模型 - 混元世界模型1.5(HY World 1.5)正式发布及开源!3D大模型乃至3D世界模型这块属于是小马的新草地,一发现这个消息小马就迫不及待地去体验了一番,不得不说效果真的很哇塞,交互世界和360度全景都好震撼。(漫游场景还没申请通过~~ 看起来也很挺)
玄同765
4 天前
开发语言
·
人工智能
·
python
·
自然语言处理
·
正则表达式
·
nlp
·
知识图谱
Python 异常捕获与处理:从基础语法到工程化实践的万字深度指南
核心目标:系统掌握 Python 异常的底层原理、语法细节、高级特性与生产级处理方案,避免 “吞异常”“乱捕获” 等致命错误
庚昀◟
4 天前
人工智能
·
ai
·
nlp
·
持续部署
用AI来“造AI”!Nexent部署本地智能体的沉浸式体验
目录一、极速体验二、轻量快速安装部署三、环境配置1.应用配置2.模型配置四、智能体再体验五、结语在打造属于我们自己的智能体之前,我们先体验一下来自ModelEngine官方的强大智能体——Nexent!体验地址:一个提示词,无限种可能。
玄同765
5 天前
人工智能
·
python
·
自然语言处理
·
正则表达式
·
nlp
·
知识图谱
·
rag
Python 正则表达式:LLM 噪声语料的精准清洗
(专栏:Python 从真零基础到纯文本 LLM 全栈实战・第 8 篇 | 字数:10000 字 | 零基础友好 | LLM 场景深度绑定 | 代码可运行)
natide
5 天前
人工智能
·
深度学习
·
机器学习
·
自然语言处理
·
nlp
表示/嵌入差异-5-皮尔森相关系数(Pearson Correlation Coefficient)
皮尔森相关系数(简称PCC)用于量化两个连续变量 XXX 和 YYY 之间的线性相关程度,取值范围为 [−1,1][-1, 1][−1,1]:
云雾J视界
7 天前
人工智能
·
docker
·
nlp
·
复盘
·
技术架构
·
工业级设计
年终复盘2.0:NLP自动萃取经验教训,构建可执行策略库
每年12月,科技公司纷纷启动年终复盘。然而,IDC《2024企业知识管理报告》揭示了一个残酷现实:87%的复盘最终止步于PPT归档。管理者面对成百上千条员工反馈,只能凭直觉提炼“加强协作”“提升效率”等模糊结论。更严峻的是,麦肯锡同期研究指出,76%的企业将问题错误归因于“执行力不足”,却忽略了流程设计、工具缺失等真实根因。
weixin_43749777
7 天前
人工智能
·
nlp
读书笔记:Context Engineering 2.0 (上)
阅读论文“Context Engineering 2.0:The Context of Context Engineering”的一个初步笔记。
极客小云
7 天前
python
·
机器学习
·
nlp
【生物医学NLP信息抽取:药物识别、基因识别与化学物质实体识别教程与应用】
github地址:https://github.com/xy200303/bioner访问地址: https://librairy.github.io/bio-ner/.
玄同765
8 天前
开发语言
·
人工智能
·
python
·
自然语言处理
·
llm
·
nlp
·
知识图谱
Python 数据类型:LLM 语料与 API 参数的底层处理逻辑
专栏:Python 从真零基础到纯文本 LLM 全栈实战・第 2 篇 | 字数:9600 字左右| 零基础友好・全函数覆盖・LLM 实战绑定
玄同765
8 天前
人工智能
·
python
·
语言模型
·
自然语言处理
·
llm
·
nlp
·
prompt
Python 真零基础入门:从 “什么是编程” 到 LLM Prompt 模板生成
你可能听过 “编程”“代码”,但不知道它们到底是什么 —— 其实编程就是「人类用计算机能懂的 “极简语言”,给计算机写 “任务清单”」。
C嘎嘎嵌入式开发
9 天前
人工智能
·
python
·
自然语言处理
·
nlp
语言学:自然语言处理 (NLP) 的底层逻辑
自然语言处理(NLP)是人工智能皇冠上的明珠,而语言学则是这顶皇冠的基石。如果说深度学习提供了“算力”和“算法”,那么语言学则提供了“数据逻辑”和“解构规则”。
Elaine336
10 天前
python
·
机器学习
·
nlp
·
scikit-learn
·
词云
【基于 Scikit-learn 本地数据集的垂直领域词云生成】
在自然语言处理(NLP)的探索性数据分析(EDA)阶段,词云(Word Cloud) 依然是快速直观地展示语料库特征分布、捕捉高频关键词的有效手段。
natide
11 天前
大数据
·
人工智能
·
深度学习
·
算法
·
自然语言处理
·
nlp
·
知识图谱
词汇/表达差异-8-Token Overlap(词元重叠度)
首先明确**词元(Token)**的概念:词元是文本经过分词/切分后得到的最小语义单元,可分为:Token Overlap的核心思想是:两个文本的相似程度,取决于它们之间共同词元的数量(或占比)。根据计算方式的不同,可分为集合型重叠度和频率型重叠度两类,其中集合型是基础。
胡伯来了
11 天前
人工智能
·
自然语言处理
·
nlp
·
transformer
·
transformers
13 Transformers - 使用Pipelien处理自然语言处理
NLP 任务是最常见的类型之一,因为文本是我们进行交流的自然方式。为了让文本变成模型识别的格式,需要对其进行分词。这意味着将一段文本分成单独的单词或子词(tokens),然后将这些tokens转换为数字。因此,可以将一段文本表示为一系列数字,一旦有了一系列的数字,就可以将其输入到模型中以解决各种 NLP 任务!
老鱼说AI
13 天前
人工智能
·
分布式
·
深度学习
·
神经网络
·
自然语言处理
·
nlp
·
transformer
经典论文精读第一期:DeepSeek-R1-Zero ——RL奇迹
论文地址:https://arxiv.org/pdf/2501.12948通常我们训练 LLM 的范式流程是:Pretrain -> SFT (教会格式/指令) -> RLHF (对齐人类偏好)。
ys~~
14 天前
git
·
vscode
·
python
·
深度学习
·
学习
·
nlp
·
github
git学习
仓库就是一个目录(文件夹),这个目录里面的所有文件都可以被git管理起来,共三种工作区域共四种文件状态
C嘎嘎嵌入式开发
14 天前
人工智能
·
python
·
自然语言处理
·
nlp
NLP 入门:从原理到实战的个人经验总结
自然语言处理(NLP)这两年因为 ChatGPT 火得一塌糊涂,但抛开热度,它本质上就做两件事:教计算机听懂人话,以及让计算机像人一样说话。
阿杰学AI
14 天前
人工智能
·
ai
·
语言模型
·
自然语言处理
·
nlp
·
aigc
·
agi
AI核心知识60——大语言模型之NLP(简洁且通俗易懂版)
自然语言处理 (Natural Language Processing,简称 NLP) 是人工智能(AI)皇冠上最璀璨的一颗明珠。