技术栈
nlp
玄同765
1 天前
开发语言
·
人工智能
·
python
·
自然语言处理
·
正则表达式
·
nlp
·
知识图谱
Python 异常捕获与处理:从基础语法到工程化实践的万字深度指南
核心目标:系统掌握 Python 异常的底层原理、语法细节、高级特性与生产级处理方案,避免 “吞异常”“乱捕获” 等致命错误
庚昀◟
2 天前
人工智能
·
ai
·
nlp
·
持续部署
用AI来“造AI”!Nexent部署本地智能体的沉浸式体验
目录一、极速体验二、轻量快速安装部署三、环境配置1.应用配置2.模型配置四、智能体再体验五、结语在打造属于我们自己的智能体之前,我们先体验一下来自ModelEngine官方的强大智能体——Nexent!体验地址:一个提示词,无限种可能。
玄同765
2 天前
人工智能
·
python
·
自然语言处理
·
正则表达式
·
nlp
·
知识图谱
·
rag
Python 正则表达式:LLM 噪声语料的精准清洗
(专栏:Python 从真零基础到纯文本 LLM 全栈实战・第 8 篇 | 字数:10000 字 | 零基础友好 | LLM 场景深度绑定 | 代码可运行)
natide
2 天前
人工智能
·
深度学习
·
机器学习
·
自然语言处理
·
nlp
表示/嵌入差异-5-皮尔森相关系数(Pearson Correlation Coefficient)
皮尔森相关系数(简称PCC)用于量化两个连续变量 XXX 和 YYY 之间的线性相关程度,取值范围为 [−1,1][-1, 1][−1,1]:
云雾J视界
4 天前
人工智能
·
docker
·
nlp
·
复盘
·
技术架构
·
工业级设计
年终复盘2.0:NLP自动萃取经验教训,构建可执行策略库
每年12月,科技公司纷纷启动年终复盘。然而,IDC《2024企业知识管理报告》揭示了一个残酷现实:87%的复盘最终止步于PPT归档。管理者面对成百上千条员工反馈,只能凭直觉提炼“加强协作”“提升效率”等模糊结论。更严峻的是,麦肯锡同期研究指出,76%的企业将问题错误归因于“执行力不足”,却忽略了流程设计、工具缺失等真实根因。
weixin_43749777
4 天前
人工智能
·
nlp
读书笔记:Context Engineering 2.0 (上)
阅读论文“Context Engineering 2.0:The Context of Context Engineering”的一个初步笔记。
极客小云
5 天前
python
·
机器学习
·
nlp
【生物医学NLP信息抽取:药物识别、基因识别与化学物质实体识别教程与应用】
github地址:https://github.com/xy200303/bioner访问地址: https://librairy.github.io/bio-ner/.
玄同765
5 天前
开发语言
·
人工智能
·
python
·
自然语言处理
·
llm
·
nlp
·
知识图谱
Python 数据类型:LLM 语料与 API 参数的底层处理逻辑
专栏:Python 从真零基础到纯文本 LLM 全栈实战・第 2 篇 | 字数:9600 字左右| 零基础友好・全函数覆盖・LLM 实战绑定
玄同765
5 天前
人工智能
·
python
·
语言模型
·
自然语言处理
·
llm
·
nlp
·
prompt
Python 真零基础入门:从 “什么是编程” 到 LLM Prompt 模板生成
你可能听过 “编程”“代码”,但不知道它们到底是什么 —— 其实编程就是「人类用计算机能懂的 “极简语言”,给计算机写 “任务清单”」。
C嘎嘎嵌入式开发
6 天前
人工智能
·
python
·
自然语言处理
·
nlp
语言学:自然语言处理 (NLP) 的底层逻辑
自然语言处理(NLP)是人工智能皇冠上的明珠,而语言学则是这顶皇冠的基石。如果说深度学习提供了“算力”和“算法”,那么语言学则提供了“数据逻辑”和“解构规则”。
Elaine336
7 天前
python
·
机器学习
·
nlp
·
scikit-learn
·
词云
【基于 Scikit-learn 本地数据集的垂直领域词云生成】
在自然语言处理(NLP)的探索性数据分析(EDA)阶段,词云(Word Cloud) 依然是快速直观地展示语料库特征分布、捕捉高频关键词的有效手段。
natide
8 天前
大数据
·
人工智能
·
深度学习
·
算法
·
自然语言处理
·
nlp
·
知识图谱
词汇/表达差异-8-Token Overlap(词元重叠度)
首先明确**词元(Token)**的概念:词元是文本经过分词/切分后得到的最小语义单元,可分为:Token Overlap的核心思想是:两个文本的相似程度,取决于它们之间共同词元的数量(或占比)。根据计算方式的不同,可分为集合型重叠度和频率型重叠度两类,其中集合型是基础。
胡伯来了
8 天前
人工智能
·
自然语言处理
·
nlp
·
transformer
·
transformers
13 Transformers - 使用Pipelien处理自然语言处理
NLP 任务是最常见的类型之一,因为文本是我们进行交流的自然方式。为了让文本变成模型识别的格式,需要对其进行分词。这意味着将一段文本分成单独的单词或子词(tokens),然后将这些tokens转换为数字。因此,可以将一段文本表示为一系列数字,一旦有了一系列的数字,就可以将其输入到模型中以解决各种 NLP 任务!
老鱼说AI
10 天前
人工智能
·
分布式
·
深度学习
·
神经网络
·
自然语言处理
·
nlp
·
transformer
经典论文精读第一期:DeepSeek-R1-Zero ——RL奇迹
论文地址:https://arxiv.org/pdf/2501.12948通常我们训练 LLM 的范式流程是:Pretrain -> SFT (教会格式/指令) -> RLHF (对齐人类偏好)。
ys~~
11 天前
git
·
vscode
·
python
·
深度学习
·
学习
·
nlp
·
github
git学习
仓库就是一个目录(文件夹),这个目录里面的所有文件都可以被git管理起来,共三种工作区域共四种文件状态
C嘎嘎嵌入式开发
11 天前
人工智能
·
python
·
自然语言处理
·
nlp
NLP 入门:从原理到实战的个人经验总结
自然语言处理(NLP)这两年因为 ChatGPT 火得一塌糊涂,但抛开热度,它本质上就做两件事:教计算机听懂人话,以及让计算机像人一样说话。
阿杰学AI
11 天前
人工智能
·
ai
·
语言模型
·
自然语言处理
·
nlp
·
aigc
·
agi
AI核心知识60——大语言模型之NLP(简洁且通俗易懂版)
自然语言处理 (Natural Language Processing,简称 NLP) 是人工智能(AI)皇冠上最璀璨的一颗明珠。
Yorelee.
13 天前
开发语言
·
nlp
·
transformer
·
swift
ms-swift在训练时遇到的部分问题及解决方案
虽然查找model.safetensors.index.json可以发现此参数确实存在,但当我的模型进行GRPO训练时就是会爆这个错误。模型先进行了SFT训练,再进行的GRPO训练,直接进行GRPO训练没问题。
五月底_
14 天前
人工智能
·
深度学习
·
nlp
·
rl
·
grpo
GRPO参数详解
actor_rollout.ref.rollout.n对于每个提示,采样 n 次。默认值为 1。对于 GRPO,请将其设置为大于 1 的值以进行分组采样。
来两个炸鸡腿
15 天前
python
·
深度学习
·
学习
·
nlp
DW动手学大模型应用全栈开发 - (1)大模型应用开发应知必会
动手学大模型应用全栈开发 - (1)大模型应用开发应知必会2021年9月,源1.0大模型发布,它采用76层的Transformer Decoder结构,使用5T数据训练,拥有2457亿参数量,超越OpenAI研发的GPT-3,成为全球最大规模的AI巨量模型,表现出了出色的中文理解与创作能力。