nlp

胡耀超8 小时前
linux·深度学习·ubuntu·docker·容器·nlp·ocr
Umi-OCR 的 Docker安装(win制作镜像,Linux(Ubuntu Server 22.04)离线部署)前置博客:Ubuntu-Server 22.04.4 详细安装图文教程wget命令在windows终端下不能使用的原因及解决办法
用户0956691600917 小时前
nlp
使用modelscope在本地部署文本情感分析模型并对外提供api接口使用modelscope部署StructBERT情感分类-中文-通用-base模型,并提供api接口环境安装 · 文档中心 为了简化部署,直接使用官方提供的docker镜像部署环境
uncle_ll17 小时前
自然语言处理·nlp·语音识别·tts·语音变换
李宏毅NLP-9-语音转换语音转换(Voice Conversion, VC)的核心定义与本质,可从 输入输出、保留与改变的维度 解析:
陈敬雷-充电了么-CEO兼CTO5 天前
人工智能·python·gpt·ai·chatgpt·nlp·aigc
主流大模型Agent框架 AutoGPT详解注:此文章内容均节选自充电了么创始人,CEO兼CTO陈敬雷老师的新书《GPT多模态大模型与AI Agent智能体》(跟我一起学人工智能)【陈敬雷编著】【清华大学出版社】
Accelemate6 天前
nlp
Bert进行LoRA微调详细流程(附代码)背景说明: 基于 bert-base-uncased模型进行LoRA微调,完成句子情感分类任务,判断句子是属于哪类情感。
**梯度已爆炸**7 天前
人工智能·深度学习·nlp
NLP文本预处理分词就是将连续的字序列按照一定的规范重新组合成词序列的过程。在英文的行文中,单词之间是以空格作为自然分界符的,而中文只是字、句和段能通过明显的分界符来简单划界,唯独词没有一个形式上的分界符。分词过程就是找到这样分界符的过程。
蹦蹦跳跳真可爱5898 天前
人工智能·深度学习·nlp·transformer·循环神经网络
Python----循环神经网络(Transformer ----注意力机制)场景引入:在购物时,通常会根据自身的尺寸,比如腰 围和胸围,来对照商家提供的尺码对照表。在下面的例子中,最左侧的腰围代表我们 的个人尺寸(query),而右侧的两列则是商家提供的对照表(key、value)。
kunge201323 天前
nlp
自然语言处理基础-迈向NLP领域的第1步台阶在自然语言处理任务中,词向量(Word Embedding)是表示自然语言里单词的一种方法,即把每个词都表示为一个N维空间内的点,即一个高维空间内的向量。通过这种方法,实现把自然语言计算转换为向量计算。
爱学习的书文24 天前
大模型·nlp·datawhale打卡
Datawhlale_快乐学习大模型_task02_NLP 基础概念书籍地址简要总结一下个人理解英文:Natural Language Processing 全程:自然语言处理 含义:通过计算机模拟人类认知和使用语言
羊小猪~~24 天前
人工智能·深度学习·神经网络·自然语言处理·大模型·nlp·embedding
【NLP入门系列三】NLP文本嵌入(以Embedding和EmbeddingBag为例)博主简介:努力学习的22级本科生一枚 🌟;探索AI算法,C++,go语言的世界;在迷茫中寻找光芒🌸 博客主页:羊小猪~~-CSDN博客 内容简介:NLP入门三,Embedding和EmbeddingBag嵌入. 🌸箴言🌸:去寻找理想的“天空“”之城 上一篇内容:【NLP入门系列二】NLP分词和字典构建-CSDN博客
我想说一句24 天前
前端·nlp·trae
在Colab玩转大模型:一天速成NLP魔法师!——当Hugging Face遇上.ipynb,连蜡烛都能听懂人话了本人是搞js的,对机器学习当然是一窍不通,但是这也没事,有了Colab,你也能玩转社区大模型
AI-星辰1 个月前
人工智能·大模型·llm·nlp
始理解NLP:我的第一章学习心得最近开始学习Datawhale的Happy-LLM教程,刚完成第一章《NLP基础概念》的学习。作为一个对大语言模型感兴趣的初学者,这一章给了我很多启发。想记录一下自己的学习收获和思考。
故事挺秃然1 个月前
算法·nlp
中文分词:机械分词算法详解与实践总结引子:上一篇文章我们从中文分词的历程、发展、问题等方面进行了理论性的探讨,从概念方面对中文分词有了一定的了解与认识,今天,我们主要探讨中文分词中的机械分词。
love530love1 个月前
linux·运维·前端·人工智能·windows·后端·nlp
是否需要预先安装 CUDA Toolkit?——按使用场景分级推荐及进阶说明以下内容是从实践角度出发,对 CUDA 工具链是否需要在Windows系统上预先安装 进行逻辑说明,不仅只停留在“需/不需”,而是以使用场景为依据,进行推荐与分层解释,特别突出生产环境/开发环境建议提前在系统上安装 CUDA Toolkit 。
故事挺秃然1 个月前
nlp·mcp
MCP(模型上下文协议)——AI生态的“万能插座”关于上一篇分词的相关算法以及实践,得稍等等去更新了,这两天在折腾组装主机。因此将这篇在公司内技术分享的内容,分享出来,偷个懒。
zsq1 个月前
论文阅读·笔记·nlp·大语言模型幻觉
【论文阅读笔记】HaDes幻觉检测benchmarkLLM幻觉检测现有方法缺点:提出 令牌级(token-level)、无参考(reference-free) 的幻觉检测任务,无需依赖外部参考文本,直接检测文本中单个令牌的幻觉风险。同时,构建了上述任务的数据集 HaDes。构建流程如下:
故事挺秃然1 个月前
nlp
TF-IDF算法的代码实践应用——关键词提取、文本分类、信息检索回顾:TF-IDF算法详解与实践总结上一篇文章我们深入剖析了TF-IDF的原理与细节,但实践才是检验真理的唯一标准!今天,我们将从“纸上谈兵”转向“实战演练”:通过纯Python手写实现与调用sklearn工具包两种方式,带你一步步完成TF-IDF在真实场景中的应用
风雨中的小七1 个月前
llm·nlp
解密prompt系列55.Agent Memory的工程实现 - Mem0 & LlamaIndex记忆存储是构建智能个性化、越用越懂你的Agent的核心挑战。上期我们探讨了模型方案实现长记忆存储,本期将聚焦工程实现层面。
柠石榴1 个月前
论文阅读·笔记·深度学习·nlp·text-to-sql
【论文阅读笔记】《A survey on deep learning approaches for text-to-SQL》A survey on deep learning approaches for text-to-SQL