nlp

Dann Hiroaki18 小时前
数据库·机器学习·自然语言处理·nlp
文献分享: ConstBERT固定数目向量编码文档😂图放这了,大道至简的 idea \text{idea} idea不愧是 ECIR \text{ECIR} ECIR
TIANE-Kimmy21 小时前
人工智能·nlp
LLaMA-2 7B 简介LLaMA-2 7B 是 Meta(前 Facebook)推出的 LLaMA-2(Large Language Model Meta AI 2) 系列中的一个 7B 参数(70 亿参数)版本。LLaMA-2 作为 LLaMA 的升级版本,专为 更高效的推理和更广泛的应用场景 设计,支持开源使用,并可用于研究和商业用途。
花千树-0103 天前
人工智能·pytorch·自然语言处理·nlp·aigc
MOE(Mixture of Experts)门控网络的实现与优化MOE(Mixture of Experts,混合专家)是一种强大的深度学习架构,它通过多个“专家”模型来处理输入数据,并使用一个门控网络(Gating Network)动态选择或加权组合各个专家的输出,从而提升模型的计算效率和任务适应能力。本文将详细介绍 MOE 门控系统的实现方式,并提供完整的代码示例。
邪恶的贝利亚4 天前
python·nlp
神经网络之词嵌入模型(基于torch api调用)Word Embedding(词嵌入): 词嵌入技术是自然语言处理(NLP)领域的一项重大创新,它极大地推动了计算机理解和处理人类语言的能力。
歌刎5 天前
人工智能·深度学习·nlp·deepseek·长序列建模
DeepSeek开源周Day5: 3FS存储系统与AI数据处理新标杆项目地址:开源日历:2025-02-24起 每日9AM(北京时间)更新,持续五天 (5/5)!在AI技术迅猛发展的浪潮中,DeepSeek以「开源周」形式连续五天发布五大核心基础设施项目,引发行业震动。最终日压轴登场的 Fire-Flyer File System(3FS) 和 smallpond 数据处理框架,更是将存储与计算性能推向新高度。与此同时,OpenAI仓促推出GPT-4.5却因天价API引发争议。本文将全面解析这场技术盛宴的核心突破。
m0_748038565 天前
人工智能·python·机器学习·信息可视化·nlp
数据可视化02-PCA降维PCA做什么?找坐标系。目标?二维降到一维,信息保留最多。怎么样最好?数据分布最分散的方向(方差最大),作为主成分(坐标轴)。
不懂就要问6 天前
人工智能·深度学习·自然语言处理·nlp·transformer
GPT1 与 GPT2 的异同GPT1介绍了一种通过生成式预训练(Generative Pre-Training)来提升语言理解能力的方法。这种方法首先在一个大型的未标注文本语料库上进行语言模型的预训练,然后针对具体的任务进行判别式微调(discriminative fine-tuning)。文章详细阐述了这种方法的动机、相关工作、框架、实验结果以及分析。
歌刎6 天前
人工智能·语言模型·开源·nlp·deepseek
DeepSeek开源周Day4:三连发!突破 AI 训练瓶颈的立体解决方案,并行计算三剑客DualPipe、EPLB与Profile-data项目地址:开源日历:2025-02-24起 每日9AM(北京时间)更新,持续五天 (4/5)!在训练千亿级参数的AI模型时,传统的计算架构如同早高峰的单行道——计算任务(数据)只能单向流动,GPU设备(车道)经常空闲等待,导致资源浪费和效率低下。DeepSeek此次开源的DualPipe、EPLB与Profile-data,如同为AI训练打造了立体交通系统,彻底解决三大核心难题:
花千树-0106 天前
人工智能·python·langchain·pdf·nlp·aigc·embedding
LangChain教程 - RAG - PDF问答系列文章索引 LangChain教程 - 系列文章在现代自然语言处理(NLP)中,基于文档内容的问答系统变得愈发重要,尤其是当我们需要从大量文档中提取信息时。通过结合文档检索和生成模型(如RAG,Retrieval-Augmented Generation),我们可以构建强大的问答系统。本博客将详细介绍如何使用FastAPI和LangChain框架,创建一个基于PDF文档的RAG问答API。
m0_748038568 天前
人工智能·python·机器学习·支持向量机·分类·nlp
NLP09-加强1-对比SVM支持向量机(SVM)(一)导入 SVM 相关库(二) 修改模型初始化(三) 比较朴素贝叶斯分类器SVM分类器
m0_748038568 天前
人工智能·python·机器学习·自然语言处理·数据挖掘·nlp
NLP09-朴素贝叶斯问句分类(3/3)首先有个问句分类类:以下均为该类中的属性。__init__ 是 Python 中的一个特殊方法(也叫构造函数),它在创建类的实例时自动调用,用于初始化对象的属性。
小森( ﹡ˆoˆ﹡ )9 天前
人工智能·自然语言处理·nlp
DeepSeek 全面分析报告引言DeepSeek 是一款由中国人工智能初创公司 DeepSeek 开发的大型语言模型 (LLM),于 2025 年 1 月发布,迅速成为全球人工智能领域的一匹黑马。DeepSeek 不仅在性能上可与 OpenAI、Google 等巨头的模型相媲美,而且其训练成本和运行效率都显著优于竞争对手,引发了业界和市场的广泛关注。本报告将对 DeepSeek 进行全面分析,涵盖其公司概况、产品服务、技术优势、竞争格局、商业模式、财务状况以及未来发展前景等方面。
歌刎10 天前
人工智能·深度学习·nlp·aigc·deepseek
DeepSeek开源周Day1:FlashMLA引爆AI推理性能革命!项目地址:GitHub - deepseek-ai/FlashMLA 开源日历:2025-02-24起 每日9AM(北京时间)更新,持续五天!
終不似少年遊*12 天前
人工智能·深度学习·nlp·机器翻译·词嵌入
词向量与词嵌入目录Word2Vec原理连续词袋模型(CBOW)跳字模型(Skip-Gram)GloveFastText
qq_153214526413 天前
人工智能·语言模型·自然语言处理·chatgpt·nlp·gpt-3·transformer
Openai Dashboard可视化微调大语言模型大语言模型微调(Fine-tuning)是指对已经预训练好的大规模语言模型(如GPT、BERT等)进行针对性调整,使其适应特定任务或领域的过程。以下是关键点的分步解释:
花千树-01013 天前
java·自然语言处理·nlp·aigc·apache
Java中的自然语言处理(NLP)工具:Stanford NLP、Apache OpenNLP、DL4J随着人工智能技术的快速发展,自然语言处理(NLP)已经成为各行各业中不可或缺的技术。对于Java开发者来说,选择合适的NLP工具可以极大地提升开发效率。今天,我们将探讨几款常用的Java NLP工具:Stanford NLP、Apache OpenNLP 和 DL4J,并通过代码实例展示如何使用它们。
奔跑的蜗牛啊啊15 天前
nlp
linux部署olloma deespeekmkdir -p ~/ollama && cd ~/ollamawget https://github.com/ollama/ollama/releases/download/v0.1.12/ollama-linux-amd64.tar.gz #由于下载速度太慢 我在本地电脑下载通过xftp传输到服务器然后解压的
終不似少年遊*15 天前
人工智能·深度学习·nlp·transformer·注意力机制
Transformer 的核心技术Encoder、Decoder、注意力模块解析目录1. 引言说明目标2.Transformer 的整体架构功能概述基本组成Encoder-Decoder架构
studying_mmr15 天前
机器学习·数据挖掘·nlp·data mining
Word EmbeddingsTwo ways to extract information from the matrix:Widely used in information retrieval:
南太湖小蚂蚁16 天前
人工智能·python·深度学习·nlp
自然语言处理入门1——单词的表示和距离随着DeepSeek的火爆,AI大模型越来越被大众所接受,我们在日常生活和工作学习中也开始越来越频繁的使用豆包、通义千问、Kimi、DeepSeek、文心一言等大模型工具了。这些大模型底层技术都是Transformer模型,属于自然语言处理范畴。