nlp

qq_15321452648 分钟前
人工智能·语言模型·自然语言处理·chatgpt·nlp·gpt-3·transformer
Openai Dashboard可视化微调大语言模型大语言模型微调(Fine-tuning)是指对已经预训练好的大规模语言模型(如GPT、BERT等)进行针对性调整,使其适应特定任务或领域的过程。以下是关键点的分步解释:
花千树-0104 小时前
java·自然语言处理·nlp·aigc·apache
Java中的自然语言处理(NLP)工具:Stanford NLP、Apache OpenNLP、DL4J随着人工智能技术的快速发展,自然语言处理(NLP)已经成为各行各业中不可或缺的技术。对于Java开发者来说,选择合适的NLP工具可以极大地提升开发效率。今天,我们将探讨几款常用的Java NLP工具:Stanford NLP、Apache OpenNLP 和 DL4J,并通过代码实例展示如何使用它们。
奔跑的蜗牛啊啊2 天前
nlp
linux部署olloma deespeekmkdir -p ~/ollama && cd ~/ollamawget https://github.com/ollama/ollama/releases/download/v0.1.12/ollama-linux-amd64.tar.gz #由于下载速度太慢 我在本地电脑下载通过xftp传输到服务器然后解压的
終不似少年遊*2 天前
人工智能·深度学习·nlp·transformer·注意力机制
Transformer 的核心技术Encoder、Decoder、注意力模块解析目录1. 引言说明目标2.Transformer 的整体架构功能概述基本组成Encoder-Decoder架构
studying_mmr2 天前
机器学习·数据挖掘·nlp·data mining
Word EmbeddingsTwo ways to extract information from the matrix:Widely used in information retrieval:
南太湖小蚂蚁3 天前
人工智能·python·深度学习·nlp
自然语言处理入门1——单词的表示和距离随着DeepSeek的火爆,AI大模型越来越被大众所接受,我们在日常生活和工作学习中也开始越来越频繁的使用豆包、通义千问、Kimi、DeepSeek、文心一言等大模型工具了。这些大模型底层技术都是Transformer模型,属于自然语言处理范畴。
studying_mmr4 天前
数据挖掘·nlp·data mining
Natural Language Processing NLP清晰版本查看A research field focussed on creating software systems with knowledge about natural (human) language 研究重點是關於自認語言的知識
歌刎4 天前
linux·人工智能·华为·语言模型·nlp
华为昇腾 910B 部署 DeepSeek-R1 蒸馏系列模型详细指南本文记录 在 华为昇腾 910B(65GB) * 8 上 部署 DeepSeekR1 蒸馏系列模型(14B、32B)全过程与测试结果。
Q同学6 天前
深度学习·llm·nlp
一张4060完成一个miniLLM全流程训练(一):预训练之前装机时配了一个12600kf+4060的主机,今天在Github上看到一个名为MiniMind2的项目,旨在使用很小的算力就可以打造全流程的LLM训练,感觉很有趣,今天下午便尝试了一番。注意:以下所有实验在Windows主机的WSL子系统中实现。
开出南方的花10 天前
人工智能·pytorch·深度学习·机器学习·架构·nlp·attention
DeepSeek模型架构及优化内容DeepSeek LLM基本上遵循LLaMA的设计:采⽤Pre-Norm结构,并使⽤RMSNorm函数.
X.Cristiano11 天前
面试·nlp·prompt
[LLM面试题] 指示微调(Prompt-tuning)与 Prefix-tuning区别Prompt Tuning是一种通过改变输入提示语(input prompt)以获得更优模型效果的技术。举个例子,如果我们想将一条英语句子翻译成德语,可以采用多种不同的方式向模型提问,如下图所示:
熊文豪12 天前
人工智能·ai·自然语言处理·nlp·cv·deepseek·深度求索
深度求索(DeepSeek)的AI革命:NLP、CV与智能应用的技术跃迁Deepseek官网:DeepSeek近年来,人工智能技术以指数级速度重塑全球产业格局。在这场技术革命中,深度求索(DeepSeek)凭借其前沿的算法研究、高效的工程化能力以及对垂直场景的深度理解,逐渐成为AI领域的核心参与者之一。 本文将从自然语言处理(NLP)、计算机视觉(CV)两大核心技术领域切入,结合智能客服、自动驾驶、医疗影像分析等场景,解析DeepSeek的技术突破及其对行业的深远影响。
小马过河R12 天前
人工智能·机器学习·语言模型·nlp·ocr
OCR与多模态大模型的关系OCR(光学字符识别)的基本原理可分为传统方法和现代方法,核心目标是将图像中的文字转换为可编辑的文本。以下是其关键步骤和技术:
htuhxf16 天前
python·自然语言处理·nlp·tf-idf·文本特征
TfidfVectorizerTF-IDF / Term Frequency - Inverse Document Frequency
万事可爱^16 天前
深度学习·语言模型·nlp·deepseek·版本解释
DeepSeek各版本说明与优缺点分析DeepSeek是最近人工智能领域备受瞩目的一个语言模型系列,其在不同版本的发布过程中,逐步加强了对多种任务的处理能力。本文将详细介绍DeepSeek的各版本,从版本的发布时间、特点、优势以及不足之处,为广大AI技术爱好者和开发者提供一份参考指南。
L_cl17 天前
nlp·embedding
【NLP 20、Encoding编码 和 Embedding嵌入】目录一、核心定义与区别二、常见Encoding编码(1) 独热编码(One-Hot Encoding)
G.E.N.17 天前
开发语言·人工智能·深度学习·nlp·word·deepseek
本地Ollama部署DeepSeek R1模型接入Word目录1.本地部署DeepSeek-R1模型2.接入Word3.效果演示4.问题反馈上一篇文章办公新利器:DeepSeek+Word,让你的工作更高效-CSDN博客https://blog.csdn.net/qq_63708623/article/details/145418457?spm=1001.2014.3001.5501https://blog.csdn.net/qq_63708623/article/details/145418457?spm=1001.2014.3001.5501我们通过API
山海青风18 天前
运维·人工智能·爬虫·python·自动化·nlp·beautifulsoup
OpenAI 实战进阶教程 - 第六节: OpenAI 与爬虫集成实现任务自动化爬虫与 OpenAI 模型结合,不仅能高效地抓取并分析海量数据,还能通过 NLP 技术生成洞察、摘要,极大提高业务效率。以下是一些实际工作中具有较高价值的应用案例:
Sherlock Ma23 天前
人工智能·pytorch·深度学习·语言模型·nlp·aigc·transformer
qwen2.5-vl:阿里开源超强多模态大模型(包含使用方法、微调方法介绍)在 Qwen2-VL 发布后的五个月里,众多开发者基于该视觉语言模型开发了新的模型,并向 Qwen 团队提供了极具价值的反馈。在此期间,Qwen 团队始终致力于打造更具实用性的视觉语言模型。今天,Qwen 家族的最新成员——Qwen2.5-VL正式登场。
L~river1 个月前
llm·nlp·transformer·tokenizer·datawhale·decode·tokens
Transfoemr的解码器(Decoder)与分词技术在自然语言处理(NLP)领域,解码器(Decoder)和分词技术是两个至关重要的概念。解码器是序列生成任务的核心组件,而分词则是将文本数据转换为可处理形式的基础步骤。