大模型

好多渔鱼好多16 小时前
人工智能·机器学习·ai·大模型
【大模型学习】第九章 机器学习中的数据预处理技术详解目录引言一、清洗数据(Data Cleaning)1. 定义与目的2. 常见问题及解决方法2.1 重复记录
Archie_IT2 天前
人工智能·大模型·aigc·通义万相·deepseek
AI视频领域的DeepSeek—阿里万相2.1图生视频让我们一同深入探索万相 2.1 ,本文不仅介绍其文生图和文生视频的使用秘籍,还将手把手教你如何利用它实现图生视频。
好多渔鱼好多2 天前
人工智能·算法·机器学习·ai·大模型
【大模型学习】第十章 机器学习中的特征工程技术详解目录一、引言二、技术要点三、技术要点原理1. 数据预处理2. 特征编码3. 特征缩放4. 特征选择5. 特征组合
Dontla2 天前
大模型
Dify+DeepSeek | Excel数据一键可视化(创建步骤案例)(echarts助手.yml)(文档表格转图表、根据表格绘制图表、Excel绘制图表)Dify部署参考:Dify Rag部署并集成在线Deepseek教程(Windows、部署Rag、安装Ragan安装、安装Dify安装、安装ollama安装)
KoiC2 天前
linux·人工智能·ubuntu·docker·大模型·ai应用·deepseek
内网环境部署Deepseek+Dify,构建企业私有化AI应用公司为生产安全和保密,内部的服务器不可连接外部网络,为了可以在内网环境下部署,采用的方案为ollama(Docker)+Dify(Docker Compose),方便内网环境下迁移和备份,下文将介绍部署的全部过程。
胡耀超2 天前
人工智能·python·深度学习·大模型
5.训练策略:优化深度学习训练过程的实践指南——大模型开发深度学习理论基础在实际开发中,训练策略对神经网络的表现起着至关重要的作用。通过合理的训练策略,我们可以有效避免过拟合和欠拟合,加速模型收敛,并提升最终性能。本文将从实际开发角度详细介绍几种关键的训练策略,包括 Early Stopping、Warmup 策略和学习率衰减(Learning Rate Decay),并结合实际工具和代码示例,帮助各位开发者在项目中灵活应用这些策略。
Nicolas8932 天前
大模型·强化学习·千问·r1·推理模型·32b
【大模型实战篇】vllm本地部署阿里最新的QwQ-32B推理模型以及体验3月6日凌晨,阿里巴巴发布并开源全新的推理模型通义千问QwQ-32B。通过大规模强化学习,千问QwQ-32B在数学、代码及通用能力上实现提升。在保持性能的同时,千问QwQ-32B还大幅降低部署使用成本,在消费级显卡上也能实现本地部署。
摸鱼小天才3 天前
ai·大模型
关于大模型这些术语,你都知道吗?在当今的科技领域,大模型和AI技术的发展可谓是日新月异。在初学大模型的时候,大家肯定会碰到各种专业术语,让人眼花缭乱。本文将为您简单地解释一些关键术语,帮助您在学习过程中更好地理解大模型和AI的世界。
TGITCIC3 天前
ai·大模型·aigc·agi·大模型发展·大模型未来·ai与人
大模型为何无法达到AGI?当前 AI 技术的飞速发展未必意味着我们即将迎来真正的人工智能(AGI)。大模型如 GPT-4、DeepSeek 等在语言生成领域的表现让人惊叹。但仔细分析其工作机制,难免让人疑惑:这些模型究竟能不能称为具有自主智能的存在?
胡耀超3 天前
人工智能·深度学习·神经网络·大模型
3.激活函数:神经网络中的非线性驱动器——大模型开发深度学习理论基础激活函数在神经网络中扮演着至关重要的角色,它为模型引入非线性因素,使得网络能够拟合复杂的数据分布,从而实现高效的特征提取与预测。本文将从实际开发角度出发,介绍激活函数的基本概念、常见激活函数(如 ReLU、GELU、Swish 等)的特点与适用场景,以及实践中的调优建议和工具使用,帮助开发者理解并正确应用激活函数。
救救孩子把3 天前
人工智能·笔记·大模型·deepseek
智能笔记,智慧管理:Obsidian 与 DeepSeek 携手引领 AI 知识新时代清华大学出品《DeepSeek:从入门到精通》分享 清华大学出品《DeepSeek:从入门到精通》分享 清华大学出品《DeepSeek:从入门到精通》分享
FOUR_A3 天前
人工智能·算法·机器学习·大模型·llama
【LLM】从零开始实现 LLaMA3在这里,我们不会实现一个 BPE 分词器(但 Andrej Karpathy 有一个非常简洁的实现)。
好多渔鱼好多3 天前
人工智能·机器学习·ai·大模型
【大模型学习】第八章 深入理解机器学习技术细节目录引言一、监督学习(Supervised Learning)1. 定义与工作原理2. 常见任务3. 应用场景示例:房价预测
IT古董3 天前
人工智能·大模型
【大模型】大模型分类大模型(Large Models)通常指参数量巨大、计算能力强大的机器学习模型,尤其在自然语言处理(NLP)、计算机视觉(CV)等领域表现突出。以下是大模型的常见分类方式:
*星星之火*3 天前
大模型·prompt
【大模型】第一节 Prompt 的典型构成Prompt 的典型构成¶ 不要套「模板」模版是市面上 prompt 教程、书籍最常提供的形式 但每家的模版都不一样,这说明了什么? 不要固守「模版」 模版的价值是提醒我们别漏掉什么,而不是必须遵守模版才行 典型构成:
mask哥4 天前
pytorch·python·自然语言处理·大模型·huggingface
huggingface NLP主要知识点以及超级详解使用1.安装huggingface依赖库pip install transformers pip install datasets pip install pytorch
好多渔鱼好多4 天前
人工智能·ai·大模型·prompt
【大模型学习】第二章 大模型技术中的Prompt目录摘要1. 意义与价值1.1 降低技术门槛1.2 提升模型灵活性1.3 优化资源利用率2. 核心思想与方法论
程序员胡默默4 天前
大模型
初始提示词(Prompting)在自然语言处理领域,LLM(Large Memory Language Model,大型记忆语言模型)架构代表了最前沿的技术。它结合了存储和检索外部知识的能力以及大规模语言模型的强大实力。
暗夜猎手-大魔王4 天前
大模型
大语言模型学习--本地部署DeepSeek本地部署一个DeepSeek大语言模型 研究学习一下。本地快速部署大模型的一个工具 先根据操作系统版本下载Ollama客户端
胡耀超4 天前
人工智能·python·深度学习·大模型
2.反向传播机制简述——大模型开发深度学习理论基础在深度学习开发中,反向传播机制是训练神经网络不可或缺的一部分。它让模型能够通过不断调整权重,从而将预测误差最小化。本文将从实际开发角度出发,简要介绍反向传播机制的核心概念、基本流程、在现代网络中的扩展,以及如何利用自动微分工具简化反向传播的实现。