datawhale

Daisy Lee14 天前
学习·金融·datawhale
量化学习-第1章-什么是量化金融用数学、统计、计算机 + 金融理论,把交易想法写成规则,用数据验证,让机器批量执行。关键认知:量化不预测未来,它只统计过去、验证规律、寻找概率优势。
IRevers14 天前
人工智能·pytorch·深度学习·大模型·datawhale·vllm·amdev
【大模型】Gemma4在ROCm和vLLM部署Gemma 4 是 Google DeepMind 于 2026 年 4 月推出的一系列最新、最强的开源大模型。它的定位非常明确:以极高的"参数效率"为核心,将强大的 AI 能力从云端带到你的手机、电脑等本地设备上。
安如衫16 天前
datawhale·vllm·amdev
【Hello-ROCm】vLLM 跑通 Gemma4-E4B学习来源:Datawhale × AMD AI 学习中心 Day1-2 实操任务输出(节选):“AMD Radeon Graphics” 不是型号——VBIOS 没填产品名时的 fallback。容量看 Mem-Usage 第二列:49136 MB ≈ 48 GiB,功耗上限 241W。
yzqy_18 天前
人工智能·笔记·学习·datawhale·amdev
AMD AI 开发者计划学习笔记:从 ROCm 到 Ryzen AI,理解 AMD 的 AI 开发生态最近学习了 AMD AI 开发者计划 以及 AMD 官方文档,对 AMD 在 AI 开发方向的软硬件生态有了更系统的认识。过去我对 AMD 的印象更多停留在 CPU、显卡和游戏性能上,但这次学习后发现,AMD 的开发者生态已经围绕 AI 训练、推理、本地 AI PC、GPU 加速和异构计算形成了一套比较完整的技术路线。
10WTW0118 天前
datawhale·gemma4·amdev
AMD Hello-ROCm 环境配置(一)#下载的时候不用着急,可能网络速度比较慢所以要等待的时间比较长(我体验下来基本上挺快的,不像自己电脑用校园网下载很不稳定,还会出现因网络波动导致下载失败的情况)
尘汐筠竹18 天前
笔记·学习·datawhale·amdev
Day1-2 学习笔记:在 AMD 云环境上部署 Gemma 4 大模型用一句话概括:在 AMD 的云端 GPU 上,把 Google 开源的 Gemma 4 大模型(40亿参数)跑起来,并和它完成了一次真实对话。
Mocode18 天前
datawhale·amdev
【2026】Datawhale X AMD · Hello ROCm - Part1 - 配置云环境&部署大模型ROCm(Radeon Open Compute)是AMD公司开发的开源GPU计算平台,类似于NVIDIA的CUDA平台。Part 1主要介绍怎么在云端AMD显卡上用业界主流的vLLM框架,把Google最新开源的Gemma4跑成可对话的推理服务。
heart_666218 天前
大数据·人工智能·datawhale·amdev
AMD平台实战:ModelScope 一键微调 Gemma 4 情绪分类实战承接上文,在ADM云平台里面进入服务器里面,默认打开就是ModelScope 一键微调 Gemma 4 情绪分类的脚本,如果找不到,去这个路径(/workspace/repo/src/fine-tune/models/gemma4)找
70asunflower19 天前
人工智能·学习·datawhale·amdev
【Day1-2】部署&运行 Gemma4 大模型 - Datawhale AI学习点击右侧的 Terminal 图标新建一个 终端复制 指令 ,粘贴运行指令,检查当前 GPU 是否可用
JeffDingAI19 天前
datawhale·amdev
【Datawhale学习笔记】使用AMD GPU15分钟部署&运行Gemma4大模型Gemma 4 是 Google DeepMind 于 2026 年 4 月 3 日发布的新一代开源多模态大模型家族,基于 Gemini 技术,主打 “强推理 + 全场景部署 + Apache 2.0 免费商用”,端侧到数据中心全覆盖。
you鬰19 天前
datawhale·amdev
Gemma 4 模型微调(Fine-Tuning)来源:Datawhale AI 学习营 Day3-7Notebook: gemma4_emotion_lora_modelscope_single_gpu.ipynb
Lin_Aries_04211 个月前
笔记·具身智能·datawhale
最终成果报告:导航模型与无人机导航方向导航模型与无人机导航方向 具体聚焦:Habitat 仿真平台 + ETPNav 视觉语言导航模型(连续环境 VLN‑CE)
Lin_Aries_04211 个月前
笔记·具身智能·datawhale
ETPNav 复现指南:从环境搭建到连续环境视觉语言导航全流程一篇面向研究者的完整踩坑笔记与操作教程ETPNav(Evolving Topological Planning)是连续环境视觉语言导航(VLN‑CE)领域一个强力的基线模型,由 Dong An 等人提出,论文已于 2024 年被顶级期刊 IEEE TPAMI 收录。 官方开源仓库:MarSaKi/ETPNav
Lin_Aries_04211 个月前
笔记·具身智能·datawhale
从零部署GenieSim:基于OpenPI的仿真环境搭建与录制教程手把手教你配置服务端、连接客户端、运行仿真并录制结果最近在捣鼓GenieSim这个仿真环境,踩了不少坑,也总结了一些经验。今天就把完整的部署流程分享出来,希望能帮到同样在折腾的小伙伴。
Lin_Aries_04211 个月前
具身智能·datawhale
具身导航基础——环境搭建本人是在该平台进行仿真训练,Datawhale 社区已经部署好环境了。1.打开2.进入界面3.进入相应文件,右击鼠标打开终端,执行命令 python + 文件名,运行文件(操作命令跟Linux差不多)
ACCELERATOR_LLC2 个月前
人工智能·大模型·datawhale
【DataWhale组队学习】DIY-LLM Task1分词器原文链接分词器常被视为LLM的一部分,但它其实有独立的训练生命周期。Tokenizer本质上是将原始文本转换为模型可处理的离散符号序列的组件,它可以决定模型看到世界的基本粒度:是字符、单词、子词,还是字节片段,而这个粒度的选择会进一步影响序列长度、OOV、词表的规模还有训练效率等。
墨心@2 个月前
人工智能·语言模型·自然语言处理·agent·datawhale·agent设计模式·组队学习
多Agent系统的编排2023年3月14日,OpenAl发布了GPT-4。就在当天,一位研究人员在Twitter上发布了一条意义非凡的推文:“如果我们让多个GPT-4实例相互对话,又会发生什么呢?”48 小时后,AutoGPT 诞生了。紧随其后,BabyAGI、AgentGPT、SuperAGI 等项目如雨后春笋般涌现。人们突然意识到:真正的力量并不在于单体Agent有多聪明,而在于多个Agent 如何协同工作。 在那一刻,研究人员领悟到:智能并非单个模型的固有属性,而是“互动”的产物。 通过将模型拆解为Researcher(
墨心@2 个月前
pytorch·语言模型·大语言模型·datawhale·组队学习
pytorch 与资源核算问题: 假设你是一个 AI 工程师,老板问你:“在 1024 张 H100 显卡上,训练一个 70B(700亿参数)的模型,数据量是 15T(15万亿 tokens),大概要多久?” 直接跑去写代码测试,那可能几天甚至几个月都出不来结果。因此,我们需要学会“Napkin math”(餐巾纸计算,即快速估算)。
念谨2 个月前
语言模型·datawhale·组队学习·cs336 中文课程
【Diy-LLM】Task 1 分词器笔记学习资料很多人觉得分词器是大模型的一部分,其实它有自己的训练流程。简单说:先拿正则把原始文本整理一下,再统计出一套词表,把文字片段和数字ID对应起来。 这个对应方式决定了模型看到的是字、词,还是更碎的片段。直接影响后面模型学得好不好。