huggingface

Linux 软连接 - 移动 huggingface 模型文件Hugging Face 使用 “内容寻址存储”（Content-Addressable Storage）机制管理模型文件，核心思想是：

Hugging Face NLP课程学习记录 - 3. 微调一个预训练模型安装Hugging Face的datasets模块：以下以一个批次（one batch）为例，说明了如何训练一个句子分类器（sequence classifier）：

Hugging Face 开源 HopeJR 机器臂！今日直播带你深入技术核心我们的 LeRobot 项目又有了新动作 - HopeJR 正式开源！HopeJR 是一款拥有 23 自由度的开源仿生机械臂系统🦾，支持遥操作控制，具备完成复杂任务的能力，适用于科研与开发场景。整个机械臂用 3D 打印即可完成构建，硬件成本仅约 500 欧元！点击这里查看演示视频。

碎片笔记｜PromptStealer复现要点（附Docker简单实用教程）前言：本篇博客记录PromptStealer复现历程，主要分享环境配置过程中的一些经验。论文信息：Prompt Stealing Attacks Against Text-to-Image Generation Models. USENIX, 2024. 开源代码：https://github.com/verazuo/prompt-stealing-attack

在huggingface上制作小demo今天好兄弟让我帮他搞一个模型，他有小样本的化学数据，想让我根据这些数据训练一个小模型，他想用这个模型预测一些值最终我简单训练了一个小模型，起初想把这个模型和GUI界面打包成exe发给他，但是发现打包后3.9GB,太大了吧！！！后来我又找了别的方案，即将训练好的模型以及相关代码、环境配置文件上传到huggingface上，通过hf的界面端直接使用这个模型，接下来我回顾一下整个流程

修改HuggingFace模型默认缓存路径huggingface模型的默认缓存路径是~/.cache/huggingface/hub/通常修改为自己的路径会更为方便。

huggingface NLP主要知识点以及超级详解使用1.安装huggingface依赖库pip install transformers pip install datasets pip install pytorch

Linux服务器部署Deepseek、Dify、RAGflow实战教程安装下载依赖 curl，用于解析下载 ollama 官方地址安装依赖 lspci 或 lshw 等工具用于检测 GPU

轻松微调大模型：利用 Colab 和 Unsloth 实现高效训练大型语言模型（LLM）如 Llama、Mistral 等在通用任务上表现惊艳，但要让它们适配特定场景（比如医疗问答、算命预测），就需要微调。Google Colab 提供免费的 GPU 资源，而 Unsloth 是一个高效的微调工具，能大幅降低显存需求，让普通用户也能在云端完成训练。这篇文章将带你一步步完成从零到部署的全过程。

huggingface/pytorch-image-modelshuggingface/pytorch-image-models单卡：多卡，下面参数的4表示4块卡一起训练：

本地部署DeepSeek-R1模型（新手保姆教程）最近deepseek太火了，无数的媒体都在报道，很多人争相着想本地部署试验一下。本文就简单教学一下，怎么本地部署。

Huggingface使用Transformer 是一种基于自注意力机制（Self-Attention）的深度学习模型，最初由 Vaswani 等人在 2017 年的论文《Attention is All You Need》中提出。Transformer 模型在自然语言处理（NLP）任务中表现出色，逐渐取代了传统的循环神经网络（RNN）和卷积神经网络（CNN）模型，成为 NLP 领域的主流架构。

llamafactory使用8张昇腾910b算力卡lora微调训练qwen2-72b大模型我需要在昇腾服务器上对Qwen2-72B大模型进行lora微调，改变其自我认知。我的环境下是8张910B1卡。显存约512GB。

阿正的梦工坊

AMP 混合精度训练中的动态缩放机制: grad_scaler.py函数解析（ torch._amp_update_scale_）在深度学习中，混合精度训练（AMP, Automatic Mixed Precision）是一种常用的技术，它利用半精度浮点（FP16）计算来加速训练，同时使用单精度浮点（FP32）来保持数值稳定性。为了在混合精度训练中避免数值溢出，PyTorch 提供了一种动态缩放机制来调整 “loss scale”（损失缩放值）。本文将详细解析动态缩放机制的实现原理，并通过代码展示其内部逻辑。

阿正的梦工坊

Gemma2 2B 模型的model.safetensors.index.json文件解析在使用 Gemma2 2B 模型或其他大型预训练模型时，model.safetensors.index.json 文件起到了索引的作用，它帮助我们了解模型的结构、参数存储方式以及如何加载模型的具体权重。本博客将深入解析该文件的内容和用途。下载到本地的文件如下所示：

weixin_40455124

HUGGINGFACE NLP- MAIN NLP TASKS1.1 分类 1.1.1 实体命名识别 (NER): 找出句子中的实体（如人物、地点或组织）。这可以通过为每个实体或“无实体”指定一个类别的标签。 1.1.2 词性标注 (POS): 将句子中的每个单词标记为对应于特定的词性（如名词、动词、形容词等）。 1.1.3 分块（chunking）: 找到属于同一实体的Token。这个任务(可结合POS或NER)可以任何将一块Token作为制定一个标签(通常是B -),另一个标签(通常I -)表示Token是否是同一块,和第三个标签(通常是O)表示Token不属于

weixin_40455124

huggingface NLP-微调一个预训练模型微调一个预训练模型1.1 处理数据 1.1.1 fine-tune 使用tokenizer后的token 进行训练

人工评估 | 基础概念这是人工评估系列文章的第一篇《基础概念》，全系列包括:人工评估是指让人类评价模型输出回答的好坏。本文讨论的都是后验评估，即模型已经完成训练，给定一个任务让人类进行评估。

Visual Code的Terminal （PowerShell）中下载huggingface模型方案：使用 huggingface_hub 工具 + hf-mirror 镜像站点实现huggingface-cli 指令将用指定的站点代替缺省站点 huggingface.co

阿正的梦工坊

理解Parquet文件和Arrow格式：从Hugging Face数据集的角度出发parquet发音：美 [pɑrˈkeɪ] 镶木地板；拼花木地板在机器学习和大数据处理中，数据的存储和传输格式对于性能至关重要。两种广泛使用的格式是 Parquet 和 Arrow。它们在数据存储、传输和处理上都有各自的优势，尤其是在大规模数据集的使用中尤为重要。