技术栈
batch
无聊的老谢
14 小时前
spring
·
batch
·
mr
基于 Spring Batch 的电信 MR 数据亿级记录清洗实战
在电信网络优化领域,测量报告(MR)数据是评估网络覆盖质量的核心依据。然而,原始 MR 数据具有“量大、点多、面广”的特征:全省每天产生的 MR 记录可达数十亿条,且包含大量无效采样点、GPS 漂移数据和异常值。如何高效、准确地将这些海量离散数据转化为可用于分析的结构化栅格指标,是运维系统面临的最大技术挑战之一。
m0_图灵灵
3 天前
人工智能
·
深度学习
·
batch
吴恩达《深度学习》之深度剖析Batch Norm 作用机制的本质
在深度学习的面试和理论学习中,我们经常会遇到这样一个经典问题:问题: Batch Normalization(批归一化)为什么能起到轻微的正则化作用?当你增大 Mini-batch 的大小时,这种正则化效果会增强还是减弱?
qq_52788787
6 天前
人工智能
·
机器学习
·
batch
机器学习训练中Epoch、Batch、Bath_size、Data_size的区别
最近在做实验的过程中,总是会把epoch、batch_size和data_size搞混,为了彻底搞明白他们之间的联系,遂写出这个博客。
AI浩
11 天前
开发语言
·
分布式
·
batch
梯度累积与 Micro-Batch 设计分层式精讲:有效批次、显存边界与分布式同步
核心结论:梯度累积是“多次 backward 后再 optimizer step”,用于在小 micro-batch 下模拟更大的有效 batch。它主要降低单次前向/反向的激活显存,不能降低模型参数、梯度和优化器状态本身。因此,梯度累积不能单独让 16GB 显存全参数训练 64B 模型;这类训练还需要 FSDP/ZeRO、量化/LoRA、offload、激活检查点和模型并行。
NiceCloud喜云
23 天前
java
·
开发语言
·
c++
·
人工智能
·
python
·
eclipse
·
batch
AutoClaw 接入自定义 Anthropic 端点:让 Kanban 工作流跑在自己的模型路由上
AutoClaw 是一款带本地 Gateway 的桌面 Agent 应用:内置 AutoClaw、DeepResearch、Cron、Browser use 等多种 Agent 模板,可挂载 MCP Servers、Skills Store,也能连接 Telegram / WhatsApp / 飞书等 IM 渠道。它默认提供 Auto 与 GLM-5-Turbo 两个内置模型,但要让它跑出最好效果——尤其在做复杂规划、代码生成、长上下文研究时——把外部的 Claude Opus 4.7 接进来是最直接的升
江南十四行
1 个月前
pytorch
·
cnn
·
batch
CNN进阶:Batch Normalization与Layer Normalization对比 + 网络结构设计与PyTorch实现
在深度学习的实际应用中,随着网络层数的增加,训练难度也随之上升。为了加速训练、提高稳定性、防止过拟合,研究者提出了多种归一化方法和正则化技术。本文将以CNN为例,深入探讨Batch Normalization (BN) 和 Layer Normalization (LN) 的原理与差异,并结合一个具体的CNN网络结构,展示如何在PyTorch中实现BN、Dropout等模块。
DevilSeagull
1 个月前
开发语言
·
windows
·
后端
·
batch
·
语言
Windows 批处理 (Batch) 编程: 从入门到入土. (一) 基础概念与环境配置
为了Windows 批处理(Batch)技术进行一次全面、深入且细致的系统性剖析. 批处理作为一种内置于 Windows 系统的命令行脚本语言, 其功能远比表面看起来更为强大和复杂, 本教程力求为读者构建一个从入门到精通, 乃至具备安全攻防视角的批处理知识体系.
前端摸鱼匠
2 个月前
开发语言
·
人工智能
·
面试
·
求职招聘
·
batch
【AI大模型春招面试题22】层归一化(Layer Norm)与批归一化(Batch Norm)的区别?为何大模型更倾向于使用Layer Norm?
你好!咱们直接切入正题。这道题在LLM(大语言模型)面试中属于**“必考题”,但很多候选人只能背出“训练稳定性”这种万金油答案,缺乏对序列数据特性**、显存开销以及推理阶段行为的深度理解。
前端摸鱼匠
2 个月前
开发语言
·
人工智能
·
面试
·
求职招聘
·
batch
【AI大模型春招面试题23】大模型的参数量、计算量如何计算?FLOPs与FLOPS的区别?
既然今年是2026年,大模型参数量早就突破了万亿甚至十万亿级别,理解这些计算细节对于做分布式训练优化(如3D并行、MoE路由)更是至关重要。
昵称小白
2 个月前
深度学习
·
batch
图像在深度学习里是怎么表示的:像素、通道、tensor、batch(二)
这一篇要解决一个非常关键的问题:图像为什么能送进神经网络?你平时看到的是“人、车、猫、路灯、天空”。 但神经网络并不直接看到这些语义,它先看到的是:
DeepModel
2 个月前
开发语言
·
人工智能
·
机器学习
·
kmeans
·
batch
通俗易懂讲透 Mini-Batch K-means
Mini-Batch K-means 就是标准 K-means 的高速版,专门解决大数据跑不动的问题。本文用大白话+通俗案例+核心公式+可直接运行代码,从零讲透,适合课堂笔记、实验报告。
小布的学习手记
2 个月前
人工智能
·
深度学习
·
batch
深度学习里的“自动稳压器”:通俗解读批量规范化(Batch Normalization)
版权声明:本文同步发布于个人博客。欢迎交流与转载,但请务必注明出处。导读:如果你正在训练深层神经网络,是否遇到过训练慢如蜗牛、学习率稍大就发散、或者网络深了就不收敛的烦恼?今天我们要聊的批量规范化(Batch Normalization,简称 BN),就是解决这些问题的“神器”。它让训练深层网络变得像搭积木一样简单。本文将抛开复杂的数学公式,用最通俗的语言带你理解它的核心原理。
Huanzhi_Lin
2 个月前
服务器
·
前端
·
nginx
·
batch
·
静态资源服务器
Nginx本地资源服务器-常用脚本
清空mega
2 个月前
网络
·
深度学习
·
batch
动手学深度学习|批量归一化(Batch Normalization)超详细讲解:为什么它能让深层网络更容易训练?
这一节很重要,因为从这里开始,你会发现:卷积神经网络的进步,不只是来自“结构怎么设计”,还来自“训练怎么更稳定”。
bIo7lyA8v
2 个月前
数据库
·
sql
·
batch
从 ChangeTracker 到 SQL Batch 的性能诊断与优化
真实场景:订单系统在白天吞吐稳定,凌晨高峰出现周期性尖峰。接口平均耗时变化不大,但 P95 从 80ms 抬到 420ms,数据库 CPU 也出现波峰。
无籽西瓜a
2 个月前
windows
·
batch
·
cmd
·
自动化工具
详解bat脚本:语法、常见用法、注意事项、示例
最近在做环境检查和项目的构建打包时,发现有些麻烦,然后发现用bat脚本很方便,故总结本文,如有错误,请评论区指出
zhangfeng1133
3 个月前
人工智能
·
算法
·
batch
`transformers` 的 `per_device_train_batch_size` 不支持小于 1 的浮点数值,llamafactory 支持
transformers 的 per_device_train_batch_size 不支持小于 1 的浮点数值(比如 0.5)。这个参数必须是正整数(int 类型),代表每个设备上的样本数量。
qq131530624
3 个月前
unity
·
游戏引擎
·
batch
Unity 渲染优化核心总结(Draw Call / SetPass / Batch 全体系)
一、核心概念(必须讲清楚)👉 本质:CPU 向 GPU 提交一次渲染命令 一个 Mesh + 一个 Material ≈ 一个 Draw Call(如果材质是图片,那就是一个Mesh一个DrawCall) CPU 负责组织数据 → GPU 负责执行 📌 问题本质: Draw Call 多 → CPU 负担重 → GPU 反而可能在“等”
ps酷教程
3 个月前
spring
·
batch
spring batch动态示例及原理
先写个100条数据 ,待会去读关键就在这里,只要stepExecution是唯一的,那么获取的stepContext就是同一个,那么如果一个step开了多线程去跑,那么肯定能保证stepExecution是同一个,那么stepContext就是所有线程所共享,那么执行step步骤的不同线程中获取的就是同一个stepContext。
ps酷教程
3 个月前
spring
·
batch
spring batch动态示例