技术栈
性能优化
SilentSamsara
7 小时前
开发语言
·
python
·
青少年编程
·
性能优化
Python 性能优化:tracemalloc、profiling 与 C 扩展加速
“Python 太慢了”——这句话对了一半。纯 Python 的 CPU 密集型计算确实慢,但性能优化从来不是从重写 C 开始,而是从找到瓶颈开始。
筠筠喵呜喵
7 小时前
linux
·
服务器
·
性能优化
Linux CPU性能优化:D状态和Z状态排查与处理
在 Linux 系统中,常用的五大基本状态(通过 ps、top 等命令可查看)分别是:含义: 进程当前正在运行(占用 CPU)或者处于可运行队列中、只要获得 CPU 时间片就能立刻执行。 特点: 包括正在 CPU 上执行的进程,以及就绪等待调度的进程。 这是进程争取 CPU 时的活跃状态。 示例: 一个不停计算的 while(1) 程序通常处于 R 状态;在多核系统上,多个 R 状态进程可能同时运行。
huangdong_
11 小时前
性能优化
图片下载工具性能优化:并发控制与内存管理
电商图片下载工具需要处理大量图片下载任务。如何在高负载下保持稳定,同时控制资源占用?本文从技术角度分享性能优化策略。
松☆
14 小时前
性能优化
昇腾NPU上的Vector算子模板库,性能优化案例实录
要在昇腾NPU上做Vector算子性能优化,但不知道从哪入手?自己手写Vector算子太慢,用现成的模板库又怕性能不够?atvc(Ascend Vector Template C++ Library)就是为这个场景准备的。
松☆
18 小时前
华为
·
性能优化
·
numpy
·
信号处理
·
harmonyos
Triton推理服务接昇腾NPU,GE后端怎么搭?
NVIDIA的Triton Inference Server是推理服务的事实标准——做模型服务化、多模型调度、动态batching,用Triton准没错。但Triton原生只支持NVIDIA GPU(CUDA),昇腾NPU想接入Triton生态,中间需要一个"翻译层"。
MU在掘金91695
18 小时前
性能优化
Block Events数据覆盖:一个静默Bug的排查过程
SmartInspector 有两条卡顿检测的数据通道:两条通道各有优势。SQL 通道有精确的 ts_ns 时间戳,但 atrace 有 127 字符截断限制,长类名会被截断。WS 通道有完整的调用栈,但没有 Perfetto 的时间戳。
TYKJ023
18 小时前
后端
·
性能优化
·
图片资源
CDN加速的原理,远不止缓存这么简单
摘要:大部分人对CDN的理解停留在"把静态资源搬到离用户近的地方"。但CDN的加速手段不止缓存——DNS调度、协议优化、TCP优化、动态加速、边缘计算,每一层都在提速。本文从一个"上了CDN还是慢"的案例出发,逐层拆开CDN的加速原理。
山峰哥
19 小时前
大数据
·
数据库
·
sql
·
性能优化
·
深度优先
·
宽度优先
从Explain到SQL优化:一次生产环境慢查询的完整调优复盘
线上接口突然变慢,用户投诉如潮水般涌来,DBA紧急排查发现竟然是一条"看起来没问题"的SQL在搞鬼——这种场景你一定不陌生。本文将用一个真实的生产案例,带你从头到尾走一遍SQL优化的全流程,从Explain分析到索引重构,每一步都踩在实战的点子上。
三无推导
19 小时前
人工智能
·
python
·
docker
·
性能优化
·
开源
·
github
《OpenHands 安装部署教程:用 Docker 在本地快速跑通开源 AI 编码助手》
OpenHands 这类项目,第一眼看上去都像“下一代开发神器”,第二眼就容易掉进环境、权限、端口和 API Key 的坑里。 这篇文章不聊概念泡沫,直接走普通开发者最容易复现的路线:用 Docker 在本地启动 OpenHands,配置模型,打开 Web 页面,并完成第一个最小可用任务验证。
海南java第二人
19 小时前
clickhouse
·
性能优化
ClickHouse 性能优化完全指南:从数据模型到生产调优
作为一款为在线分析处理(OLAP) 而生的列式数据库,ClickHouse 的性能优势众所周知。但“快”不是自动获得的——合理的表结构设计、科学的索引与分区策略、以及对集群资源的精细调优,才是将硬件潜力转化为极致查询性能的关键。本文将从数据模型、查询编写、集群调优三个维度,系统性地梳理 ClickHouse 性能优化的核心方法与实战经验。
爱和冰阔落
20 小时前
linux
·
算法
·
性能优化
Linux 性能优化基石:全景拆解 PRI/NI 优先级算力争夺与 O(1) 调度算法精髓
🔥个人主页:爱和冰阔乐 📚专栏传送门:《数据结构与算法》 、【C++】 、【Linux】 🐶学习方向:C++方向学习爱好者 ⭐人生格言:得知坦然 ,失之淡然
鸽芷咕
20 小时前
数据库
·
oracle
·
性能优化
KingbaseES系统视图与Hints调优:从诊断到性能优化的进阶之路
数据库慢了,日志里翻不出原因,应用层看不出来毛病,但就是慢。这种情况太多了。问题可能藏在锁等待里,可能是统计信息太久没更新导致执行计划走偏,也可能就是一个该加的索引一直没人加。这篇文章的思路很简单:用系统视图把问题翻出来,用EXPLAIN看明白执行计划,再用Hints在关键位置做调整。三步走,不绕弯。
L、218
1 天前
深度学习
·
性能优化
·
transformer
CANN ops-transformer 仓库详解:Transformer 算子的底层实现与性能优化
前面写了 40 多篇,提到 Transformer 的地方不少,但还没系统讲过 CANN 里专门为 Transformer 优化的算子库——ops-transformer。这个仓库里藏着大模型在昇腾 NPU 上跑得快的真正秘密:Flash Attention、Rotary Embedding、RMSNorm、SwiGLU,这些都是大模型的"基础设施算子"。
qq_28372005
2 天前
数据库
·
性能优化
万字深度:Chroma 向量数据库全解析 — 核心原理、实战操作、性能优化与工程最佳实践
在大模型与检索增强生成(RAG)全面普及的今天,向量数据库已成为 AI 应用不可或缺的底层基础设施。传统关系型数据库擅长结构化数据与精确匹配,难以高效处理文本、图像、音频等高维向量的语义相似性检索;而专门面向向量存储与近似最近邻搜索(ANN)的向量数据库,能在毫秒级返回与查询语义最相关的结果,支撑智能问答、文档检索、推荐系统、多模态交互等核心场景。
心中有国也有家
2 天前
人工智能
·
分布式
·
算法
·
性能优化
·
架构
·
paddlepaddle
PaddlePaddle 适配 NPU 的技术全解析——从算子接入到端到端性能优化
PaddlePaddle(飞桨)是百度开源的深度学习框架,它怎么在华为 NPU 上跑起来?核心是通过 Paddle 的自定义算子机制接入 CANN 算子库,并通过通信后端抽象支持 HCCL 和 hixl。这篇文章把这套适配技术拆开讲清楚。
50084
2 天前
java
·
flutter
·
性能优化
·
electron
·
wpf
HCCL 集合通信编程:多卡协同的正确姿势
多卡训练和推理,核心是卡间通信。HCCL(Huawei Collective Communication Library)是昇腾的集合通信库,API 和 NCCL 兼容,但底层实现针对 HCCS 和 RoCE 做了优化。
50084
2 天前
人工智能
·
深度学习
·
机器学习
·
性能优化
·
wpf
用 Ascend CL 从零写一个推理程序
前言用 PyTorch 推理很简单,但生产环境里经常需要更底层的控制——比如 C++ 服务、嵌入式设备、或者极致的性能优化。这时候就要用 Ascend CL(Compute Language)直接调用 NPU。
步步为营DotNet
2 天前
性能优化
·
c#
·
.net
探秘.NET 11:C# 14 特性在后端性能优化中的深度应用
在后端开发领域,性能优化始终是提升应用竞争力的关键因素。随着.NET 11 的发布,C# 14 带来了一系列新特性,为后端性能优化开辟了新途径。这些特性不仅改进了代码结构,还在运行时性能上有显著提升。本文将深入剖析 C# 14 新特性在后端性能优化中的原理,通过实际代码演示其应用,对比优化前后的性能差异,并分享生产级的避坑经验。