性能优化

SilentSamsara7 小时前
开发语言·python·青少年编程·性能优化
Python 性能优化:tracemalloc、profiling 与 C 扩展加速“Python 太慢了”——这句话对了一半。纯 Python 的 CPU 密集型计算确实慢,但性能优化从来不是从重写 C 开始,而是从找到瓶颈开始。
筠筠喵呜喵7 小时前
linux·服务器·性能优化
Linux CPU性能优化:D状态和Z状态排查与处理在 Linux 系统中,常用的五大基本状态(通过 ps、top 等命令可查看)分别是:含义: 进程当前正在运行(占用 CPU)或者处于可运行队列中、只要获得 CPU 时间片就能立刻执行。 特点: 包括正在 CPU 上执行的进程,以及就绪等待调度的进程。 这是进程争取 CPU 时的活跃状态。 示例: 一个不停计算的 while(1) 程序通常处于 R 状态;在多核系统上,多个 R 状态进程可能同时运行。
huangdong_11 小时前
性能优化
图片下载工具性能优化:并发控制与内存管理电商图片下载工具需要处理大量图片下载任务。如何在高负载下保持稳定,同时控制资源占用?本文从技术角度分享性能优化策略。
松☆14 小时前
性能优化
昇腾NPU上的Vector算子模板库,性能优化案例实录要在昇腾NPU上做Vector算子性能优化,但不知道从哪入手?自己手写Vector算子太慢,用现成的模板库又怕性能不够?atvc(Ascend Vector Template C++ Library)就是为这个场景准备的。
松☆18 小时前
华为·性能优化·numpy·信号处理·harmonyos
Triton推理服务接昇腾NPU,GE后端怎么搭?NVIDIA的Triton Inference Server是推理服务的事实标准——做模型服务化、多模型调度、动态batching,用Triton准没错。但Triton原生只支持NVIDIA GPU(CUDA),昇腾NPU想接入Triton生态,中间需要一个"翻译层"。
MU在掘金9169518 小时前
性能优化
Block Events数据覆盖:一个静默Bug的排查过程SmartInspector 有两条卡顿检测的数据通道:两条通道各有优势。SQL 通道有精确的 ts_ns 时间戳,但 atrace 有 127 字符截断限制,长类名会被截断。WS 通道有完整的调用栈,但没有 Perfetto 的时间戳。
TYKJ02318 小时前
后端·性能优化·图片资源
CDN加速的原理,远不止缓存这么简单摘要:大部分人对CDN的理解停留在"把静态资源搬到离用户近的地方"。但CDN的加速手段不止缓存——DNS调度、协议优化、TCP优化、动态加速、边缘计算,每一层都在提速。本文从一个"上了CDN还是慢"的案例出发,逐层拆开CDN的加速原理。
山峰哥19 小时前
大数据·数据库·sql·性能优化·深度优先·宽度优先
从Explain到SQL优化:一次生产环境慢查询的完整调优复盘线上接口突然变慢,用户投诉如潮水般涌来,DBA紧急排查发现竟然是一条"看起来没问题"的SQL在搞鬼——这种场景你一定不陌生。本文将用一个真实的生产案例,带你从头到尾走一遍SQL优化的全流程,从Explain分析到索引重构,每一步都踩在实战的点子上。
三无推导19 小时前
人工智能·python·docker·性能优化·开源·github
《OpenHands 安装部署教程:用 Docker 在本地快速跑通开源 AI 编码助手》OpenHands 这类项目,第一眼看上去都像“下一代开发神器”,第二眼就容易掉进环境、权限、端口和 API Key 的坑里。 这篇文章不聊概念泡沫,直接走普通开发者最容易复现的路线:用 Docker 在本地启动 OpenHands,配置模型,打开 Web 页面,并完成第一个最小可用任务验证。
海南java第二人19 小时前
clickhouse·性能优化
ClickHouse 性能优化完全指南:从数据模型到生产调优作为一款为在线分析处理(OLAP) 而生的列式数据库,ClickHouse 的性能优势众所周知。但“快”不是自动获得的——合理的表结构设计、科学的索引与分区策略、以及对集群资源的精细调优,才是将硬件潜力转化为极致查询性能的关键。本文将从数据模型、查询编写、集群调优三个维度,系统性地梳理 ClickHouse 性能优化的核心方法与实战经验。
爱和冰阔落20 小时前
linux·算法·性能优化
Linux 性能优化基石:全景拆解 PRI/NI 优先级算力争夺与 O(1) 调度算法精髓🔥个人主页:爱和冰阔乐 📚专栏传送门:《数据结构与算法》 、【C++】 、【Linux】 🐶学习方向:C++方向学习爱好者 ⭐人生格言:得知坦然 ,失之淡然
鸽芷咕20 小时前
数据库·oracle·性能优化
KingbaseES系统视图与Hints调优:从诊断到性能优化的进阶之路数据库慢了,日志里翻不出原因,应用层看不出来毛病,但就是慢。这种情况太多了。问题可能藏在锁等待里,可能是统计信息太久没更新导致执行计划走偏,也可能就是一个该加的索引一直没人加。这篇文章的思路很简单:用系统视图把问题翻出来,用EXPLAIN看明白执行计划,再用Hints在关键位置做调整。三步走,不绕弯。
L、2181 天前
深度学习·性能优化·transformer
CANN ops-transformer 仓库详解:Transformer 算子的底层实现与性能优化前面写了 40 多篇,提到 Transformer 的地方不少,但还没系统讲过 CANN 里专门为 Transformer 优化的算子库——ops-transformer。这个仓库里藏着大模型在昇腾 NPU 上跑得快的真正秘密:Flash Attention、Rotary Embedding、RMSNorm、SwiGLU,这些都是大模型的"基础设施算子"。
qq_283720052 天前
数据库·性能优化
万字深度:Chroma 向量数据库全解析 — 核心原理、实战操作、性能优化与工程最佳实践在大模型与检索增强生成(RAG)全面普及的今天,向量数据库已成为 AI 应用不可或缺的底层基础设施。传统关系型数据库擅长结构化数据与精确匹配,难以高效处理文本、图像、音频等高维向量的语义相似性检索;而专门面向向量存储与近似最近邻搜索(ANN)的向量数据库,能在毫秒级返回与查询语义最相关的结果,支撑智能问答、文档检索、推荐系统、多模态交互等核心场景。
心中有国也有家2 天前
人工智能·分布式·算法·性能优化·架构·paddlepaddle
PaddlePaddle 适配 NPU 的技术全解析——从算子接入到端到端性能优化PaddlePaddle(飞桨)是百度开源的深度学习框架,它怎么在华为 NPU 上跑起来?核心是通过 Paddle 的自定义算子机制接入 CANN 算子库,并通过通信后端抽象支持 HCCL 和 hixl。这篇文章把这套适配技术拆开讲清楚。
500842 天前
java·flutter·性能优化·electron·wpf
HCCL 集合通信编程:多卡协同的正确姿势多卡训练和推理,核心是卡间通信。HCCL(Huawei Collective Communication Library)是昇腾的集合通信库,API 和 NCCL 兼容,但底层实现针对 HCCS 和 RoCE 做了优化。
500842 天前
人工智能·深度学习·机器学习·性能优化·wpf
用 Ascend CL 从零写一个推理程序前言用 PyTorch 推理很简单,但生产环境里经常需要更底层的控制——比如 C++ 服务、嵌入式设备、或者极致的性能优化。这时候就要用 Ascend CL(Compute Language)直接调用 NPU。
步步为营DotNet2 天前
性能优化·c#·.net
探秘.NET 11:C# 14 特性在后端性能优化中的深度应用在后端开发领域,性能优化始终是提升应用竞争力的关键因素。随着.NET 11 的发布,C# 14 带来了一系列新特性,为后端性能优化开辟了新途径。这些特性不仅改进了代码结构,还在运行时性能上有显著提升。本文将深入剖析 C# 14 新特性在后端性能优化中的原理,通过实际代码演示其应用,对比优化前后的性能差异,并分享生产级的避坑经验。