技术栈
cpu
lkbhua莱克瓦24
5 天前
计算机
·
cpu
·
oc
·
ir
·
id
CPU三大核心部件功能详解
首先,想象一下CPU是一个高度自动化、极其高效的“工厂”,它的任务就是不停地执行“指令”(即程序)。而IR、ID和OC就是这个工厂流水线上的三个关键工位,共同负责理解并执行每一条指令。
lkbhua莱克瓦24
5 天前
计算机
·
cpu
CPU中核心参数的通俗介绍
让我们用一个 “厨房团队” 的比喻,来科普这些听起来很复杂的CPU参数。想象一下,CPU就是你家的厨房,它的任务就是处理各种食材(数据),做出饭菜(计算结果)。
lkbhua莱克瓦24
6 天前
计算机
·
智能手机
·
cpu
·
oc
·
ir
·
id
手机选购关注的参数-CPU篇
“手机卡顿?不是网不好,是你的CPU在‘罢工’!” 作为一个天天被朋友问“为什么我手机比你卡”的数码老司机,今天我要用咖啡馆聊天的语气,扒开CPU的神秘面纱——别再被参数忽悠了!
HyperAI超神经
6 天前
人工智能
·
深度学习
·
学习
·
机器学习
·
cpu
·
gpu
【TVM教程】TVM 运行时系统
TVM 现已更新到 0.21.0 版本,TVM 中文文档已经和新版本对齐。Apache TVM 是一个深度的深度学习编译框架,适用于 CPU、GPU 和各种机器学习加速芯片。更多 TVM 中文文档可访问 →Apache TVM
lkbhua莱克瓦24
6 天前
计算机
·
cpu
CPU的架构与技术和实际性能指标
你可以把CPU的架构想象成一家餐厅的整体运营模式和组织架构。科普解释: CPU的架构(比如ARM、x86)就像是餐厅的核心菜系和经营理念。
hgz0710
7 天前
cpu
·
性能监控
性能监控(操作系统层面-CPU)
必须做监控:做性能测试必须监控,否则不知道问题出在哪里监控是性能测试的核心环节操作系统维度:所有系统都必须监控(通用)
HyperAI超神经
10 天前
人工智能
·
深度学习
·
学习
·
机器学习
·
ai
·
cpu
·
gpu
在线教程丨 David Baker 团队开源 RFdiffusion3,实现全原子蛋白质设计的生成式突破
近年来,利用生成式深度学习方法在新功能蛋白质设计方面取得了显著进展。目前包括 RFdiffusion(RFD1)和 BindCraft 在内的大多数方法,均采用氨基酸残基水平的蛋白质表示,已能够成功设计蛋白质单体、组装体以及蛋白质-蛋白质相互作用体系,但其分辨率仍不足以精确设计与非蛋白质组分(如小分子配体与核酸)发生特异性侧链相互作用的结构。
高新打工人
11 天前
缓存
·
cpu
·
dtlb
关于CPU的介绍(二)----DTLB(数据转址旁路缓存)
DTLB(Data Translation Lookaside Buffer,数据转换后备缓冲器)是 CPU 中用于加速数据访问时虚拟地址(VA)到物理地址(PA)转换的高速缓存,是内存管理单元(MMU)的关键组件。以下从核心作用、工作原理、结构特点、与 ITLB 的区别等方面展开详细解析:
Shi_Lei
11 天前
架构
·
cpu
RISC-V的中断委托机制和场景
默认情况下,所有特权级的中断和异常都会被发送给机器模式(Machine Mode, 以下简称M态),然后运行在M态的软件再根据中断/异常的目标特权级,转发给较低特权级去处理,转发手段通常是中断/异常注入(例如设置sip来注入S态中断)。但是这样的效率很低,所以RISC-V引入了委托机制,在硬件层面设置mideleg/medeleg,绕过M态,直接把低特权级的中断/异常路由给目标特权级处理。以下通过具体的场景来说明。
HyperAI超神经
12 天前
人工智能
·
深度学习
·
学习
·
cpu
·
gpu
·
编程语言
·
vllm
【vLLM 学习】Reproduciblity
vLLM 是一款专为大语言模型推理加速而设计的框架,实现了 KV 缓存内存几乎零浪费,解决了内存管理瓶颈问题。
TracyCoder123
14 天前
cpu
·
gpu
·
显存
算力的灵魂:GPU与显存
要理解 CPU 和 GPU 的区别,我们先抛开复杂的电路图,用一个经典的 “算力剧场” 来打比方。让我们深入芯片内部,看看它们的“大脑构造”有何不同。
LucianaiB
14 天前
cpu
·
llama
·
昇腾
昇腾NPU实战:Llama-2-7B大模型的部署全流程与性能深度分析
人们眼中的天才之所以卓越非凡,并非天资超人一等而是付出了持续不断的努力。1万小时的锤炼是任何人从平凡变成超凡的必要条件。———— 马尔科姆·格拉德威尔
HyperAI超神经
16 天前
人工智能
·
深度学习
·
学习
·
cpu
·
gpu
·
编程语言
·
vllm
【vLLM 学习】Profiling
vLLM 是一款专为大语言模型推理加速而设计的框架,实现了 KV 缓存内存几乎零浪费,解决了内存管理瓶颈问题。
Snail_20251214
17 天前
架构
·
cpu
·
dcu
·
海光
海光DCU节点架构
常见的异构计算节点体系结构主要由四个部分组成:主存、多核处理器、I/O Hub和DCU加速器,下图描述了这种体系结构互连关系。主存(System Memory)与多核处理器之间通过Memory Bus互连,常用的物理接口有SIMM、DIMM、RIMM等。多核处理器借助I/O Hub链接多种外部设备,I/O Hub通过PCI-E总线链接,以树状结构链接各种功能设备,在异构计算节点中,主要的设备就是DCU加速器,由于处理器直接支持的PCI-E链路有最大数量限制,因此在I/O Hub与DCU加速器之间还会增加P
小马爱打代码
18 天前
jvm
·
cpu
·
排查故障
实战:CPU被打满100%,如何处理
CPU 飙升是一个常见的问题。在生产环境中,会出现由代码问题导致CPU占用很高,该如何诊断出是哪行java代码导致? 是大家的一项重要基本功,也是大家面试中的家常骗饭。
mu_guang_
20 天前
算法
·
cpu
·
计算机体系结构
算法图解1-算法简介
算法是一组完成任务的指令,任何代码片段都可视为算法。二分查找是一种算法,其输入是一个有序的元素列表。如果要查找的元素包含在列表中,二分查找返回其位置;否则返回null。
HyperAI超神经
22 天前
人工智能
·
深度学习
·
学习
·
大语言模型
·
cpu
·
gpu
·
vllm
【vLLM 学习】Prefix Caching
vLLM 是一款专为大语言模型推理加速而设计的框架,实现了 KV 缓存内存几乎零浪费,解决了内存管理瓶颈问题。
才鲸嵌入式
22 天前
c语言
·
单片机
·
嵌入式
·
arm
·
cpu
·
verilog
·
fpga
香山CPU(国产开源)的 SoC SDK底层程序编写,以及其它开源SoC芯片介绍
目的是用C语言在以香山开源CPU核为基础的开源SoC芯片的硬件平台上,编写完整的裸机SDK、RTOS驱动、Linux驱动。限于当前香山CPU还没有完整的开源SoC,没有外设模块,前期会借鉴蜂鸟E203、玄铁CH2601、OpenTitan、SiFive Freedom E310等带外设的开源SoC的模块寄存器来编写程序。因为没有香山CPU的开发板,程序都会运行在NEMU或QEMU模拟器上。
HyperAI超神经
23 天前
人工智能
·
学习
·
大语言模型
·
cpu
·
gpu
·
编程语言
·
triton
【Triton 教程】triton_language.load
Triton 是一种用于并行编程的语言和编译器。它旨在提供一个基于 Python 的编程环境,以高效编写自定义 DNN 计算内核,并能够在现代 GPU 硬件上以最大吞吐量运行。