技术栈
infinitensor
Shining0596
9 天前
人工智能
·
架构
·
大模型
·
mlir
·
infinitensor
·
hivm
·
前沿模型
前沿模型系列(五)《多模态智能及其应用》
目录Nano Banana Pro 技术原生多模态模型与长上下文思考数据生产与评估反馈开源多模态生成模型的挑战
Shining0596
10 天前
人工智能
·
深度学习
·
学习
·
其他
·
架构
·
ai编译器
·
infinitensor
AI 编译器系列(五)《拓展 Triton 深度学习编译器——DLCompiler》
目录算子开发现状DSA架构特性开发门槛高生态碎片化DLCompiler 整体架构和解决方案整体架构和流程
Shining0596
10 天前
人工智能
·
算法
·
stable diffusion
·
大模型
·
图像生成
·
ai编译器
·
infinitensor
AI 编译器系列(六)《Stable Diffusion 在 InfiniTensor 推理框架中的适配与工程实践》
目录Stable Diffusion 介绍Stable Diffusion 概述扩散模型概念Stable Diffusion 架构
Shining0596
12 天前
人工智能
·
架构
·
mlir
·
infinitensor
·
hivm
·
ascendnpu ir
AI 编译器系列(七)《(MLIR)AscendNPU IR 编译堆栈》
目录AscendNPU IR 架构概述Triton-Ascend + AscendNPU IRMLIR 简介:
Shining0596
15 天前
人工智能
·
学习
·
其他
·
ai
·
架构
·
大模型
·
infinitensor
前沿模型系列(四)《大模型前沿架构》
目录通用智能时代的三大支柱架构统一学习方法统一通用模型能力大模型结构高效混合专家(MoE)架构1. 核心思想
Shining0596
17 天前
人工智能
·
学习
·
其他
·
学习方法
·
infinitensor
CUDA 编程系列(三)《内存模型与规约优化》
目录性能瓶颈分析与优化方法论1.瓶颈分析基础与 Roofline 模型2.性能优化方法论向量化与低精度优化
Shining0596
17 天前
人工智能
·
学习
·
其他
·
学习方法
·
infinitensor
AI编译器系列(二)《AI 编译器中的前端优化》
目录常用前端优化技术1. 图层优化概述2. 结构冗余与解决方法3. 读写冗余与解决方法4. 具体优化技术
Shining0596
18 天前
人工智能
·
pytorch
·
python
·
深度学习
·
学习
·
机器学习
·
infinitensor
AI 编译器系列(三)《PyTorch 中图优化》
目录PyTorch 基础介绍动态计算图的优势与劣势PyTorch 中的图优化1. TorchScript
Shining0596
18 天前
人工智能
·
rnn
·
深度学习
·
学习
·
其他
·
大模型
·
infinitensor
推理引擎方向(二)《大模型原理与结构》
目录人工神经网络基础1. 向量到向量(Vector to Vector)任务2. 序列到序列(Sequence to Sequence)任务
Shining0596
20 天前
人工智能
·
学习
·
其他
·
性能优化
·
infinitensor
前沿模型系列(二)《科学多模态大模型》
目录为什么需要专门的科学基座大模型?1. 能力坐标系的困境2. Intern S1的目标定位科学多模态架构:专为科研场景设计
Shining0596
20 天前
开发语言
·
人工智能
·
python
·
学习
·
其他
·
infinitensor
Triton & 九齿系列《Triton 练气术》
目录什么是 Triton?为什么需要 Triton?Triton 编程基础Triton 简介:核心 API 介绍:
Shining0596
21 天前
学习
·
其他
·
学习方法
·
infinitensor
前沿模型系列(一)《大模型学习方法》
目录AI发展的三个阶段1. 符号智能时代(1950s-1980s)2. 专用智能时代(1990s-2010s)
Shining0596
21 天前
人工智能
·
学习
·
其他
·
性能优化
·
infinitensor
CPU 并行编程系列《CPU 性能优化导论》
目录为什么需要 CPU 推理?1. 硬件资源限制2. 应用场景需求CPU 性能瓶颈:计算密集 vs I/O密集
我是有底线的