技术栈
指令优化
Black.Spider
1 个月前
开发语言
·
c++
·
性能优化
·
多线程编程
·
指令优化
·
编译器优化
·
缓存命中率
C++性能优化常用技巧
如果仅仅只需要使用到快速查找的特性,那么unordered_map更加合适,他的复杂度是O(1)。如果还需要排序以及范围查找的能力,那么就选择map。
Briwisdom
1 年前
人工智能
·
tvm
·
算子
·
ai编译器
·
指令优化
AI编译器的后端优化策略
工作领域是AI芯片工具链相关,很多相关知识的概念都是跟着项目成长建立起来,但是比较整个技术体系在脑海中都不太系统,比如项目参与中涉及到了很多AI编译器开发相关内容,东西比较零碎,工作中也没有太多时间去做复盘与查漏补缺。但是最近比较闲,发现了一个宝藏级的B站博主,系统的讲了很多AI芯片领域的知识,并把课程资源开源维护,极力推荐大家多多关注。在这里当个搬运工,传播一下。