技术栈

指令优化

Black.Spider
2 个月前
开发语言·c++·性能优化·多线程编程·指令优化·编译器优化·缓存命中率
C++性能优化常用技巧如果仅仅只需要使用到快速查找的特性,那么unordered_map更加合适,他的复杂度是O(1)。如果还需要排序以及范围查找的能力,那么就选择map。
Briwisdom
1 年前
人工智能·tvm·算子·ai编译器·指令优化
AI编译器的后端优化策略工作领域是AI芯片工具链相关,很多相关知识的概念都是跟着项目成长建立起来,但是比较整个技术体系在脑海中都不太系统,比如项目参与中涉及到了很多AI编译器开发相关内容,东西比较零碎,工作中也没有太多时间去做复盘与查漏补缺。但是最近比较闲,发现了一个宝藏级的B站博主,系统的讲了很多AI芯片领域的知识,并把课程资源开源维护,极力推荐大家多多关注。在这里当个搬运工,传播一下。