NCNN 源码学习【一】:学习顺序

最近一段时间一直在做模型部署的工作,主要是利用NCNN部署到安卓端,跟着网上的博客和开源项目,做了很多工作,也学习到很多东西,但是对于NCNN的源码,并没有仔细的研究过,对我来说,仿佛是一个神秘的存在一样,接下来,将会对NCNN的源码进行研究,加深对于NCNN的理解。

正文

代码版本

截止到目前ncnn已经快5年了,代码也越来越庞大,很多都是一些新添加的功能支持啥的。这回读代码,我们比较关心的是ncnn整个的架构以及它代码的逻辑是怎么走的,所以这里我选用了ncnn最早的一个release的代码,这个代码的整体使用逻辑是现在的是一样,而且代码量比较少,看起来比较方便,我用的是这个:
https://github.com/Tencent/ncnn/releases/tag/20170724

【demo】

我们来看一下ncnn自带的一个经典demo:squeezenet的代码,这里我只贴出与ncnn有关的部分:

python 复制代码
// 网络加载
ncnn::Net squeezenet;
squeezenet.load_param("squeezenet_v1.1.param");
squeezenet.load_model("squeezenet_v1.1.bin");

// 数据预处理
ncnn::Mat in = ncnn::Mat::from_pixels_resize(image.data, ncnn::Mat::PIXEL_BGR, image.cols, image.rows, 227, 227);
const float mean_vals[3] = { 104.f, 117.f, 123.f };
in.substract_mean_normalize(mean_vals, 0);

// 网络推理
ncnn::Extractor ex = squeezenet.create_extractor();
ex.set_light_mode(true);
ex.input("data", in);
ncnn::Mat out;
ex.extract("prob", out);

从上面的代码可以看到,整个过程大体可以分为四个部分:

一、网络加载

  1. load_param
  2. load_model

二、数据预处理

  1. from_pixels_resize
  2. substract_mean_normalize

三、网络推理

  1. create_extractor
  2. input
  3. extract

四、每一层的推理(隐含在模型内的)

接下来的学习顺序也很简单,主要按照这四部分设计的代码,一层一层进去看,进去学习。

参考:

致谢:https://zhuanlan.zhihu.com/p/454835595

相关推荐
虎妞05002 分钟前
PyTorch 2.0 生产级部署与性能优化指南
pytorch·深度学习·ai·模型部署·cuda
小七-七牛开发者20 小时前
本地模型为什么能跑起来?从 llama.cpp 量化说起
agent·llama·模型部署·ollama·本地模型
碳基硅坊3 天前
在Mac上跑26B大模型:M4 Max + MLX量化推理实测
人工智能·模型部署·gemma-4-26b-a4b
weixin_4684668512 天前
图像分类技术落地应用与实战指南
人工智能·深度学习·ai·分类·数据挖掘·图像分类·模型部署
盼小辉丶12 天前
PyTorch深度学习实战(55)——在Android上部署PyTorch模型
android·pytorch·python·模型部署
小何code14 天前
人工智能【第46篇】AI系统的模型监控与运维:MLOps实战指南
模型部署·mlops·mlflow·机器学习运维·模型监控
追巨2 个月前
H200 安装驱动并使用sglang启动模型
ai·模型部署
Pyeako3 个月前
大模型--模型部署
人工智能·python·大模型·客户端·模型部署·服务端·路由-端口
Emmamkq~~3 个月前
麦橘超然与Midjourney对比:可控性与版权优势分析
ai绘画·模型部署·图片生成
盼小辉丶4 个月前
PyTorch实战(30)——使用TorchScript和ONNX导出通用PyTorch模型
人工智能·pytorch·深度学习·模型部署