高并发神经网络推理部署

高并发的神经网络推理框架部署

highport 是一款封装神经网络推理的高并发的软件架构,已在ESWEEK 2023年皮肤病检测比赛中获得第一名。
这里记录一下highport的软件架构和几个trick优化

软件架构图

解密模块:我们训练完的模型文件是带加密的,为了防止被其他个人盗用,加密方式采用密码与权重文件的二进制内容进行异或计算,解密出来的文件进行md5校验,如果与预测的md5校验就说明解密正确。

创建文件索引模块:把要进行推理的图片路径与文件名存入table,用数字进行索引,极大缩短读取文件的索引时间。

并发处理模块:若只有一个cpu核且执行任务过程无阻塞,那么线程的并发处理任务的效率会低于单线程处理任务效率,因为多线程需要开销任务栈、调度和锁。由于所需的硬件平台是4核cpu,所以只开创4个线程并发,这样的效率最高。

图片处理模块:加载四个模型的推理效率比加载一个模型在四个cpu并发锁保护效率高。

相关推荐
Acrelhuang2 分钟前
独立监测 + 集团管控 安科瑞连锁餐饮能源方案全链路提效-安科瑞黄安南
人工智能
laplace012313 分钟前
Clawdbot 部署到飞书(飞连)使用教程(完整版)
人工智能·笔记·agent·rag·clawdbot
是小蟹呀^14 分钟前
卷积神经网络(CNN):卷积操作
人工智能·神经网络·cnn
DN202026 分钟前
AI销售机器人:节日祝福转化率提升30倍
人工智能·python·深度学习·机器学习·机器人·节日
香芋Yu31 分钟前
【大模型教程——第二部分:Transformer架构揭秘】第2章:模型家族谱系:从编码器到解码器 (Model Architectures)
深度学习·架构·transformer
爱喝可乐的老王44 分钟前
PyTorch简介与安装
人工智能·pytorch·python
deephub1 小时前
用 PyTorch 实现 LLM-JEPA:不预测 token,预测嵌入
人工智能·pytorch·python·深度学习·大语言模型
量子-Alex1 小时前
【多模态大模型】Qwen2-VL项目代码初步解析
人工智能
飞鹰511 小时前
深度学习算子CUDA优化实战:从GEMM到Transformer—Week4学习总结
c++·人工智能·深度学习·学习·transformer