高并发神经网络推理部署

高并发的神经网络推理框架部署

highport 是一款封装神经网络推理的高并发的软件架构,已在ESWEEK 2023年皮肤病检测比赛中获得第一名。
这里记录一下highport的软件架构和几个trick优化

软件架构图

解密模块:我们训练完的模型文件是带加密的,为了防止被其他个人盗用,加密方式采用密码与权重文件的二进制内容进行异或计算,解密出来的文件进行md5校验,如果与预测的md5校验就说明解密正确。

创建文件索引模块:把要进行推理的图片路径与文件名存入table,用数字进行索引,极大缩短读取文件的索引时间。

并发处理模块:若只有一个cpu核且执行任务过程无阻塞,那么线程的并发处理任务的效率会低于单线程处理任务效率,因为多线程需要开销任务栈、调度和锁。由于所需的硬件平台是4核cpu,所以只开创4个线程并发,这样的效率最高。

图片处理模块:加载四个模型的推理效率比加载一个模型在四个cpu并发锁保护效率高。

相关推荐
wenzhangli713 小时前
从零开始的 SPAC 编程构建 BPM 设计器实战
人工智能
踩着两条虫13 小时前
效率翻倍!AI智能体深度解析:自然语言 → DSL → Vue组件
前端·人工智能·低代码
小江的记录本13 小时前
【Transformer架构】Transformer架构核心知识体系(包括自注意力机制、多头注意力、Encoder-Decoder结构)
java·人工智能·后端·python·深度学习·架构·transformer
AI先驱体验官13 小时前
债小白分析:债务优化服务的新变量、AI能否带来行业升级
大数据·人工智能·深度学习·重构·aigc
青苔猿猿13 小时前
OpenWebUI(20)源码学习-版本升级
人工智能·学习·ai·openwebui
黑金IT13 小时前
当博弈论遇见AI开发,研发即博弈,对抗即进化
人工智能·自动化
ai生成式引擎优化技术13 小时前
服装店AI生成式引擎优化(GEO)方案
人工智能
mseaspring13 小时前
离线语音识别 Vosk 入门指南:开源、轻量、告别网络依赖
人工智能·语音识别
LeeeX!13 小时前
Openclaw接入飞书,指导AI在飞书群里干活
人工智能·飞书·openclaw
端侧AI老谢13 小时前
端侧AI 模型部署实战五(Android大模型加载)
人工智能