模型部署

碳基硅坊2 天前
人工智能·模型部署·gemma-4-26b-a4b
在Mac上跑26B大模型:M4 Max + MLX量化推理实测今天我们来聊聊在Mac Studio M4 Max(32核GPU)上,使用oMLX平台部署gemma-4-26B-A4B-it-QAT-MLX-4bit模型的真实性能表现。
weixin_4684668511 天前
人工智能·深度学习·ai·分类·数据挖掘·图像分类·模型部署
图像分类技术落地应用与实战指南在电商大促期间,面对海量新增 SKU,运营团队往往需要耗费数天时间手动分类商品属性并上架,不仅效率低下,还容易出现归类错误导致流量流失。而在医疗领域,放射科医生每天要审阅成百上千张影像片子,长时间的高强度工作难免产生视觉疲劳,细微的病灶极易被漏诊。这些看似截然不同的行业痛点,背后其实都指向同一个技术突破口:利用计算机视觉与深度学习技术,让机器具备“看”和“判断”的能力。
盼小辉丶11 天前
android·pytorch·python·模型部署
PyTorch深度学习实战(55)——在Android上部署PyTorch模型我们已经学习了如何将 PyTorch 模型作为生产系统服务进行部署。虽然将机器学习 (Machine Learning, ML) 模型部署为云端服务仍是最主流的 ML 部署方式,但在以下场景中,我们需要将模型部署到移动设备:
小何code13 天前
模型部署·mlops·mlflow·机器学习运维·模型监控
人工智能【第46篇】AI系统的模型监控与运维:MLOps实战指南作者的话:训练出一个性能优秀的AI模型只是第一步,如何将其稳定、高效地部署到生产环境,并持续监控和运维才是真正的挑战。MLOps借鉴DevOps理念,为机器学习系统全生命周期管理提供系统化方法论和工具链。
追巨2 个月前
ai·模型部署
H200 安装驱动并使用sglang启动模型机器信息 系统:rocklinux 9.4 架构:x86 前置操作:关闭防火墙和selinux如果没有互联网环境,可以使用iso文件搭建本地镜像仓库,这两个包的版本一定要和当前系统的内核版本一致
Pyeako3 个月前
人工智能·python·大模型·客户端·模型部署·服务端·路由-端口
大模型--模型部署模型部署(Model Deployment)是指将训练好的机器学习模型集成到实际的生产环境或应用系统中,使其能够接收输入数据(例如图片、文本、数值等),并实时或批量地输出预测结果,从而为最终用户或其他服务提供智能能力。
Emmamkq~~3 个月前
ai绘画·模型部署·图片生成
麦橘超然与Midjourney对比:可控性与版权优势分析你是否曾为一张AI生成图支付高昂订阅费,却无法完全掌控输出内容?或者担心商业使用时陷入版权纠纷?今天我们要聊的“麦橘超然”(MajicFLUX),正是一款试图打破这些限制的离线图像生成工具。
盼小辉丶3 个月前
人工智能·pytorch·深度学习·模型部署
PyTorch实战(30)——使用TorchScript和ONNX导出通用PyTorch模型我们已经深入探讨了 PyTorch 模型部署,这可能是将 PyTorch 模型投入生产系统中最关键的一环。在本节中,我们将聚焦另一个重要维度:模型导出。我们已经学习了如何在经典的 Python 脚本环境中保存和加载 PyTorch 模型。但是我们还需要更多的方式来导出 PyTorch 模型,主要是出于以下考虑:
盼小辉丶4 个月前
深度学习·transformer·模型部署
Transformer实战(36)——Transformer模型部署我们已经学习了如何从零开始训练和使用 Transformer 模型,还掌握了如何针对多种任务进行微调。但我们尚未学习如何在实际生产环境中部署这些模型。本节将介绍如何在生产环境中部署基于 Transformer 的自然语言处理 (Natural Language Processing, NLP) 解决方案。我们将介绍 TensorFlow Extended (TFX) 作为机器学习部署的解决方案。此外,还会讲解如何通过 FastAPI 等工具将 Transformer 模型作为 API 提供服务。还将了解
长路 ㅤ   4 个月前
模型部署·vllm·xinference·推理引擎·ai框架
快速了解VLLM推理引擎博主介绍:✌目前全网粉丝4W+,csdn博客专家、Java领域优质创作者,博客之星、阿里云平台优质作者、专注于Java后端技术领域。
盼小辉丶4 个月前
人工智能·pytorch·深度学习·模型部署
PyTorch实战(29)——使用TorchServe部署PyTorch模型在 PyTorch 深度学习模型部署一节,我们学习了如何使用 Flask 库创建可远程部署、通过网络提供预测服务的模型服务器。在本节中,我们将继续讨论使用 TorchServe 将一个已经训练并测试过的 PyTorch 深度学习模型对象部署到一个独立的环境中,使其能够对新输入数据进行预测或推理。这也称为模型的生产化,即将模型部署到生产系统中。
星野云联AIoT技术洞察4 个月前
深度学习·esp32·模型部署·aiot·esp-idf·ota升级·固件开发
ESP32 Edge AI 架构设计:固件、OTA 与端侧推理的完整实践在传统的 IoT 架构中,传感器数据通常被透传至云端进行处理。然而,随着带宽成本的提升、隐私需求的加剧以及实时性要求的演进,边缘 AI(Edge AI) 已成为工业与智能家居领域的必然选择。
盼小辉丶4 个月前
人工智能·pytorch·深度学习·模型部署
PyTorch实战(28)——PyTorch深度学习模型部署我们已系统性地探讨了如何使用 PyTorch 训练和测试各类机器学习模型。我们从 PyTorch 的基础组件入手,掌握了高效完成深度学习任务的必备工具;随后深入研究了基于 PyTorch 实现的多种深度学习模型架构及其应用场景。在本节中,我们将重点讨论如何将这些模型投入生产环境。简单来说,就是讨论将一个已经训练并测试过的模型对象部署到一个独立的环境中,使其能够对新输入数据进行预测或推理。这称为模型的生产化,即将模型部署到生产系统中。 本节我们将首先构建一个简易的 PyTorch 推理管道:通过输入数据和预
就这个丶调调5 个月前
深度学习·模型部署·vllm·参数配置
VLLM部署全部参数详解及其作用说明VLLM(Very Large Language Model)是近年来在大语言模型部署领域备受关注的技术之一。它通过高效的内存管理和推理优化,显著提升了大规模语言模型的部署效率和性能。本文将详细介绍VLLM部署时涉及的所有参数,并解释每个参数的作用,帮助开发者更好地理解与配置。
头发够用的程序员5 个月前
人工智能·pytorch·python·深度学习·yolo·边缘计算·模型部署
Ultralytics 代码库深度解读【六】:数据加载机制深度解析从整个计算机视觉任务的流程分类来说,本篇属于训练部分,准确说是训练的前置工作。正文开始之前,有2点需要说明:
杰瑞哥哥5 个月前
python·信息可视化·web·模型部署
快速搭建Web前端(streamlit使用指南)Streamlit 是一个用于快速搭建Web应用的Python 框架,语法简单,内置多种数据可视化组件,几行代码就可以实现美观的web界面,可以用于交互式数据应用和包装模型部署,而不必担心 Web 开发的技术细节。
minhuan5 个月前
fastapi·模型部署·大模型应用·模型接口鉴权·jwt应用
大模型应用:大模型的本地 API 服务:FastAPI 封装与接口鉴权.44大模型的里里外外我们都进行了很多细节的讲解,但大模型的部署引用还没有涉及太多,今天我们重点讲一下模型的接口发布,以及利用Postman工具的鉴权调试,Postman 是一款轻量、易用的 API 调试与测试工具,无需编写复杂代码即可快速验证接口的可用性,是本地大模型 API 开发、调试阶段的首选工具。相比于浏览器的自动生成文档页面,Postman 更贴近实际业务中客户端调用 API的真实场景,如后端服务、移动端调用),能直观验证鉴权逻辑、参数传递、返回结果是否符合预期。
AndrewHZ6 个月前
人工智能·大模型·llm·压力测试·模型部署·通义千问·qwen3-32b
【大模型技术学习】大模型压力测试全攻略:以Qwen3-32B为例在大模型落地生产环境的过程中,压力测试是不可或缺的一环——它能帮我们验证模型在高并发场景下的稳定性、响应效率和资源利用率,避免上线后出现服务崩溃、响应超时等问题。本文以阿里通义千问的Qwen3-32B模型为例,从核心指标、环境搭建、代码实现到结果分析,完整讲解大模型压力测试的全流程。
破烂pan6 个月前
llm·模型部署·sglang
SGLang启动参数详解下面是一个多卡启动的完整命令示例,并简要说明一个关键性能参数的高级用法。以下示例展示了如何在一台机器上使用 2 张 GPU 运行 Llama-3-8B 模型,并进行了关键性能调优:
算家云6 个月前
github·模型部署·算家云·租算力,到算家云·算力平台
基于GitHub Actions与算力平台API:构建端到端的模型自动训练与部署流水线在机器学习项目的迭代过程中,持续集成与持续部署(CI/CD)已成为提升团队协作效率和模型交付速度的关键。通过将算力平台的API能力嵌入GitHub Actions工作流,我们可以构建一套端到端的自动化管道,实现从代码提交到模型训练再到服务部署的无缝衔接。