模型部署

星野云联AIoT技术洞察2 天前
whisper·语音识别·模型部署·tts·asr·嵌入式ai·naturalspeech3
2025年语音识别(ASR)与语音合成(TTS)技术趋势分析对比面向开发者的实用指南:探索最新的ASR和TTS技术,助力构建高效的语音应用。随着人工智能的快速发展,语音识别(ASR)和语音合成(TTS)技术在多个领域得到了广泛应用。从智能助手到自动字幕生成,从有声读物到虚拟主播,语音技术正逐步改变人机交互的方式。
赴3355 天前
人工智能·flask·客户端·模型部署·服务端
基于pth模型文件,使用flask库将服务端部署到开发者电脑目录一.服务端构建1. 依赖导入:搭建开发基础2. Flask 应用初始化:启动 Web 服务的第一步
AndrewHZ18 天前
人工智能·深度学习·llm·云计算·模型部署·大模型推理·算力平台
【AI算力系统设计分析】1000PetaOps 算力云计算系统设计方案(大模型训练推理专项版)随着 GPT-4、Grok 等超大规模语言模型的爆发式发展,训练与推理场景对算力密度、网络带宽、存储性能的需求呈指数级增长。本方案聚焦大模型全生命周期需求,以 NVIDIA H100 GPU 为核心算力载体,深度参考阿里云神龙架构、腾讯云 HCC 高性能集群、xAI Colossus 超算的技术精髓,构建一套具备低延迟互联、高算力持续供给、弹性调度适配的云计算系统,可支撑千亿参数模型训练(如 GPT-4 级)与高并发推理服务,实现训练周期缩短 60%、推理吞吐量提升 3 倍的核心目标。
悟乙己21 天前
人工智能·机器学习·模型部署·mlops
机器学习(MLOps)系统在线部署的基本指南本篇文章Navigating Key Decisions in Machine Learning (ML) System Deployment为机器学习系统的部署提供了实用的决策指导。技术亮点在于详细阐述了推理类型、服务平台和可扩展性策略,强调了如何根据不同需求选择合适的架构。适用场景包括实时预测和批量推理,适合需要高可用性和低延迟的应用,如推荐系统和用户画像
youcans_2 个月前
人工智能·gpt·大语言模型·模型部署·webui
【AGI使用教程】GPT-OSS 本地部署(2)欢迎关注【AGI使用教程】 专栏 【AGI使用教程】GPT-OSS 本地部署(1) 【AGI使用教程】GPT-OSS 本地部署(2)
归去_来兮3 个月前
c++·深度学习·模型部署
深度学习模型在C++平台的部署深度学习模型能够在各种生产场景中发挥重要的作用,而深度学习模型往往在Python环境下完成训练,因而训练好的模型如何在生产环境下实现稳定可靠的部署,便是一个重要内容。C++开发平台广泛存在于各种复杂的生产环境,随着业务效能需求的不断提高,充分运用深度学习技术的优势显得尤为重要。本文介绍如何实现将深度学习模型部署在C++平台上。
救救孩子把4 个月前
大模型·模型部署·uv·虚拟环境·vllm
使用 uv 工具快速部署并管理 vLLM 推理环境uv:现代 Python 项目管理的高效助手uv:Rust 驱动的 Python 包管理新时代在部署大语言模型(LLM)推理服务时,vLLM 是一个备受关注的方案,具备高吞吐、低延迟和对 OpenAI API 的良好兼容性。为了提高部署效率,依赖安装工具的选择同样重要。
achene_ql5 个月前
python·目标检测·rk3588·模型部署·rk3566
深入探索 RKNN 模型转换之旅在人工智能蓬勃发展的当下,边缘计算领域的应用愈发广泛。瑞芯微的 RKNN 技术在这一领域大放异彩,它能让深度学习模型在其芯片平台上高效运行。而在整个应用流程中,模型转换是极为关键的一环,今天就让我们一同深入这个神奇的 RKNN 模型转换世界。
Nicolas8935 个月前
华为·信创·模型部署·昇腾·ascend·vllm·模型推理
【大模型实战篇】华为信创环境采用vllm部署QwQ-32B模型本文分享在华为昇腾机器上部署QwQ-32B模型的实践。首先华为自己是提供了一套在信创机器(NPU)上部署模型的方案【1】,但是部署之后,测试发现会有输出截断的现象。QwQ-32B本身是支持128k的最大上下文长度,定位可能是max-model-len的设置没有生效,但是华为的启动参数中只有maxSeqLen以及maxInputTokenLen参数,修改后也不奏效。
算家云9 个月前
人工智能·音视频·模型部署·字节跳动·算家云·latentsync
LatentSync本地部署教程:基于音频精准生成唇形高度同步视频LatentSync 是字节跳动联合北京交通大学推出的一个端到端的唇形同步框架,以下是对其的详细介绍:
laugh1232110 个月前
tensorrt·模型部署·c/c++·模型加密
TensorRT-YOLO:灵活易用的 YOLO 部署工具项目地址:TensorRT-YOLO GitHub:https://github.com/laugh12321/TensorRT-YOLO
Thanks_ks1 年前
深度学习·docker·tensorflow·模型部署·容器化技术·模型训练·flask 应用
利用 TensorFlow 与 Docker 构建深度学习模型训练与部署流水线在深度学习领域,构建、训练和部署模型是一个复杂且耗时的过程。本文将介绍如何利用 TensorFlow 构建深度学习模型,并通过 Docker 容器化技术实现模型的训练与部署,从而简化整个流水线,提高开发效率。我们将通过实战代码,展示从模型构建到部署的全过程。
阿利同学1 年前
目标检测·计算机视觉·分类·模型部署·计算机视觉实战项目·人工智能实战项目
计算机视觉实战项目4(图像分类+目标检测+目标跟踪+姿态识别+车道线识别+车牌识别+无人机检测+A*路径规划+单目测距与测速+行人车辆计数等)计算机视觉项目大集合改进的yolo目标检测-测距测速路径规划算法图像去雨去雾+目标检测+测距项目交通标志识别项目
hi941 年前
人工智能·深度学习·模型部署·pynq
Vitis AI 综合实践(DPU example: dpu_resnet50.ipynb)目录1. 简介2. 代码解析2.1 导入库2.2 图像预处理2.3 读取标签2.4 读取图像2.5 获取IO形状
我是陈扣题1 年前
人工智能·深度学习·rk3588·强化学习·模型部署·ppo·orangep
使用RKNN在Orange Pi 5 (RK3588s) 上部署推理PPO深度学习模型本博客皆在展示如何在Orange Pi 5 上使用 RKNN C API 使用C语言来进行模型的部署,不设计以及讨论PPO网络的实现以及细节
机器学习社区1 年前
深度学习·算法·大模型·llama·模型部署·模型微调·模型推理
用 LMDeploy 高效部署 Llama-3-8B,1.8倍vLLM推理效率节前,我们星球组织了一场算法岗技术&面试讨论会,邀请了一些互联网大厂朋友、参加社招和校招面试的同学,针对算法岗技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备、面试常考点分享等热门话题进行了深入的讨论。
OpenBayes2 年前
数据库·人工智能·机器学习·语言模型·数据集·模型部署·模型训练
【OpenBayes 官方教程】在模型训练中使用子域名访问服务本教程主要为大家讲解 OpenBayes 上如何在模型训练中使用子域名访问服务,新朋友点击下方链接注册后,即可获得 4 小时 RTX 4090 + 5 小时 CPU 的免费使用时长哦!
万里鹏程转瞬至2 年前
深度学习·目标检测·模型部署
FastDeploy项目简介,使用其进行(图像分类、目标检测、语义分割、文本检测|orc部署)FastDeploy是一款全场景、易用灵活、极致高效的AI推理部署工具, 支持云边端部署。提供超过 🔥160+ Text,Vision, Speech和跨模态模型📦开箱即用的部署体验,并实现🔚端到端的推理性能优化。包括 物体检测、字符识别(OCR)、人脸、人像扣图、多目标跟踪系统、NLP、Stable Diffusion文图生成、TTS 等几十种任务场景,满足开发者多场景、多硬件、多平台的产业部署需求。
Python算法实战2 年前
算法·langchain·大模型·模型部署·llamaindex
用通俗易懂的方式讲解:使用 LangChain 和 LlamaIndex 从零构建PDF聊天机器人随着大型语言模型(LLM)(如ChatGPT和GPT-4)的兴起,现在比以往任何时候都更容易搭建智能聊天机器人,并且可以堆积如山的文档,为你的输入提供更准确的响应。