腾讯云大模型训练平台

提供全球领先的云计算服务

腾讯云,腾讯集团倾力打造的云计算品牌,面向全世界各个国家和地区的政府机构、企业组织和个人开发者,提供全球领先的云计算、大数据、人工智能等技术产品与服务,以卓越的科技能力打造丰富的行业解决方案,构建开放共赢的云端生态,推动产业互联网建设,助力各行各业实现数字化升级。

业务介绍

TI-ONE 是为 AI 工程师打造的一站式机器学习平台,为用户提供从数据准备、模型训练、模型评测到模型服务部署的全流程支持。TI-ONE 支持多种训练方式和算法框架,并已全面支持 LLM 大模型的增训(Post-Pretrain)和有监督精调(SFT),满足不同 AI 场景的需求。

业务架构

核心功能

数据中心:提供面向传统 AI 训练和大模型训练的数据集管理以及数据构建、标注功能。其中:

  • 数据构建:内置开源可扩展的数据处理 pipeline,可一键启动基于开发机的数据构建任务;预置超100w条高质量精调配比数据,覆盖12大类、100+任务类型,可提升 LLM 训练效果。

训练工坊:提供开发机和任务式建模两种训练方式,可基于内置镜像或自定义镜像快速、灵活发起训练任务,并基于腾讯自研的 Angel 框架提供训练加速。其中:

  • 开发机:提供交互式的开发功能,支持 Jupyter Notebook 和 VSCode 两种在线编码 IDE,内置主流框架,支持 SSH 远程连接、Git 存储库。不仅支持算法调试与模型训练,也可以进行数据准备和预处理。
  • 任务式建模:提供向导式的训练任务提交、管理功能,特别适用于多机多卡大规模训练。基于训练任务优先级管理以及多层容错机制,保障训练任务高效、稳定运行。

模型管理:内置丰富大模型资源,支持对 AI 模型进行管理和评测。其中:

  • 内置大模型:内置主流开源大模型和腾讯自研大模型,支持快速发起精调训练和模型部署、体验。
  • 模型仓库:支持模型导入和版本管理。
  • 模型优化:内置腾讯自研的 Angel 推理加速框架,提升模型推理性能。

模型评测:支持轻量体验、客观评测、主观评测三阶段评测能力,全方位保障模型效果。

模型服务:支持将模型快速发布为推理服务,同时也支持离线批量预测。其中:

  • 在线服务:在一键部署之外,还支持丰富的服务管理和监控能力,包括热更新、手动/自动扩缩容、流量分配、在线测试、服务监控。

对接云原生:无缝打通腾讯云的存储、镜像、权限、监控、日志等产品,提供一站式、全方位的云上机器学习体验。

相关推荐
xingyuzhisuan1 天前
算力租赁平台 GPU 资源隔离方案:显存抢占问题深度排查与解决
大数据·云计算·gpu算力
workbuddy小能手1 天前
腾讯云ADP Agent Portal vs 自建智能体:架构选型对比
架构·云计算·腾讯云
宸津-代码粉碎机1 天前
Spring AI 企业级实战|智能记忆摘要+自动遗忘机制落地,彻底解决上下文爆炸与Token冗余
java·大数据·人工智能·后端·python·spring·云计算
thinking_talk1 天前
2026中国MongoDB云服务厂商能力榜:选型对比与效能评估
数据库·mongodb·腾讯云
tiancaijiben1 天前
阿里云Elasticsearch搭建网站站内搜索功能:从零到生产级实战指南
云计算
tiancaijiben1 天前
阿里云Linux云服务器搭建Joomla基础管理平台:从零到企业级部署
云计算
翼龙云_cloud1 天前
阿里云代理商:如何管理CPFS的POSIX客户端挂载点?
运维·阿里云·云计算·阿里云 cpfs
xingyuzhisuan1 天前
8 卡 / 16 卡 GPU 服务器机架布线与高速互联带宽优化技术详解
运维·服务器·云计算·gpu算力
tiancaijiben1 天前
阿里云云消息队列RabbitMQ版配置流程:从实例创建到消息收发全解析
云计算