腾讯云大模型训练平台

提供全球领先的云计算服务

腾讯云,腾讯集团倾力打造的云计算品牌,面向全世界各个国家和地区的政府机构、企业组织和个人开发者,提供全球领先的云计算、大数据、人工智能等技术产品与服务,以卓越的科技能力打造丰富的行业解决方案,构建开放共赢的云端生态,推动产业互联网建设,助力各行各业实现数字化升级。

业务介绍

TI-ONE 是为 AI 工程师打造的一站式机器学习平台,为用户提供从数据准备、模型训练、模型评测到模型服务部署的全流程支持。TI-ONE 支持多种训练方式和算法框架,并已全面支持 LLM 大模型的增训(Post-Pretrain)和有监督精调(SFT),满足不同 AI 场景的需求。

业务架构

核心功能

数据中心:提供面向传统 AI 训练和大模型训练的数据集管理以及数据构建、标注功能。其中:

  • 数据构建:内置开源可扩展的数据处理 pipeline,可一键启动基于开发机的数据构建任务;预置超100w条高质量精调配比数据,覆盖12大类、100+任务类型,可提升 LLM 训练效果。

训练工坊:提供开发机和任务式建模两种训练方式,可基于内置镜像或自定义镜像快速、灵活发起训练任务,并基于腾讯自研的 Angel 框架提供训练加速。其中:

  • 开发机:提供交互式的开发功能,支持 Jupyter Notebook 和 VSCode 两种在线编码 IDE,内置主流框架,支持 SSH 远程连接、Git 存储库。不仅支持算法调试与模型训练,也可以进行数据准备和预处理。
  • 任务式建模:提供向导式的训练任务提交、管理功能,特别适用于多机多卡大规模训练。基于训练任务优先级管理以及多层容错机制,保障训练任务高效、稳定运行。

模型管理:内置丰富大模型资源,支持对 AI 模型进行管理和评测。其中:

  • 内置大模型:内置主流开源大模型和腾讯自研大模型,支持快速发起精调训练和模型部署、体验。
  • 模型仓库:支持模型导入和版本管理。
  • 模型优化:内置腾讯自研的 Angel 推理加速框架,提升模型推理性能。

模型评测:支持轻量体验、客观评测、主观评测三阶段评测能力,全方位保障模型效果。

模型服务:支持将模型快速发布为推理服务,同时也支持离线批量预测。其中:

  • 在线服务:在一键部署之外,还支持丰富的服务管理和监控能力,包括热更新、手动/自动扩缩容、流量分配、在线测试、服务监控。

对接云原生:无缝打通腾讯云的存储、镜像、权限、监控、日志等产品,提供一站式、全方位的云上机器学习体验。

相关推荐
主机哥哥3 小时前
2026年腾讯云优惠券领取攻略:新购/续费/升级可用
云计算·腾讯云
柠檬味的Cat3 小时前
腾讯云轻量服务器一键部署OpenClaw教程
服务器·腾讯云
byoass16 小时前
csdn_upload_005
网络·安全·云计算
小夏子_riotous19 小时前
openstack的使用——9. 密钥管理服务Barbican
linux·运维·服务器·系统架构·centos·云计算·openstack
@土豆1 天前
acme.sh 自动解析、申请并续签免费泛域名证书(Docker容器部署+腾讯云DNSPod)
docker·容器·腾讯云
Aray12341 天前
论秒杀场景及其技术解决方案
云计算
腾讯蓝鲸智云1 天前
提升研发效能:DevOps平台高效权限配置与同步方案
运维·服务器·人工智能·云计算·devops
黑牛儿1 天前
从旧版到 v0.20.5:Ollama 升级避坑全流程(附命令复制即用)
ai·云计算
刘~浪地球2 天前
架构设计--事件驱动架构设计与实现(05)
云原生·系统架构·云计算
Luke~2 天前
阿里云计算巢已上架!3分钟部署 Loki AI 事故分析引擎,SRE 复盘时间直接砍掉 80%
人工智能·阿里云·云计算·loki·devops·aiops·sre