腾讯混元

小白狮ww9 天前
人工智能·深度学习·机器学习·ocr·文字识别·文档处理·腾讯混元
当 OCR 模型开始「理解整页文档」:HunyuanOCR 的端到端之路如果你用过 OCR,可能会发现它在单行文本上已经相当成熟,但一旦遇到多栏排版、表格或公式,效果就会明显下降。这并不是简单的识别精度问题,而是传统 OCR 更关注字符本身,却很少真正理解文档结构。 随着文档图像复杂度不断提高,OCR 正在从「认字」走向「读文档」。腾讯混元团队推出的 HunyuanOCR,是一款 1B 参数的端到端 OCR 多模态模型,尝试在一个模型中同时完成文本定位、识别与结构理解,摆脱对传统流水线式拼接的依赖。
未来智慧谷16 天前
人工智能·gpt·qq·腾讯混元
技术速递 | GPT-5.2 API已开放,腾讯混元更名Tencent HY,QQ上线群聊AI总结各位开发者,以下是过去48小时值得关注的AI技术动态与产品更新:1. OpenAI GPT-5.2正式发布,API同步开放
TechTrek1 个月前
腾讯混元·具身大模型
小米发布并开源具身大模型MiMo-Embodied,腾讯混元开源HunyuanVideo 1.51. 小米发布并开源具身大模型MiMo-Embodied小米正式发布具身大模型MiMo-Embodied并宣布全面开源,该模型打通了自动驾驶与具身智能两大领域,实现任务统一建模,完成从“垂直领域专用”到“跨域能力协同”的关键跨越,其核心技术亮点包括覆盖具身智能与自动驾驶核心任务的跨域能力、室内外智能的知识转移协同效应以及多阶段训练策略,该模型在涵盖感知、决策与规划的29项核心基准测试中表现优异,不仅在具身智能17个基准、自动驾驶12个基准上取得卓越成绩,还在通用视觉语言领域展现出出色泛化性。 Huggin
彩旗工作室4 个月前
3d·开源·腾讯混元
腾讯混元3D系列开源模型:从工业级到移动端的本地部署腾讯混元3D系列作为国内领先的3D生成大模型家族,自2024年首代模型开源以来,已形成覆盖工业级建模、AR/VR交互、轻量化部署的全场景解决方案。截至2025年8月,其开源模型已达9款,支持文/图生3D、多视图重建、语义场景生成等核心能力。本文将系统梳理混元3D系列所有已发布模型的技术特性,并提供本地部署的详细指南,帮助开发者快速落地应用。
CSharp精选营7 个月前
hexo·butterfly·腾讯混元·生成摘要
Hexo-butterfly 接入腾讯混元大模型自动生成文章摘要(保姆教程)该插件是插件基于hexo-ai-excerpt插件开发而来,原插件已经归档,由其他大佬复刻了新的,地址如下:hexo-ai-summary-liushen
OpenBayes1 年前
人工智能·深度学习·3d·ai·3d 模型·腾讯混元·教程上新
OpenBayes 教程上新丨腾讯 Hunyuan3D-1.0 上线,10s 实现 3D 图像生成3D 模型在游戏开发、影视动画、虚拟现实 (VR) 等多个行业和场景中发挥着重要作用,但现有的 3D 生成扩散模型在快速生成和泛化能力上仍存在不足。为了解决这些问题,腾讯的研究团队推出了 Hunyuan3D-1.0,同时开源了轻量版与标准版模型。这一创新框架通过结合多视角生成与稀疏视角重建技术,有效攻克了 3D 生成技术中的多项挑战。
云樱梦海1 年前
3d·腾讯混元·hunyuan3d
【1211更新】腾讯混元Hunyuan3D-1文/图生3D模型云端镜像一键运行目录项目介绍显存占用11月21 新增纹理烘焙模块Dust3R烘焙相关参数:AutoDL云端镜像启动说明
云樱梦海1 年前
腾讯混元·hunyuan3d
腾讯混元3D模型Hunyuan3D-1.0部署与推理优化指南腾讯混元3D模型Hunyuan3D-1.0部署与推理优化指南摘要: 本文将详细介绍如何部署腾讯混元3D模型Hunyuan3D-1.0,并针对不同硬件配置提供优化的推理方案。我们将探讨如何在有限的GPU内存下,通过调整配置来优化模型的推理性能。
我是有底线的