4B 参数规模,13 种语言,Voxtral 多语言实时语音转录模型;含数理化 8 大学科,CHIMERA 合成推理数据集上线

4 个公共数据集:

  • Open-RL 推理问题数据集

  • CHIMERA 通用推理合成数据集

  • Lung Cancer Clinical 肺癌临床数据集

  • Antenna Performance 天线性能与故障数据集

4 个公共教程:

  • HunyuanVideo-1.5 I2V:图生视频模型

  • UI-TARS-1.5 多模态 Agent:桌面端 GUI 智能助理

  • HY-World 1.5: 实时、几何一致的交互式世界建模系统框架

  • Voxtral Mini 4B Realtime 2602:多语言实时语音转录模型

访问官网立即使用: openbayes.com

公共数据集

1. Open-RL 推理问题数据集

该数据集包含物理学、数学、生物学和化学的独立、可验证和明确的 STEM 推理问题,每个问题需要多步推理,涉及符号操作和/或数值计算,且具有可客观验证的最终答案。该数据集适合用于强化学习微调、奖励建模、结果监督训练以及可验证推理基准测试。

在线使用:

go.openbayes.com/8zyv3

2. CHIMERA 通用推理合成数据集

该数据集是一个专为推理训练设计的合成推理数据集,涵盖广泛的 STEM 学科,并提供长链思维(CoT)轨迹。该数据集包含 9,225 个问题,8 个学科(数学、计算机科学、化学、物理、文学、历史、生物学、语音学)。

在线使用:

go.openbayes.com/z1dPn***

3. Lung Cancer Clinical 肺癌临床数据集

该数据集是一个包含 1,500 条患者记录的临床数据集,提供了有关肺癌的详细临床、人口统计、生活方式、遗传和诊断信息,适用于探索性数据分析(EDA)、机器学习分类、生存分析、地理趋势分析和公共卫生研究。

在线使用:

go.openbayes.com/wayw3

4. Antenna Performance 天线性能与故障数据集

该数据集共有 1,107 条记录,包含灵活/可穿戴天线在 WiFi 和蓝牙频段运行的物理特性、材料属性及性能指标,详细描述了天线设计参数,如长度、宽度、高度、介电常数、导电率和相对介电常数等物理特征,可为预测性维护、异常检测及使用机器学习进行稳健的可穿戴天线设计的提供资源。

在线使用:

go.openbayes.com/ums2s

公共教程

1. HunyuanVideo-1.5 I2V:图生视频模型

HunyuanVideo-1.5 是腾讯 Hunyuan 团队于 2025 年 11 月发布的轻量级视频生成模型。该模型仅使用 83 亿参数即可实现顶级画质,大幅降低了使用门槛,可在消费级显卡上流畅运行。

在线运行:

go.openbayes.com/yDf48

项目示例

1. UI-TARS-1.5 多模态 Agent:桌面端 GUI 智能助理

UI-TARS-desktop 是字节跳动推出的桌面端 GUI 智能助理应用,基于 UI-TARS 和 Seed-1.5-VL/1.6 系列视觉语言模型构建。该应用能够通过多模态方式理解计算机和浏览器界面,并通过自然语言指令自动完成各类操作任务。

在线运行:

go.openbayes.com/Q7q2x

项目示例

3. HY-World 1.5: 实时、几何一致的交互式世界建模系统框架型

HY-World 1.5(WorldPlay)是腾讯 Hunyuan 团队于 2025 年 12 月发布的首个开源实时交互、长期几何一致性的世界模型。该模型通过流式视频扩散技术实现实时交互式世界建模,解决了当前方法在速度和内存之间的权衡问题。

在线运行:

go.openbayes.com/S1vPv

项目示例

4. Voxtral Mini 4B Realtime 2602:多语言实时语音转录模型

Voxtral Mini 4B Realtime 2602 是由 Mistral AI 于 2026 年 2 月发布的多语言实时语音转录模型,是首批在延迟低于 500 ms 的前提下实现接近离线系统精度的开源解决方案之一。该模型支持 13 种语言,在多项基准测试中均优于现有开源实时基线,非常适合语音助手、实时字幕等应用场景。

在线运行:

go.openbayes.com/Fnhae

项目示例

相关推荐
Jooolin21 分钟前
从 DeepSeek、Qwen 到 GPT:一次企业级 AI 知识库项目的模型选型复盘
人工智能·云原生·ai编程
不羁的木木36 分钟前
HarmonyOS AI开发提效工具:DevEco Code & DevEco CLI - 实战:端侧AI文字识别应用
人工智能·华为·harmonyos
蓝速科技43 分钟前
蓝速科技 AI 数字人导办能力实测与人机协同价值评估
人工智能·科技
云和数据.ChenGuang1 小时前
T5大模型
人工智能·机器人·pandas·数据预处理·数据训练
哈哈,柳暗花明1 小时前
人工智能专业术语详解(O)
人工智能·专业术语
不羁的木木1 小时前
HarmonyOS AI开发提效工具:DevEco Code & DevEco CLI - 初识与配置指南
人工智能·华为·harmonyos
Kagol1 小时前
Superpowers GSD gstack AgentSkills深度测评
前端·人工智能
一切皆是因缘际会1 小时前
存算一体芯片软件双模式:单字符驱动网络(普通CPU也能跑)
人工智能·物联网·ai·系统架构·架构设计·发布订阅·存算一体
字节逆旅2 小时前
Claude Code Router 接入过程的爬坑记录
人工智能·claude
江畔柳前堤2 小时前
github实战指南01-账号配置与 SSH 密钥
运维·人工智能·深度学习·ssh·github·pyqt·信号处理