一键移除复杂物体!Netflix VOID 让视频消除拥有「物理直觉」;告别乱码与解析难题,MDPBench 数据集为「真实复杂场景」文档解析而生

公共资源速递

11 个公共数据集:

  • Stroke Risk 中风风险数据集

  • ToolACE 复杂工具学习对话数据集

  • CHOCLO 拉丁美州文化基准数据集

  • DRACO 跨领域深度研究基准数据集

  • MDPBench 多语言文档解析基准数据集

  • World Model Bench 世界模型基准数据集

  • Credit Card Fraud 信用卡欺诈检测数据集

  • Spam Email Detection 垃圾邮件检测数据集

  • Simple Voice Questions 简单语音问题数据集

  • COCO-2017-Vietnamese 越南语图像检测数据集

  • GPT-5.4-step-by-step-reasoning 逐步推理数据集

6 个公共教程:

  • DeepTutor:个人学习助手

  • 一键部署 gemma-4-31B-it

  • Chandra-ocr-2 部署与交互式文本识别

  • VenusFactory v2 蛋白质工程设计平台

  • Netflix VOID:从视频中移除物体及交互

  • 一键部署 Nemotron-Cascade-2-30B-A3B

访问官网立即使用: openbayes.com

公共数据集

1. Stroke Risk 中风风险数据集

Stroke Risk 是一个面向医疗健康场景的中风风险分析与预测数据集。该数据集基于常见临床风险因素构建,包含人口统计信息、病史记录、生活方式因素及关键健康指标,反映个体在不同健康与生活方式条件下的中风发生概率,旨在支持机器学习模型对中风风险进行预测与分析,帮助识别关键影响因素,从而提升早期筛查与预防能力。

在线使用:

go.openbayes.com/p7Qx8

2. ToolACE 复杂工具学习对话数据集

该数据集包含多步骤会话示例,共调用 26,507 个多样化 API。样本通过多智能体交互生成,并经过规则检查 + 模型验证的双层质量保证。每条对话都是多步骤、多来源的信息检索与分析任务,真实模拟工具调用场景,为 LLM 提供高价值训练数据。

在线使用:

go.openbayes.com/5JdRx

3. CHOCLO 拉丁美州文化基准数据集

该数据集包含多类结构化实例,覆盖传统、美食、公众人物、地理、动物、植物和文化遗产等 7 类拉丁美洲文化核心类别,以及智利、墨西哥、阿根廷等 18 个拉丁美洲国家,可全面覆盖拉丁美洲多元文化场景。

在线使用:

go.openbayes.com/Fg1YF

4. DRACO 跨领域深度研究基准数据集

该数据集包含 100 个复杂研究任务,覆盖全球五大洲的 40 个国家与地区,涉及金融、购物/产品对比、学术、科技等 10 大应用领域。每个任务对应一个多步骤、多来源的信息检索与分析问题,并配有由 26 位领域专家设计和验证的评估标准。每个标准平均包含约 40 项评价指标,从事实准确性、分析广度与深度、展示质量以及引用质量四个维度对模型输出进行细粒度评估。

在线使用:

go.openbayes.com/VHB5i

5. MDPBench 多语言文档解析基准数据集

该数据集中包含 3,400 张文档图像,涵盖 17 种语言,包括简体中文、繁体中文、英语、阿拉伯语、德语、西班牙语、法语、印地语、印度尼西亚语、意大利语、日语、韩语、葡萄牙语、 俄语、泰语和越南语。图像经过专家模型标注、人工校正和人工验证的严格流程获得高质量标注。

在线使用:

go.openbayes.com/1BF1K

6. World Model Bench 世界模型基准数据集

该数据集围绕世界模型能力评估构建,涵盖感知、认知与具身三大核心维度,细分为环境理解、实体识别与分类、基于预测的推理等 10 类任务,并设计 100 个多样化场景,用于系统性评估模型在复杂环境中的认知与决策能力。

在线使用:

go.openbayes.com/YovOz

7. Credit Card Fraud 信用卡欺诈检测数据集

该数据集包含美国西部地区的信用卡交易数据,记录了每笔交易的详细信息,例如客户账户信息、商户及交易类别,以及该交易是否为欺诈的标注结果,主要用于研究信用卡交易中的欺诈行为识别问题。

在线使用:

go.openbayes.com/dK15u

8. Spam Email Detection 垃圾邮件检测数据集

该数据集是一个用于垃圾邮件识别任务的标注电子邮件数据集,包含邮件主题与正文文本,并提取词数统计、文本特征及工程化数值特征,同时附带垃圾邮件标签,可用于二元分类任务。

在线使用:

go.openbayes.com/Njeaz

9. Simple Voice Questions 简单语音问题数据集

该数据集包含 26 个地区的 17 种语言下的简短音频问题,共计约 700 名说话者,每人最多提供 250 条语音样本,涵盖阿拉伯语、英语、日语、韩语、印地语等多种语言,并包含安静环境、背景人声及交通噪声等多样化录音条件。

在线使用:

go.openbayes.com/0lgS4

10. COCO-2017-Vietnamese 越南语图像检测数据集

COCO-2017-Vietnamese 是基于 Microsoft 提出的 Common Objects in Context 2017 数据集构建的一个越南语本地化扩展数据集,由 AI Enthusiasm 社区整理与发布。该数据集在原始英文图像描述的基础上引入高质量越南语翻译,提供了一个双语框架下的综合基准,适用于图像描述和多模态学习等任务。

在线使用:

go.openbayes.com/xnqeH

11. GPT-5.4-step-by-step-reasoning 逐步推理数据集

该数据集面向长链思维(CoT)建模与复杂问题求解任务,包含约 1,500 条精英级样本,覆盖数学、编程与医学等高复杂度领域,任务难度统一设定为「Grandmaster」及「Beyond-PhD」级别。

在线使用:

go.openbayes.com/IugP0

公共教程

1. DeepTutor:个人学习助手

DeepTutor 是香港大学数据智能实验室于 2026 年 3 月推出的个人学习助手,是一个全能型 AI 驱动的教学系统。该项目整合了海量文档知识问答、交互式学习可视化、知识强化与练习题目生成以及深度研究与想法生成四大核心功能模块,为学习者提供一站式的智能学习体验。

在线运行:

go.openbayes.com/razYy

2. 一键部署 gemma-4-31B-it

Gemma-4-31B-it 由 Google DeepMind 于 2026 年 4 月 2 日发布,是 Gemma 4 系列中的 31B Dense 指令模型。该模型支持文本与图像输入、文本输出,提供最长 256K 上下文窗口,并原生支持 reasoning、function calling 与 system prompt,适合构建高质量问答、代码辅助与智能体服务,支持 140 多种语言,主要面向推理、编程、智能体工作流与多模态理解任务。

在线运行:

go.openbayes.com/8lvkQ

3. Chandra-ocr-2 部署与交互式文本识别

Chandra-ocr-2 是由 Datalab 团队于 2026 年 3 月推出的新一代光学字符识别系统,专注于复杂场景下的文字识别与结构化输出。该模型基于先进的视觉语言预训练技术进行微调,能够对上传的图像内容进行智能识别并返回格式化的文本结果。

在线运行:

go.openbayes.com/rjZwY

4. VenusFactory v2 蛋白质工程设计平台

VenusFactory2 由上海交通大学、华东理工大学的联合团队开发。VenusFactory2 是一个 Agent 驱动的蛋白质工程平台,集成 40+ AI 模型与 11 个生物数据库。平台提供 Web 界面、REST API、CLI 三种使用方式,方便计算机科学和生物学领域的研究人员使用。

在线运行:

go.openbayes.com/9k50p

5. Netflix VOID:从视频中移除物体及交互

Netflix VOID 是由 Netflix 团队与苏非亚大学(Sofia University)于 2026 年 4 月联合开源的视频编辑模型。Netflix VOID 模型拥有 50 亿参数,专为解决电影后期制作中的物理一致性难题而设计,旨在打破传统视频补全技术在处理复杂物体交互时的因果逻辑局限。

在线运行:

go.openbayes.com/9gJDs

6. 一键部署 Nemotron-Cascade-2-30B-A3B

Nemotron-Cascade-2-30B-A3B 由 NVIDIA 于 2026 年 3 月发布,是一款 30B MoE、约 3B activated parameters 的开源大语言模型,基于 Nemotron-3-Nano-30B-A3B-Base 后训练而来。模型的核心定位是提供强推理、对话、代码相关与 agentic 场景能力,并同时支持 thinking mode 与 instruct mode 两种使用方式。

在线运行:

go.openbayes.com/urkbS

相关推荐
搬砖的小明20262 小时前
Google BwA 杭州场(Gemma 4 专题全国首发)线下活动记录
人工智能
向量引擎2 小时前
向量引擎中转站偷走我半条命后终于把API密钥这件事整明白了
人工智能·aigc·api·ai编程·ai写作·key·api调用
龙萱坤诺2 小时前
智创聚合API上线 Claude Opus 4.7,编码与多模态能力全面拉满
人工智能·ai编程·claude·ai开发
沪漂阿龙2 小时前
深度拆解LangChain Chains与LCEL:从Runnable到生产级AI工作流
人工智能·langchain
大模型RAG和Agent技术实践2 小时前
项目实战:深入剖析 Dify 知识库管理系统的 RBAC 权限设计与实现
人工智能·dify·rag
飞哥数智坊2 小时前
9位分享者,141位到场者,TRAE Friends@济南第5场线下活动又爆了
人工智能·ai编程·solo
wydxry2 小时前
深入解析自适应光学中的哈特曼波前传感技术:原理、算法与智能化前沿
大数据·人工智能·算法
算.子2 小时前
【Spring AI 实战】七、Embedding 向量化与向量数据库选型对比
人工智能·spring·embedding
Circle Studio2 小时前
颠覆英伟达!2386 亿晶圆级芯片独角兽,正式冲击 IPO
人工智能·物联网