外语、方言、少数民族语言全覆盖:Hy-MT1.5 支持 1056 个翻译方向;MIT 联合发布 MathNet:涵盖 2.7 万道奥数真题的多模态数学推理基准

公共资源速递

9 个公共数据集:

  • Claw-Eval 真实世界评测基准数据集

  • MathNet 多模态数学基准推理数据集

  • Medical Waste 医疗废弃物检测数据集

  • Breast Cancer 乳腺癌多模态融合数据集

  • GRAPE Leaf Diseases 葡萄叶片病害检测数据集

  • Aquatic Wildlife Atlas 全球水生生物图鉴数据集

  • Global Earthquake-M4.5 全球 4.5 级以上地震数据集

  • Eye disease Classification Fundus 眼底疾病分类数据集

  • Long-Distance Wildfire & Smoke Detection 长距离野火烟雾检测数据集

7 个公共教程:

  • Uni-Mol:通用 3D 分子表示学习框架

  • Hy-MT1.5-1.8B-1.25bit 轻量级翻译模型

  • Mistral Medium 3.5 128B:旗舰级融合模型

  • OmniVoice:支持 600+ 语言的高质量 TTS

  • MiniCPM-o-4_5:面壁智能开源的全双工全模态模型

  • MiMo-Audio-7B-Instruct:小米开源的端到端语音模型

  • DeepSeek-V4-Flash:285B 参数高效长上下文 MoE 模型

访问官网立即使用: openbayes.com

公共数据集

1. Claw-Eval 真实世界评测基准数据集

Claw-Eval 是一个面向 AI Agent 真实世界任务评测的端到端透明评测基准数据集,支持英文与中文两种语言,包含 General、Multimodal 与 Multi-turn 三个核心任务组,共覆盖通信、金融、办公、生产力工具等 24 个任务类别。

在线使用:

go.openbayes.com/pGU54

2. MathNet 多模态数学基准推理数据集

MathNet 是由 MIT 团队联合阿卜杜拉国王科技大学等机构于 2026 年发布的一个大规模多语言、多模态数学推理数据集,覆盖代数、几何、数论、组合数学、微积分、概率统计等奥数知识体系,支持数学问题求解、数学语义检索(识别结构等价及相似试题)、检索增强问题求解 3 个基准任务。

在线使用:

go.openbayes.com/kCwaS

数据集概览

3. Medical Waste 医疗废弃物检测数据集

Medical Waste 是一个面向医疗废弃物智能识别与目标检测任务构建的高分辨率图像数据集,包含数千张高分辨率医疗废弃物图像及对应目标检测标注,覆盖 13 个类别,采用标准目标检测标注格式,提供 COCO(.json)与 Pascal VOC(.xml)两种边界框标注文件。

在线使用:

go.openbayes.com/vQPvu

数据集示例

4. Breast Cancer 乳腺癌多模态融合数据集

该数据集严格对齐了 122 名 BRCA 患者的多源数据,所有样本均通过 TCGA Case ID 完成跨模态映射,实现了宏观医学影像(MRI)、微观数字病理学(Histopathology)、分子组学(Multi-Omics)以及临床治疗信息之间的一一对应。

在线使用:

go.openbayes.com/vjy2z

5. GRAPE Leaf Diseases 葡萄叶片病害检测数据集

该数据集包含 4,195 张葡萄叶片图像,涵盖 4 个类别,包括健康葡萄叶片以及 3 种常见病害:黑腐病、埃斯卡病和叶枯病。数据集已完成预处理,并采用标准 YOLO 格式组织,划分为训练集(train)和验证集(val)。

在线使用:

go.openbayes.com/ePiP4

数据集示例

6. Aquatic Wildlife Atlas 全球水生生物图鉴数据集

该数据集包含 20 万条水生动物观测记录,覆盖 100 种以上水生物种,涉及全球主要水域生态环境。每条记录对应一次独立的生物观测,包含完整的林奈分类信息(界至种)、生态特征、物理测量、地理坐标、环境读数以及观测元数据等内容。

在线使用:

go.openbayes.com/1O2fX

7. Global Earthquake-M4.5 全球 4.5 级以上地震数据集

Global Earthquake Events - M4.5+ (1900-Present) 是一个面向地震活动分析与地理空间研究构建的全球地震事件数据集,旨在帮助研究人员分析长期地震活动的频率、分布与震级变化,广泛应用于地震灾害评估、城市规划、地质研究及灾害预警等研究方向。

在线使用:

go.openbayes.com/PZcex

8. Eye disease Classification Fundus 眼底疾病分类数据集

Eye disease Classification Fundus 是一个面向眼底图像分类任务构建的医学视觉数据集,旨在提升计算机视觉模型在眼科疾病识别与辅助诊断场景中的分类能力。该数据集共包含 6,086 张图像,包含白内障、糖尿病视网膜病变、青光眼以及正常眼底 4 类眼底图像。

在线使用:

go.openbayes.com/fDYEJ

数据集示例

9. Long-Distance Wildfire & Smoke Detection 长距离野火烟雾检测数据集

Long-Distance Wildfire & Smoke Detection 是一个面向森林火灾早期预警与环境监测任务构建的计算机视觉数据集,旨在提升模型在远距离森林监控场景中的烟雾与野火检测能力,广泛应用于森林防火、无人机巡检及智能监控等研究方向。

在线使用:

go.openbayes.com/KojJg

数据集示例

公共教程

1 . Uni-Mol:通用 3D 分子表示学习框架

Uni-Mol 是由深势科技(DP Technology)于 2022 年发布的通用 3D 分子预训练框架。Uni-Mol 通过大规模 3D 分子结构预训练扩展分子表示能力,可用于药物设计、分子性质预测、蛋白质-配体相互作用建模等任务。

在线运行:

go.openbayes.com/xliLp

项目示例

2. Hy-MT1.5-1.8B-1.25bit 轻量级翻译模型

Hy-MT1.5-1.8B-1.25bit 由 Tencent 于 2026 年 4 月发布,是基于 Hy-MT1.5-1.8B 的 1.25-bit 量化多语言翻译模型。该模型的核心价值在于将较高质量的多语言翻译能力压缩到更轻量的部署形态中。

在线运行:

go.openbayes.com/ATdZ4

项目示例

3. Mistral Medium 3.5 128B:旗舰级融合模型

Mistral Medium 3.5 是 Mistral AI 于 2025 年发布的旗舰级融合模型,拥有 1280 亿(128B)参数与 256k 上下文窗口,在单组权重中统一了指令遵循、推理与编程能力。该模型替代了此前的 Mistral Medium 3.1 和 Magistral,并在编程智能体 Vibe 中替代了 Devstral 2。

在线运行:

go.openbayes.com/qrxTD

项目示例

4. OmniVoice:支持 600+ 语言的高质量 TTS

OmniVoice 是小米 AI Lab Next-gen Kaldi 团队推出的多语言文本转语音(Text-to-Speech, TTS)模型,支持超过 600 种语言的高质量语音合成。该项目基于迭代式非掩码解码(Iterative Unmasked Decoding)架构,实现了语音克隆(Voice Clone)、语音设计(Voice Design)和自动语音(Auto Voice)三大核心功能。

在线运行:

go.openbayes.com/oBY7I

项目示例

5. MiniCPM-o-4_5:面壁智能开源的全双工全模态模型

MiniCPM-o-4_5 是由面壁智能和清华大学自然语言处理实验室于 2026 年 2 月开源的 9B 参数全模态旗舰模型,采用端到端架构融合 SigLip2、Whisper、CosyVoice2 与 Qwen3-8B。该模型实现了全双工交互------能边看、边听、边说,告别传统回合制「对讲机」模式。模型具备领先的视觉理解、超拟人语音生成及声音克隆能力,支持主动交互与实时流媒体处理,在端侧设备即可运行。

在线运行:

go.openbayes.com/9Zc5l

项目示例

6. MiMo-Audio-7B-Instruct:小米开源的端到端语音模型

MiMo-Audio 是小米公司于 2025 年 9 月发布的端到端语音模型。其预训练数据已扩展至超过一亿小时,研究人员观察到它在多种音频任务上展现出了少样本学习能力。团队对这些能力进行了系统评估,发现 MiMo-Audio-7B-Base 在开源模型的语音智能与音频理解基准测试中均达到了 SOTA。除标准指标外,该模型还能泛化到训练数据中未涵盖的任务,如语音转换、风格迁移和语音编辑。

在线运行:

go.openbayes.com/TVwIF

项目示例

7. DeepSeek-V4-Flash:285B 参数高效长上下文 MoE 模型

DeepSeek V4 是深度求索(DeepSeek)团队发布的最新一代大语言模型,包含两个版本:DeepSeek-V4-Pro(1.6T 参数)和 DeepSeek-V4-Flash(285B 参数)。DeepSeek V4 采用全新的高效长上下文注意力机制,原生支持高达 100 万 tokens 的上下文长度,专为处理超长文本任务而设计。

在线运行:

go.openbayes.com/QPpal

项目示例

相关推荐
OpenCSG7 小时前
CSGHub v2.1.0开源版本更新
人工智能
沪漂阿龙7 小时前
Dify 面试题详解:开源 LLM 应用开发平台、RAG 知识库、Workflow 工作流、Agent 智能体一文讲透
人工智能·架构
移动云开发者联盟7 小时前
存智赋能 共筑AI存储新生态,移动云聚力技术创新夯实AI数据基石
大数据·人工智能
user29876982706547 小时前
五、Hooks 实战:验证、通知与环境初始化
人工智能
Nayxxu7 小时前
Claude 长上下文调用成本分析:token、缓存、摘要与切片策略
人工智能
我材不敲代码7 小时前
目标检测:YOLOv12环境配置,全文详细教程
人工智能·yolo·目标检测
海盗12347 小时前
AI 每日要闻速递-2026年5月18日
人工智能
JavaAgent架构师7 小时前
Spring AI接入OpenAI报错401/429?3种原因+完整解决代码
人工智能·后端
RSTJ_16257 小时前
PYTHON+AI LLM DAY FOURTY-NINE
人工智能·python·深度学习