AI4Science开源汇总

文章目录

一、开源项目

1. walrus

walrus

有时候感觉也是曲高和寡,这么牛逼的项目,居然才几百个star,而那些随便整一个demo网站的,居然可以上千star。

二、开源数据

1. Well

Well

全称:The Well: A Large-Scale Collection of Diverse Physics Simulations for Machine Learning

核心特点:多样性与真实科学场景。

内容:这是一个极其庞大的物理模拟数据集集合(约 15TB)。它不仅仅包含流体力学,还涵盖了 16 个不同的物理领域,包括天体物理(如超新星爆炸、星系形成)、地球物理、声学、生物系统等。

作用:在 Walrus 的训练中,Well 数据集提供了跨学科的广度,帮助模型学习不同物理场(如磁场、密度场、流速场)之间的通用规律。文中提到的"高分辨率、来源于真实科学问题"正是指它包含了许多由科学家生成的、用于实际研究的高精度模拟数据。

2. FlowBench

FlowBench

全称:FlowBench: A Large Scale Benchmark for Flow Simulation over Complex Geometries

核心特点:几何复杂性与标准流体场景。

内容:这是一个专注于流体力学(CFD)的数据集,包含超过 10,000 个流体流动的样本。它的特色在于引入了各种复杂的几何形状(如机翼、管道中的障碍物、不规则物体),并模拟流体流过这些物体时的速度、压力和温度变化。

作用:在 Walrus 的训练中,FlowBench 弥补了单纯科学数据的不足,重点训练模型处理"边界条件"的能力------即当流体遇到复杂的障碍物时该如何流动。这对应了文中提到的"引入几何复杂障碍物"和"复杂流动模式"。

3. BubbleML

BubbleML

全称: BubbleML 2.0: A High-Fidelity Dataset of Boiling Simulations in 2D

核心特点: 高保真二维沸腾模拟、多流体工质与多物理场景预测。

内容: 这是一个专门针对多相流(沸腾现象)的高精度模拟数据集,存储为 HDF5 格式。它涵盖了 FC-72(氟化液)、液氮(Liquid N2)和 R515B(制冷剂)三种流体,并包含 5 个具体的沸腾预测场景子集:

单气泡(Single Bubble)

饱和池沸腾(Saturated Pool Boiling, pb-saturated)

过冷池沸腾(Subcooled Pool Boiling, pb-subcooled)

变流速流动沸腾(Flow Boiling - Varying Inlet Velocity, fb-velscale)

变热通量流动沸腾(Flow Boiling - Varying Heat Flux, fb-chf)

每个数据样本包含成对的时间序列场(5个时间步长,4个物理场),并附带 9 个关键的无量纲物理参数(如雷诺数、普朗特数、斯特凡数等)以及加热器条件(成核等待时间、壁面温度)。

作用: BubbleML 2.0 旨在评估模型在复杂相变动力学方面的预测能力。通过提供明确的训练/测试集划分和物理参数,它要求模型不仅能处理流体流动,还能根据给定的物理属性(如粘度、密度、热导率)准确预测气泡的生成、生长和脱离过程,是检验 AI 在科学计算中处理非线性热力学问题的重要基准。

4. 总结来说

Well 负责教模型"物理世界有多广阔"(跨领域的物理规律);

FlowBench 负责教模型"环境有多复杂"(复杂几何结构下的流体细节)。

三、参考文献

相关推荐
xcbrand6 小时前
工业制造品牌全案公司哪家专业
大数据·人工智能·python·制造
L-影6 小时前
下篇:核函数、软间隔和它的“江湖地位”——SVM的三种形态
人工智能·机器学习·支持向量机
reset20216 小时前
支持向量机(SVM)原理与应用
人工智能·机器学习·支持向量机
懂AI的老郑6 小时前
解锁边缘智能:多模态模型边缘化部署的机遇与挑战
人工智能
henry_20166 小时前
让 AI 编程助手拥有“记忆“:Mem0 OpenMemory MCP 部署到 K8s 全记录(踩坑 + 解决方案)
人工智能·ai·容器·kubernetes·kiro
翼龙云_cloud6 小时前
腾讯云代理商:云上 OpenClaw5 分钟接入 Slack 指南 AI 助手一键部署实战
服务器·人工智能·云计算·腾讯云·openclaw
AI医影跨模态组学6 小时前
Eur Radiol(IF=4.7)山西医科大学第一医院核磁影像科王效春等团队:基于Transformer增强型卷积神经网络的多中心MRI评估膀胱癌肌层浸润
人工智能·深度学习·论文·transformer·医学·医学影像
YuanDaima20486 小时前
大语言模型生命周期全链路解析:从架构基石到高效推理
开发语言·人工智能·python·语言模型·架构·transformer
Purple Coder6 小时前
AI预测超导材料论文素材
人工智能
K姐研究社6 小时前
TapNow Seedance 2.0实测:《牌子》《纸手机》AI制作全流程开源
人工智能·智能手机