UniScientist：30B开源科研大模型突破，重构AI自主研究范式

UniPat AI 推出 30B 参数量开源科研大模型 UniScientist，突破科研大模型 "只写报告不做研究" 的行业痛点，以统一范式搭建通用科研智能，实现 "提出假设 - 收集证据 - 可复现推导 - 迭代验证" 的全流程科研闭环，性能匹敌甚至超越参数量大一个数量级的顶尖闭源模型，为 AI 科研落地提供关键参考。

UniScientist核心价值在于将 AI 建模为动态系统，通过自主数据引擎将开放式科研难题转化为可验证 "单元测试"，让科研智能实现可训练、可评估、可迭代，真正具备自主科学研究能力。

在训练数据构建上，模型破解人工标注成本高、纯合成数据质量低的双重瓶颈。创新采用 "大模型生成 + 人类专家验证" 分工模式，由模型跨学科批量生成研究问题与解法草案，人类专家负责高精度核验，打造进化式多学科合成数据引擎。目前已产出超 4700 个研究级实例，覆盖 50 + 学科、400 + 研究方向，每个实例配套 20 + 项评测标准，专家单样本标注仅需 1-2 小时，兼顾数据广度与精度。

在技术架构上，UniScientist 聚焦主动证据整合与模型溯因两大核心操作，构建三大核心组件实现科研智能化：一是人智协同的进化式多学科合成，规模化生成多学科研究问题及多维校验评测标准；二是智能体研究循环，集成学术检索、代码解释器等工具，完成 "获取证据 - 推导结论 - 更新假说" 迭代；三是报告聚合，融合多份研究报告优势，实现研究质量自我进化。同时模型建立 "证据状态" 体系，将证据分为可核验、可推导两类，通过循环迭代形成严谨成果，并用原子化检查项保障研究可复现性。

评测数据验证了模型硬核实力：UniScientist-30B-A3B 在 FrontierScience-Research 榜单斩获 28.3 分，超越 Claude Opus 4.5、GPT-5.2 xhigh 等模型，成果聚合模式下得分升至 33.3；FrontierScience-Olympiad 工具启用后得分 71.0，与 Claude Opus 4.5 持平，在 DeepResearch Bench 等基准中与顶级闭源模型实力相当。即便无工具辅助，模型推理能力仍显著提升，实现检索、推导、验证、写作全流程协同。

目前该模型已完全开源，支持本地部署、推理及结果聚合，需搭配 Serper 等 API 密钥使用，同时发布了权威基准的完整推理轨迹。现阶段其核心能力聚焦可复现推理与仿真计算，暂未覆盖真实世界研究资源调度；未来将拓展至开放真实实验场景，实现对真实实验、计算基础设施的受控执行，持续推动 AI 加速科学发现。作为轻量化开源科研模型，UniScientist 既为科研领域提供高效工具，也为大模型从 "文本生成" 向 "实际问题解决" 转型提供重要路径。

GitHub：https://github.com/UniPat-AI/UniScientist