火山引擎多模态数据湖落地深势科技,提升科研数据处理效能

深势科技是全球AI for Science开拓者,依托在交叉学科领域的深耕,构建了"深势·宇知"AI for Science大模型体系,并进一步解决科学研究和工业研发领域的关键问题,将众多学科的科研方法从"实验试错 / 计算机"时代带入了"预训练模型时代"。

基于AI for Science,深势科技打造了全球首个覆盖"读文献-做计算-做实验-多学科协同"的AI科研平台------玻尔,以全新升级的"科学导航( Science Navigator, SN )"为核心,让科学家们摆脱繁琐的信息搜索,把更多时间交给真正的科研。

玻尔正在重构科研流程、释放科研创造力。该平台以先进的人工智能技术为核心,系统性解决科研人员在文献筛选、跨学科知识发现及学术资源获取等环节 中的关键痛点,尤其有效应对了信息过载、检索繁杂、整理耗时等挑战。面向文献数量庞大、更新迅速、格式多样等现实问题;同时,这些文献数据表逾10万张,内容模态多元复杂,从英语、日语、德语的文本数据,到分子结构图、实验曲线图谱等非结构化视觉信息。玻尔为全球科研人员提供"一站式"的智能研究支持。

随着业务规模的快速扩张和数据复杂性的急剧提升,对高效、智能数据处理能力的需求也水涨船高。以往JSON文件、压缩文本等多种格式数据抵达时,技术团队常需为每种格式定制开发解析程序,耗时有数周之久;在大规模文献翻译任务中,确保图示、标注等关键信息的完整性和传递精度成为关键诉求;此外,文本与图像数据处于不同存储位置,实现高效的跨模态关联检索存在一定延迟,制约了知识库更新及行业报告的时效性。

为攻克这些技术难点,深势科技与火山引擎数智平台深度合作,融合火山引擎DataSail数据集成工具、AI数据湖服务LAS及火山方舟模型服务的核心能力。

在数据处理流程上,LAS的可视化操作界面提升了开发效率,技术团队得以将更多资源投入核心算法研发。通过数据清洗预处理与火山方舟模型服务的协同作用,整体翻译准确率提升约5%。在图片处理方面,调用大模型判断图片所属科学领域及关注内容,调用图片理解模型生成向量并回写,图片处理的效率及准确率也有所提升。

面向高峰业务场景,火山引擎提供了充沛的算力支持,通过按需调整的流量配额,保障了大流量下的系统稳定性。统一高效的数据处理体系,成功为海量科研信息架设起一条无缝流转的"信息动脉"。

当前,越来越多科研人员采用深势科技的产品实现海量文献的高效检索、管理与阅读,并利用平台专业工具提升科研效率。未来,火山引擎还将继续和深势科技携手,让科学家从繁琐的基础工作中解脱出来,以AI 技术释放科研创新潜能。

相关推荐
@insist1236 小时前
信息安全工程师考点精讲:身份认证核心原理与分类体系(上篇)
大数据·网络·分类·信息安全工程师·软件水平考试
天辛大师6 小时前
AI助力旅游扩大化,五一旅游公园通游年票普惠研究
大数据·启发式算法·旅游
WordPress学习笔记7 小时前
镌刻中式美学的高端WordPress主题
大数据·人工智能·wordpress
数智化精益手记局8 小时前
拆解物料管理erp系统的核心功能,看物料管理erp系统如何解决库存积压与缺料难题
大数据·网络·人工智能·安全·信息可视化·精益工程
Elastic 中国社区官方博客9 小时前
使用 Observability Migration Platform 将 Datadog 和 Grafana 的仪表板与告警迁移到 Kibana
大数据·elasticsearch·搜索引擎·信息可视化·全文检索·grafana·datalog
jkyy201410 小时前
AI运动数字化:以技术重塑场景,健康有益赋能全域运动健康管理
大数据·人工智能·健康医疗
金融小师妹10 小时前
4月30日多因子共振节点:鲍威尔“收官效应”与权力结构重塑的预期重构
大数据·人工智能·重构·逻辑回归
2601_9499251810 小时前
AI Agent如何重构跨境物流的决策?
大数据·人工智能·重构·ai agent·geo优化·物流科技
xiaoduo AI11 小时前
客服机器人问题解决率怎么统计?Agent系统自动判断是否解决,比人工回访准?
大数据·人工智能·机器人
小五兄弟12 小时前
YouTube 肖像检测扩展背后:短剧出海版权保护的技术实现与实战策略
大数据·人工智能