如果让你设计一款遥感与时空数据平台,你会选择何种语言?
商业航天与遥感数据服务飞速发展,PB级多源异构时空数据的管理、发布、计算与应用成为行业核心难题。平台需要同时应对"多源、异构、海量、时空"的复杂特性,兼顾性能、自动化和灵活性。
常规做法是选择 Go 或 Java 与 C++ 组合------生态成熟,开发门槛低。
但数简选择了另一条路:Lua。
什么是Lua?
Lua是一种轻量级、可嵌入的脚本语言,由巴西的里约热内卢天主教大学的Roberto Ierusalimschy、Waldemar Celes和Luiz Henrique de Figueiredo于1993年开发。Lua的设计目的是为了提供一种灵活的扩展和定制功能,使得应用程序可以通过嵌入Lua代码来增加灵活性和可定制性。
作为一款"为嵌入而生"的脚本语言,Lua的特性完美契合"轻量、灵活、高效"的需求。
但同时,在众多知名编程语言中,lua可谓是一门独特的"小众"语言。它没有主流语言那样丰富的生态和各类现成框架,也没有形成面向通用业务的繁荣社区生态,始终保持着极简的原生形态,大量功能都需要开发者自己手动实现。
数简为何选择 Lua?
对于遥感与地理信息这类数据敏感、算法迭代快、需长期自主演进的平台,选择的技术语言需要让遥感与时空数据管理平台拥有对底层硬件和整体软件的高效和绝对控制、极致的运行时性能以及灵活的动态扩展能力,适合处理遥感时空领域的大规模、计算密集型任务。
而Lua是所有嵌入式脚本语言中性能天花板最高的语言之一:
-
原生 Lua 虚拟机极轻量、执行效率远超 Python/JavaScript/Ruby;
-
搭配 LuaJIT 后,性能接近 C 语言,是脚本语言里的性能天花板;
-
内存占用极低、启动超快,无冗余开销。
C++ 代码直接编译为机器指令,无虚拟机开销,可充分利用多核并行,实现零拷贝数据访问。C++与Lua结合,是"静"与"动"的协作 :**C++构筑高性能底层引擎,负责计算密集和硬件交互;Lua不仅是脚本的性能天花板,同时赋予上层业务灵活应变的能力。**这套组合让平台拥有对硬件的精准控制、极致性能,以及灵活的动态扩展能力。
综上,选择这条路的逻辑也变得很简单:Lua语言的性能天花板是无法突破的,它决定了整个系统的性能上限;而上述lua缺乏的功能和生态,是可以通过努力去获取和积累的。同时,在性能不敏感的场景,数简也引入 Python 作为补充,让不同语言各司其职,兼顾性能与功能平衡。
但也意味着重重技术攻坚。
做难而正确的事:Lua作为后台核心语言的攻坚战
**挑战一:基础设施"从零造轮子"。**作为小众语言,Lua没有成熟的生态------没有内置的HTTP服务器、数据库驱动,更没有微服务框架。要让Lua访问PostgreSQL或调用GDAL,团队必须自己编写绑定代码。这要求开发者精通C++系统级编程、Lua虚拟机运行机制、分布式系统和云原生基础设施。

图:数简基于lua构建了完全自主研发的拓展技术体系,包括关系数据映射引擎、微服务框架、基于MongoDB的语法规则拓展、基于BPMN2.0的工作流引擎等
**挑战二:并发与异步编程的复杂性。**遥感平台要求高吞吐、低延迟,C++后端必须采用异步非阻塞模型。但C++的异步编程远不如Go自然,如何设计Lua虚拟机池、如何在线程间安全传递任务,每一个决策都直接影响系统稳定性。
**挑战三:Lua语言"业务边界"把控。**Lua的轻量与极致性能是巨大优势,但也带来职责划分难题。把复杂业务全塞进Lua,脚本会臃肿难调;全写进C++,又会丧失灵活性。
一旦跨越这些挑战,平台就能实现对"自主可控"的坚实支撑,同时也让能在PB 级多源异构时空数据的管理、发布、处理、计算与应用中,发挥出独特的巨大优势。
让平台触及性能天花板,完全自主可控
极致的性能天花板
在数简平台底层,C++是搬运重物的"大力士",Lua是随时待命的轻快"调度员"。C++直接操作硬件,把几十GB的遥感影像从磁盘读到内存后直接交给计算单元,全程无中间层开销。Lua通过即时编译让用户的每一次检索、地图缩放都能被快速响应,且支持热更新------新增算法或调整渲染配色,无需停服务即可生效。
这套组合在真实场景中得到验证:平台管理35PB历史影像和每日20TB新增数据,每天处理约3000景卫星影像,从入库到发布全程自动完成。面向50万用户提供服务时,C++处理高并发瓦片请求,Lua灵活应对权限校验和计量需求。

图:数简遥感应用平台,前端用户检索数据,可实现实时RPC动态校正。
对海量时空数据中心而言,这套路线的价值在于:同样的硬件装更多数据、跑更快计算;新业务上线快,算法调整无需停服务;数据流清晰可控。
完全自主可控,深度数据安全
成熟的生态意味着便利,也意味着对第三方代码的依赖。Lua的生态缺失让数简从零构建了大量中间层代码------这段"造轮子"的经历,让平台核心代码全部自主可控。
对于遥感影像、地理信息等这类国家关键战略数据资源,当每一行网络传输代码都是自己编写,数据从磁盘到网络包的全路径都清晰可见、可审计、可干预,这意味着平台能精确控制数据流向。
数简平台目前已适配飞腾、鲲鹏、龙芯等国产芯片,支持中标麒麟、深度Linux等国产操作系统,符合等保三级要求,全链路自主可控。
实时自动数据处理流程,支撑业务高速发展
基于Lua的热更新、接近原生的性能、极致轻量,数简构建了高度可扩展的自动化数据处理流程,将遥感数据处理的复杂步骤------从原始数据解析、几何校正、匀光匀色,到瓦片生成、服务发布------拆解为可配置的处理单元。这些单元由C++引擎高效执行,Lua脚本负责定义处理顺序和异常处理。整个流水线可根据业务需求灵活调整,无需修改底层代码。
典型案例是遥感数据初级标准产品的全自动生产。从Level 1A数据包到DOM成品,传统流程需要人工干预多个环节。数简平台通过Lua脚本整合为全自动流水线:数据入库触发脚本,依次调用解压、校正、匀色算法,最终生成高质量DOM产品并自动发布为服务。原本数小时的工作,平台快速自动完成。
智能时空:自动化空间数据流计算
遥感领域的基础库------GDAL、PROJ、OpenCV等------几乎都是C/C++编写。数简直接用C++调用它们,避免跨语言调用带来的性能损耗,同时进行二次封装,Lua则通过C++ API调用这些功能。这种"C++做重活,Lua做编排"的模式,既保留了底层库的极致性能,又让上层逻辑保持灵活。当需要GPU加速的AI推理时,C++层直接接管硬件指令,Lua层只需触发任务并获取结果。
基于这一底层能力,数简打造了智能分析基础平台 (算法模组部署与管理)和流程控制基础平台(算法单元串接成流水线)。两者结合,再与数据管理、服务发布等模块串联,构成完整的数据流机制:原始数据接入后自动触发预设流程,依次调用算法模组,最终成果直接发布为服务或推送至业务系统。
下图:数简算法库与时空数据流定制自动化智能处理计算模式


这一机制在智慧水利案例中得到验证。多源卫星影像到达平台后,自动触发Lua编排脚本,依次调用解压缩、几何校正、AI解译模型,直接输出洪水淹没范围等解译成果,推送至流域防洪调度系统。全过程自动化,已在长江流域、天津、西藏等多地重点水利项目落地。

对于遥感与时空数据应用,这套架构的价值在于:数据从原始状态到最终成果的每一步,都被封装成可编排、可复用的"积木块"。无论是新增算法、调整处理顺序,还是接入新数据源,都只需在流程层面修改配置,无需动底层代码。遥感以及更广泛的数据,都能真正变成"可编程的流",在自动化流水线中高效流转、按需产出,管理者只需无感获得支持决策的信息------这也代表了政企大数据构建高效智慧应用的未来。