左手 Serverless,右手 AI,7 年躬身的古籍修复之路

作者:宋杰

"AI 可以把我们思维体系当中,过度专业化、过度细分的这些所谓的知识都替代掉,让我们集中精力去体验自己的生命。我挺幸运的,代码能够有 AI 辅助,也能够有 Serverless 解决我的运营成本问题。Serverless 它是一个 Game Changer,就是彻底改变云计算模式的创新。 "

我叫宋杰,是一个上海人。从初级的程序员一直到做企业的架构工作,现在是在利用 IT 技术做古籍方面的开发与利用。

数字化对古籍有一个非常大的好处在于它的修复是异常高效的,传统的古籍修复对人才的要求门槛是很高的,但数字化就创造了另外一种可能。首先,修改相对简单,另外,它还可以做版本跟踪。 即便我这一次修复不成功,后面的人可以根据原始图片再次修改,让古籍资源能够充分地活化起来。

机缘巧合下,我承担了这个任务。

印藏项目源于香港的一位私人收藏者,他收藏了历朝历代的印谱后把这些印谱的数字化版本,无偿的捐献给了复旦大学图书馆。

我第一次尝试着以 IIIF 对印藏项目进行大规模的呈现。在互联网这样可能产生极高流量波峰波谷的环境下,到底怎么去设计它的架构,才能既满足业务的需要,又比较经济呢?

阿里云提供的 Serverless 技术尤其是函数计算产品 ,对于整个项目帮助极大,它性价比相当的高,根据经验估算来说,每次收费基本上是等于单机开发的 10%。

其实像复旦大学印谱文献虚拟图书馆这样的网站,它的原始图像就有 3TB,近 50 万张图片,包括现在已经用 AI 识别的图片,整个运营费用一年下来也就几千元,而传统的方式一个月的话就要花费 2000 元左右。

原来大家做网站开发,第一考虑是要用什么 web 服务器,后端用什么数据库。但 Serverless 出现之后,已经把底层的这些操作系统、应用软件、容器编排全部抽象掉了。

对大多数程序员来说,需要解决的是领域问题。不用去关心下面的运维问题,只需要把精力投入在怎么解决业务问题上去。

在计算方面,Serverless 也彻底帮助我们做到了计算和存储分离,算力的估算方式就发生了变化。在 Serverless 的环境当中,我们只需要指定它的内存大小、运行时间,给到这两个参数就可以把算力定下来了。而且你能支配的总容量其实是没有上限的,让程序员能彻底集中精力做应用的事。

我现在做的项目,叫易图 IIIF 文化遗产图像解决方案,它是一个平台,可以说是对印藏项目的一般化。对于一些中小型的机构,甚至是个人收藏爱好者,他只要在网页上进行上传,就能够出现一个跟印藏一样的网站,这是我个人的创业项目。

"我的左手是 Serverless,右手是 AI"。 强人工智能是一定高度依赖于文化的,在某一个文化领域当中产生出符合文化与价值观、审美倾向,包括对世界的基本认知的一个智能的大模型。

要知道模型都挺大的,至少不能让我等 1 分钟才看到推理结果。阿里云通过函数计算来做 GPU 应用,并自研一套镜像快速部署方案,我的感受是体验非常流畅。同时整个过程是按需计费的,这对所有开发 AI 应用程序的程序员来说是一个福音,彻底让程序员能够集中精力做应用的事情。

我们迎来了开发者最好的时代。

古籍识别体验场景全新上线

中华古籍浩如烟海,对珍贵古籍进行保护、修复和活用,关乎中华文脉的延续和传承。随着数字技术不断成熟,古籍正走出"深闺高阁",资源会得到更有效利用。轻点鼠标、一键部署,儒家经典《论语》可逐页在线阅览,古籍还能实现繁体字和简体字转换等功能,让读者能查询、会阅读。

为了让更多人了解古籍修复,宋杰与阿里云函数计算团队合作,通过函数计算一键搭建古籍识别平台,排版形式既符合现代人的阅读习惯,又还原了古籍纸张的阅读美感。欢迎大家参与到古籍修复的活动中,让古籍更好地走进千家万户。

点击下方链接,参与古籍修复,用数字技术助力古籍活化。

https://developer.aliyun.com/topic/fcrepair

相关推荐
ZhengEnCi1 小时前
Q03-UI设计进阶技巧-让界面更高级的7个核心原则
人工智能
IT_陈寒2 小时前
React的这个渲染问题连官方文档都没说清楚
前端·人工智能·后端
不加辣椒3 小时前
第12章 工具调用与 Agent 提示工程
人工智能
用户1693176172663 小时前
前端给AI消息做日期分组与时间线
人工智能
i晟3 小时前
Claude Code Harness 深度拆解:从你敲回车到模型回复,中间发生了什么
人工智能
用户252736278144 小时前
【踩坑复盘】我在本地跑 RAG 知识库时踩了 5 个大坑,吐血整理避坑指南
人工智能
大模型真好玩4 小时前
LangChain DeepAgents 速通指南(九)—— 生产级智能体框架 DeepAgents Code 源码导读
人工智能·langchain·agent
用户018349301696 小时前
用Zustand管理AI多会话状态
人工智能
武子康9 小时前
调查研究-198 Agent 到底该记住什么?读懂《What Must Generalist Agents Remember?》
人工智能·openai·agent