人工智能将原本需要数月的镜头设计工作缩短为一天

KAUST(阿卜杜拉国王科技大学)研究人员的 DeepLens 方法可自动设计复杂的透镜系统,将设计过程从数月缩短到一天,并有可能扩展到混合光学系统。一种用于设计成像系统中光学镜头的自动计算方法,有可能在没有人工参与的情况下实现最佳解决方案,从而大大减少通常所需的时间和费用。这一进步可提高手机摄像头的质量或创新功能。

DeepLens 设计方法在创建经典光学设计和扩展景深计算透镜方面都非常有效。资料来源:2024 KAUST; Heno Hwang

DeepLens 设计方法由KAUST的杨新阁、傅强和沃尔夫冈-海德里希开发,基于"课程学习"的概念,采用结构化、迭代、分阶段的方法,考虑成像系统的关键参数,如分辨率、光圈和视场。

人工智能系统和人类一样,很难在没有指导的情况下从头开始学习复杂的任务。例如,人类要先学会爬、站、走,然后才能最终学会跳、跳舞或运动。同样,课程学习将复杂的任务(这里指的是复杂镜头系统的设计)分解成复杂度不断增加的各个阶段,逐步提高对分辨率、光圈大小和视野的要求。

重要的是,该方案不需要以人类设计为起点。相反,它可以完全自行设计一个复合光学系统,该系统由多个折射透镜元件组成,每个元件都有自己定制的形状和特性,以提供最佳的整体性能。

传统的自动化方法只能对现有设计进行微小的优化,"杨新阁评论说。"我们的方法可以从一开始就优化复杂的透镜设计,将经验丰富的工程师数月的手工工作大幅减少到一天的计算时间。"

这种方法已被证明在创建经典光学设计和扩展景深计算透镜方面非常有效。这是在手机大小的外形尺寸中,利用具有高非球面和短后焦距的透镜元件实现的大视场。它还在六元件经典成像系统中进行了测试,分析了其设计和光学性能的演变,因为它调整了设计以满足设计规范。

"我们的方法专门针对多元素折射透镜的设计,这种透镜在从显微镜到手机摄像头和望远镜等设备中都很常见。预计涉及移动设备摄像头设计的公司会对此产生浓厚兴趣,因为在这些设备中,由于硬件限制,必须通过计算辅助才能获得最佳图像质量。我们的方法在管理光学元件和计算元件之间复杂的相互作用方面表现出色。"

目前,DeepLens 方法仅适用于折射透镜元件,但团队表示,目前正在努力将该方案扩展到将折射透镜与衍射光学元件和金属透镜相结合的混合光学系统。这将进一步实现成像系统的微型化,并释放出新的功能,如光谱相机和联合彩色深度成像。

Github: https://github.com/singer-yang/DeepLens

如果您在研究中使用了DeeoLens,请引用相应的论文:

  • TCI 2022\] dO: A differentiable engine for deep lens design of computational imaging systems. [Paper](https://ieeexplore.ieee.org/document/9919421), [BibTex](/singer-yang/DeepLens/blob/main/misc/do_bibtex.txt)

  • Arxiv 2024\] End-to-End Hybrid Refractive-Diffractive Lens Design with Differentiable Ray-Wave Model. [Paper](https://arxiv.org/abs/2406.00834), [BibTex](/singer-yang/DeepLens/blob/main/misc/hybridlens_bibtex.txt)

相关推荐
AAI机器之心2 小时前
这个RAG框架绝了:无论多少跳,LLM只调用两次,成本暴降
人工智能·python·ai·llm·agent·产品经理·rag
xixixi777772 小时前
安全嵌入全链路:从模型训练到智能体交互,通信网络是AI安全的“地基”
人工智能·安全·ai·多模态·数据·通信·合规
递归尽头是星辰2 小时前
Flink 四大基石:核心原理与实战速查
大数据·人工智能·flink·实时计算
1941s2 小时前
OpenClaw 每日新玩法 | NanoClaw —— 轻量级、安全的 OpenClaw 替代方案
人工智能·安全·agent·openclaw
攻城狮7号2 小时前
深度解析 GPT-5.4:从“聊天对话”到“原生全能数字员工”的技术演进
人工智能·openai·智能体·gpt-5.4
NAGNIP2 小时前
一文搞懂CNN经典架构-AlexNet!
人工智能·算法
Agent产品评测局2 小时前
企业 AI Agent 落地,如何保障数据安全与合规?——企业级智能体安全架构与合规路径深度盘点
人工智能·安全·ai·chatgpt·安全架构
Hello.Reader2 小时前
深度学习 三次浪潮、三大驱动力与神经科学的恩怨(二)
人工智能·深度学习
进击切图仔2 小时前
Docker + tmux + ROS:持久化的机器人开发环境
docker·容器·机器人
ggabb2 小时前
汉字破局:AI时代的文明反攻与英语世界的“偷师”真相
人工智能