人工智能将原本需要数月的镜头设计工作缩短为一天

KAUST(阿卜杜拉国王科技大学)研究人员的 DeepLens 方法可自动设计复杂的透镜系统,将设计过程从数月缩短到一天,并有可能扩展到混合光学系统。一种用于设计成像系统中光学镜头的自动计算方法,有可能在没有人工参与的情况下实现最佳解决方案,从而大大减少通常所需的时间和费用。这一进步可提高手机摄像头的质量或创新功能。

DeepLens 设计方法在创建经典光学设计和扩展景深计算透镜方面都非常有效。资料来源:2024 KAUST; Heno Hwang

DeepLens 设计方法由KAUST的杨新阁、傅强和沃尔夫冈-海德里希开发,基于"课程学习"的概念,采用结构化、迭代、分阶段的方法,考虑成像系统的关键参数,如分辨率、光圈和视场。

人工智能系统和人类一样,很难在没有指导的情况下从头开始学习复杂的任务。例如,人类要先学会爬、站、走,然后才能最终学会跳、跳舞或运动。同样,课程学习将复杂的任务(这里指的是复杂镜头系统的设计)分解成复杂度不断增加的各个阶段,逐步提高对分辨率、光圈大小和视野的要求。

重要的是,该方案不需要以人类设计为起点。相反,它可以完全自行设计一个复合光学系统,该系统由多个折射透镜元件组成,每个元件都有自己定制的形状和特性,以提供最佳的整体性能。

传统的自动化方法只能对现有设计进行微小的优化,"杨新阁评论说。"我们的方法可以从一开始就优化复杂的透镜设计,将经验丰富的工程师数月的手工工作大幅减少到一天的计算时间。"

这种方法已被证明在创建经典光学设计和扩展景深计算透镜方面非常有效。这是在手机大小的外形尺寸中,利用具有高非球面和短后焦距的透镜元件实现的大视场。它还在六元件经典成像系统中进行了测试,分析了其设计和光学性能的演变,因为它调整了设计以满足设计规范。

"我们的方法专门针对多元素折射透镜的设计,这种透镜在从显微镜到手机摄像头和望远镜等设备中都很常见。预计涉及移动设备摄像头设计的公司会对此产生浓厚兴趣,因为在这些设备中,由于硬件限制,必须通过计算辅助才能获得最佳图像质量。我们的方法在管理光学元件和计算元件之间复杂的相互作用方面表现出色。"

目前,DeepLens 方法仅适用于折射透镜元件,但团队表示,目前正在努力将该方案扩展到将折射透镜与衍射光学元件和金属透镜相结合的混合光学系统。这将进一步实现成像系统的微型化,并释放出新的功能,如光谱相机和联合彩色深度成像。

Github: https://github.com/singer-yang/DeepLens

如果您在研究中使用了DeeoLens,请引用相应的论文:

  • TCI 2022 dO: A differentiable engine for deep lens design of computational imaging systems. Paper, BibTex
  • NatComm 2024 Curriculum Learning for ab initio Deep Learned Refractive Optics. Paper, BibTex
  • Arxiv 2024 End-to-End Hybrid Refractive-Diffractive Lens Design with Differentiable Ray-Wave Model. Paper, BibTex

感谢大家花时间阅读我的文章,你们的支持是我不断前进的动力。期望未来能为大家带来更多有价值的内容,请多多关注我的动态!

相关推荐
沉默王二1 小时前
胡彦斌搞的 APP 上架了,这完成度,多少程序员都弄不出来啊。
人工智能·ai编程
kirk_wang1 小时前
Agent Plan:从“模型订阅“到“Agent能力订阅“,火山引擎如何重新定义AI Agent开发范式
人工智能·火山引擎·agent plan
云和数据.ChenGuang1 小时前
深度学习在鲲鹏HPC下的学习
人工智能·深度学习·学习·机器学习·数据挖掘
百度Geek说1 小时前
电商搜索H1提升AI-Coding质量实践 RD & QA
人工智能
学习要积极1 小时前
Spring AI Alibaba-ChatClient
java·人工智能·spring
MartinYeung51 小时前
[论文学习]使用使用者层级差分隐私(User-Level DP)微调大型语言模型(LLM)
人工智能·学习·语言模型
财经资讯数据_灵砚智能1 小时前
基于全球经济类多源新闻的NLP情感分析与数据可视化(夜间-次晨)2026年5月29日
人工智能·python·信息可视化·自然语言处理·ai编程
智慧景区与市集主理人1 小时前
巨有科技联营分账系统|多业态统一管控,破解景区分账结算难题
大数据·人工智能·科技
触底反弹1 小时前
从数据结构到 Prompt 设计:前端工程师的 AI 时代进阶指南
javascript·人工智能·python
好好风格1 小时前
这个开源项目,把本地大模型做成会说话的 Live2D 桌宠
人工智能·python·开源