最近AI圈子里最亮眼的一道光,非支付宝(蚂蚁集团)这款新应用莫属了。我们都在关注大模型,关注各种文本生成、图片生成,但蚂蚁集团似乎又一次把目光投向了我们身边的现实世界。一款名为"灵光"的多模态AI应用,正悄然开启邀约内测,它带来的可能不仅仅是科技上的突破,更是我们与世界交互方式的又一次进化。
想象一下,你不再需要通过敲打键盘或语音助手来描述你的疑问。

核心功能:所见即所问,所问即所得
"灵光"最让人激动不已的,莫过于它内置的"AGI相机"功能。这可不是你手机里简单的扫一扫或者图片识别。蚂蚁集团给它赋予了更深层次的含义------"认知层的理解和场景分析"。
当你举起手机,通过"灵光"的AGI相机对准任何现实世界中的物体、场景或文字时,它不仅仅是识别出这是什么,更是试图去"读懂"你眼前所见的一切。路过一家店,拍个招牌就能问它历史、特色?看到一株不认识的植物,拍下来就能立刻获取详细信息?甚至当你面对一个复杂的机械结构,它也能尝试帮你理解其运行原理。这种"拍摄即问,实时回答"的体验,预示着一种全新的交互范式:AI不再是存在于屏幕另一端的"工具",而是与你并肩探索世界的"伙伴"。
除了令人惊叹的AGI相机,"灵光"还提供了一个同样实用的功能:"快速研究"。面对堆积如山的文件、冗长复杂的报告或深奥难懂的学术文章,它能迅速帮你整理出核心要点,抽丝剥茧,把复杂的概念清晰明了地呈现在你眼前。这对于学生、研究员以及任何需要高效获取信息的人来说,无疑是雪中送炭。

并非昙花一现:蚂蚁的深谋远虑
"灵光"的出现,绝非偶然。这背后是蚂蚁集团在多模态AI领域长期的技术积累和坚定的战略布局。早在今年5月,他们就推出了Ming-Lite-omni-Preview模型,据称是全球首个在模态支持能力上可媲美GPT-4o的开源模型。这强大的技术底座,正是"灵光"得以实现其认知级多模态能力的关键。
更值得关注的是,在蚂蚁集团"AI First"的宏大战略指引下,今年3月新任CEO上任后便设立了AGI部门,由CTO何征宇亲自挂帅。这表明蚂蚁对通用人工智能的投入是重量级的,并非玩票。而"灵光"作为继支小宝、安诊儿、AQ之后的第四款独立AI应用,无疑是这一战略的重要里程碑,也彰显了他们将AI能力从后台推向用户前台的决心。它不仅仅是一个新产品,更是蚂蚁集团构建"支付宝双飞轮"生态、乃至加速全球化进程中不可或缺的一环。

开启内测:未来已来,触手可及?
目前,"灵光"已在国内部分应用商店(如腾讯应用宝、vivo应用商店)悄然上线,并开启了邀约内测。用户可以通过手机号或支付宝账号直接登录体验。虽然官方目前还没有大张旗鼓地敲锣打鼓宣布,但这种低调的内测方式,往往预示着产品在技术和体验上已经具备了一定的成熟度。
可以预见的是,"灵光"的登场,将与市面上已有的"元宝"、"豆包"等App在图片识别乃至多模态交互领域展开一场精彩的较量。但蚂蚁集团似乎更侧重于"认知层"的深度,试图让AI真正理解我们所看到的世界,而不仅仅是识别。
如果你有机会参与内测,不妨去体验一下"灵光"的AGI相机功能,感受一下AI如何以更自然、更直观的方式,为你开启一个全新的信息获取和世界探索的窗口。我们拭目以待,这款"灵光"能否真正点亮我们的数字生活。
如果你也对最新的AI信息感兴趣或者有疑问 都可以加入我的大家庭 第一时间分享最新AI资讯、工具、教程、文档 欢迎你的加入!!!😉😉😉
公众号:墨风如雪小站