Gemini 大升级!谷歌引爆程序员革命:编程只需一句话,不到 1 分钟

【新智元导读】谷歌 Gemini 再次重磅更新,直指协作和创意!推出了全新的 Canvas 功能,「动动嘴」就能完成原型设计,实时可视化代码输出。语音总结一句话文档变播客!此外,带来 Deep Research、协作方式等全新体验。

谷歌 Gemini 惊喜不断,再次迎来重磅更新!

之前,Gemini 陆续推出了原生图像处理,已被全网玩疯了。

此外,上周推出可免费体验的最新 Deep Research,个性化 AI 助手等功能。

这次,谷歌带来了无缝集成和实时预览的编程功能------Canvas。

今日深夜,谷歌 CEO 劈材,宣布 Gemini 引入全新的 Canvas、Audio Overview 新功能。

从今天起,在 Gemini 中,Audio Overview 首发支持英语,可将文档、幻灯片和 Deep Research 报告转化为播客;在 Canvas 中,可以快速生成项目原型,而且可以实时编辑。

更多语言的 Audio Overview,劈材表示也即将到来。

根据 Gemini 回答,目前免费用户可每月使用(大约)10 次 Deep Research,而高级用户每次可输出 1500 页文本。

网友 Rob 表示:这次谷歌 Gemini 更新是「人类思维的下一次进化的蓝图」。

60 秒上手体验 Canvas 编程

谷歌 Gemini 新功能好用不好用?

现在,在 Canvas 可以编写代码并可视化输出结果了。

网友 Ashutosh Shrivastava 不到 60 秒,搭建了 Stripe 仪表板。

以下视频,演示了他是如何做到的:

整个流程,从视频录制和编辑,也不过才接近 10 分钟!

这种速度,让网友坐不住了!

这次 Canvas 的另一大特点:可以预览可视化输出,所见即所得。

比如,可以制作简单的小游戏:

简单提示,对数据做可视化分析:

免费用户,也能使用 Gemini 构建小型 Web 应用程序并迭代代码。

这「动动嘴」就能编程,人类或许以后能真正地告别写代码。

Ashutosh Shrivastava 体验后表示:「谷歌 Gemini 的 Canvas 功能是对快速原型设计的颠覆。实时可视化代码输出,改变了我们对待(软件)开发的方式。」

Canvas 编程

Gemini 能简化编程和软件开发,像生成代码、调试、解释代码这些都不在话下。

现在有了 Canvas,把编程想法变成网页应用、Python 脚本、游戏、模拟程序等互动应用的可用原型的过程变得更顺畅了。

Canvas 能让开发者快速做出项目的初始可用版本,也便于学生快速掌握编程概念。

在这个过程中,Gemini 会和你一起,反复修改代码。

在 Canvas 里,能生成并预览 HTML/React 代码,还有其他网页应用原型,直观看到设计效果。

举个例子,要是想给网站做个邮件订阅表单,让 Gemini 生成表单的 HTML 代码,马上就能预览在网页应用里的样式和功能。

想改输入框,或者添加引导按钮,都很容易,改完马上就能看到新效果,还能跟别人分享成果。

Canvas 把整个编程流程简化了,用户能在一个地方专注于代码和设计的创建、编辑与分享,不用在好几个应用之间来回切换。

从今天起,Canvas 面向全球所有 Gemini 和高级订阅用户开放。在提示栏点 Canvas,就能开始创作啦。

Gemini 新增协作与创意玩法

Canvas 是一个超好用的互动空间,能帮你完善文档和代码;音频概览则能把文件变成有趣的播客式讨论。

Gemini 能帮你头脑风暴、深入调研,从今天开始,它能提供更多帮助,无论是实时编辑文档,还是依据你的想法编出可用的代码原型。

Canvas 是 Gemini 内的一个全新互动空间,旨在轻松创建、完善和分享作品。

只需在提示栏中选择「Canvas」,就能开始编写、编辑文档或代码,所做的更改会实时显示。

用它能轻松写出高质量初稿,Gemini 还会给修改建议,帮你快速完善内容。

要是想更新部分内容或者整篇稿子,用快速编辑工具,能轻松调整语气、篇幅和格式。比如,选中一段文字,让 Gemini 把它改得更简洁、正式或口语化。

不管是写演讲稿、改论文、创作博客文章还是报告,Canvas 都能让你创意满满,高效产出。

Canvas 旨在与 Gemini 无缝协作。要是想和别人一起完善刚做的内容,点一下就能把文件导出到 Google Docs。

音频概览,让文件「开口说话」

NotebookLM 里的音频概览功能超受欢迎,能帮大家理解复杂信息。现在,Gemini 也有这个功能了!

音频概览能把文档、幻灯片,甚至深度研究报告,变成有意思的播客式讨论。

Gemini 会让两个 AI 主持人来一场播客对话,点一下,他们就会根据你上传的文件,深入聊起来。主持人会总结内容,把不同主题联系起来,你一言我一语,还会给出独特观点。

音频概览让学习变得又有趣又高效。

用户可以上传课堂笔记、研究论文、长长的邮件对话记录,或者深度研究生成的报告,生成音频概览,出门在外也能听,快速了解文件要点。

音频概览今天开始向全球 Gemini 和 Gemini 高级订阅用户推出英文版本,其他语言版本即将推出。

要生成音频概览,上传各种主题的文档或幻灯片,点提示栏上面弹出的建议图标就行。

用户能听这些人工智能生成的讨论,获取新观点,随时掌握信息,就算同时干好几件事也不耽误。

音频概览在网页和 Gemini 移动应用上都能用,还能轻松分享或下载,方便出门听。

参考资料:

blog.google/products/ge...

x.com/GeminiApp/s...

相关推荐
LitchiCheng2 分钟前
DQN 玩 2048 实战|第二期!设计 ε 贪心策略神经网络,简单训练一下吧!
人工智能·深度学习·神经网络
tortorish11 分钟前
PyTorch中Batch Normalization1d的实现与手动验证
人工智能·pytorch·batch
wwwzhouhui18 分钟前
dify案例分享-儿童故事绘本语音播报视频工作流
人工智能·音视频·语音识别
南太湖小蚂蚁1 小时前
自然语言处理入门4——RNN
人工智能·rnn·深度学习·自然语言处理
Ronin-Lotus1 小时前
深度学习篇---分类任务图像预处理&模型训练
人工智能·python·深度学习·机器学习·分类·模型训练·分类任务
四口鲸鱼爱吃盐1 小时前
CVPR2025 | TAPT:用于视觉语言模型鲁棒推理的测试时对抗提示调整
网络·人工智能·深度学习·机器学习·语言模型·自然语言处理·对抗样本
沈二到不行1 小时前
多头注意力&位置编码:完型填空任务
人工智能·后端·deepseek
朱剑君1 小时前
机器学习概要
人工智能·机器学习
千亿的星空2 小时前
部队仓储信息化手段建设:基于RFID、IWMS、RCS三大技术的仓储物流全链路效能优化方案
大数据·人工智能·信息可视化·信息与通信·数据库开发·可信计算技术
猫先生Mr.Mao2 小时前
2025年2月AGI技术月评|重构创作边界:从视频生成革命到多模态生态的全面爆发
人工智能·大模型·aigc·agi·多模态·行业洞察