Gemini 大升级!谷歌引爆程序员革命:编程只需一句话,不到 1 分钟

【新智元导读】谷歌 Gemini 再次重磅更新,直指协作和创意!推出了全新的 Canvas 功能,「动动嘴」就能完成原型设计,实时可视化代码输出。语音总结一句话文档变播客!此外,带来 Deep Research、协作方式等全新体验。

谷歌 Gemini 惊喜不断,再次迎来重磅更新!

之前,Gemini 陆续推出了原生图像处理,已被全网玩疯了。

此外,上周推出可免费体验的最新 Deep Research,个性化 AI 助手等功能。

这次,谷歌带来了无缝集成和实时预览的编程功能------Canvas。

今日深夜,谷歌 CEO 劈材,宣布 Gemini 引入全新的 Canvas、Audio Overview 新功能。

从今天起,在 Gemini 中,Audio Overview 首发支持英语,可将文档、幻灯片和 Deep Research 报告转化为播客;在 Canvas 中,可以快速生成项目原型,而且可以实时编辑。

更多语言的 Audio Overview,劈材表示也即将到来。

根据 Gemini 回答,目前免费用户可每月使用(大约)10 次 Deep Research,而高级用户每次可输出 1500 页文本。

网友 Rob 表示:这次谷歌 Gemini 更新是「人类思维的下一次进化的蓝图」。

60 秒上手体验 Canvas 编程

谷歌 Gemini 新功能好用不好用?

现在,在 Canvas 可以编写代码并可视化输出结果了。

网友 Ashutosh Shrivastava 不到 60 秒,搭建了 Stripe 仪表板。

以下视频,演示了他是如何做到的:

整个流程,从视频录制和编辑,也不过才接近 10 分钟!

这种速度,让网友坐不住了!

这次 Canvas 的另一大特点:可以预览可视化输出,所见即所得。

比如,可以制作简单的小游戏:

简单提示,对数据做可视化分析:

免费用户,也能使用 Gemini 构建小型 Web 应用程序并迭代代码。

这「动动嘴」就能编程,人类或许以后能真正地告别写代码。

Ashutosh Shrivastava 体验后表示:「谷歌 Gemini 的 Canvas 功能是对快速原型设计的颠覆。实时可视化代码输出,改变了我们对待(软件)开发的方式。」

Canvas 编程

Gemini 能简化编程和软件开发,像生成代码、调试、解释代码这些都不在话下。

现在有了 Canvas,把编程想法变成网页应用、Python 脚本、游戏、模拟程序等互动应用的可用原型的过程变得更顺畅了。

Canvas 能让开发者快速做出项目的初始可用版本,也便于学生快速掌握编程概念。

在这个过程中,Gemini 会和你一起,反复修改代码。

在 Canvas 里,能生成并预览 HTML/React 代码,还有其他网页应用原型,直观看到设计效果。

举个例子,要是想给网站做个邮件订阅表单,让 Gemini 生成表单的 HTML 代码,马上就能预览在网页应用里的样式和功能。

想改输入框,或者添加引导按钮,都很容易,改完马上就能看到新效果,还能跟别人分享成果。

Canvas 把整个编程流程简化了,用户能在一个地方专注于代码和设计的创建、编辑与分享,不用在好几个应用之间来回切换。

从今天起,Canvas 面向全球所有 Gemini 和高级订阅用户开放。在提示栏点 Canvas,就能开始创作啦。

Gemini 新增协作与创意玩法

Canvas 是一个超好用的互动空间,能帮你完善文档和代码;音频概览则能把文件变成有趣的播客式讨论。

Gemini 能帮你头脑风暴、深入调研,从今天开始,它能提供更多帮助,无论是实时编辑文档,还是依据你的想法编出可用的代码原型。

Canvas 是 Gemini 内的一个全新互动空间,旨在轻松创建、完善和分享作品。

只需在提示栏中选择「Canvas」,就能开始编写、编辑文档或代码,所做的更改会实时显示。

用它能轻松写出高质量初稿,Gemini 还会给修改建议,帮你快速完善内容。

要是想更新部分内容或者整篇稿子,用快速编辑工具,能轻松调整语气、篇幅和格式。比如,选中一段文字,让 Gemini 把它改得更简洁、正式或口语化。

不管是写演讲稿、改论文、创作博客文章还是报告,Canvas 都能让你创意满满,高效产出。

Canvas 旨在与 Gemini 无缝协作。要是想和别人一起完善刚做的内容,点一下就能把文件导出到 Google Docs。

音频概览,让文件「开口说话」

NotebookLM 里的音频概览功能超受欢迎,能帮大家理解复杂信息。现在,Gemini 也有这个功能了!

音频概览能把文档、幻灯片,甚至深度研究报告,变成有意思的播客式讨论。

Gemini 会让两个 AI 主持人来一场播客对话,点一下,他们就会根据你上传的文件,深入聊起来。主持人会总结内容,把不同主题联系起来,你一言我一语,还会给出独特观点。

音频概览让学习变得又有趣又高效。

用户可以上传课堂笔记、研究论文、长长的邮件对话记录,或者深度研究生成的报告,生成音频概览,出门在外也能听,快速了解文件要点。

音频概览今天开始向全球 Gemini 和 Gemini 高级订阅用户推出英文版本,其他语言版本即将推出。

要生成音频概览,上传各种主题的文档或幻灯片,点提示栏上面弹出的建议图标就行。

用户能听这些人工智能生成的讨论,获取新观点,随时掌握信息,就算同时干好几件事也不耽误。

音频概览在网页和 Gemini 移动应用上都能用,还能轻松分享或下载,方便出门听。

参考资料:

blog.google/products/ge...

x.com/GeminiApp/s...

相关推荐
king of code porter几秒前
深度学习之模型压缩三驾马车:模型剪枝、模型量化、知识蒸馏
人工智能·深度学习·剪枝
前端小同学7 分钟前
【硬核开源mcp-chrome】一个chrome插件,能让任意chatbot接管你的chrome浏览器
前端·人工智能
NineData8 分钟前
NineData数据库DevOps功能全面支持百度智能云向量数据库 VectorDB
数据库·人工智能·mysql
空格的键盘9 分钟前
Vibe Coding 的必备工程能力
人工智能
Java中文社群23 分钟前
Dify实战案例:MySQL查询助手!嘎嘎好用
java·人工智能·后端
MYH51625 分钟前
拉力测试cuda pytorch 把 4070显卡拉满
人工智能·pytorch·python
某人辛木29 分钟前
基于tensorflow实现的猫狗识别
人工智能·python·tensorflow
大白爱琴32 分钟前
使用python进行图像处理—图像变换(6)
图像处理·人工智能·python
楽码1 小时前
AI信息论:处理繁杂问题
人工智能·openai·trae
技术便签1 小时前
第一篇:Agent2Agent (A2A) 协议——协作式人工智能的黎明
人工智能·python·ai编程·agi·多智能体·智能体·adk