🍁 展望:如果文章对您有帮助,帮忙点个赞。关注我, AI学习之旅上,我与您一同成长!
一、前言
2023年9月,ChatGPT开启了多模态之旅,那时候我已经为之震撼。当时,我就已经在畅想怎么进行垫图,进行实时查询数据来生成图片等一系列多模态互相结合的场景。
果不其然,现在ChatGPT 又将迎来一次全新升级 ,用户现在可以直接上传文件,无论是PDF文档还是各种数据文件。更让人振奋的是,我们无需再频繁切换各种模式,如联网浏览、Dall-E生成图像、代码解释器或其他插件。现在,新版本将这些强大的功能融合到一起,为用户提供了一个统一而高效的操作体验,开启无尽的创造力和可能性。
在这篇文章中,我们将深入探讨一些由 已经拿到内测账号的体验者提供的实际应用场景,并对其进行解读。同时,我还会预测未来可能的使用场景,帮助大家更好地理解和使用即将更新的ChatGPT。
二、垫图
网友提供的案例中上传了一张水豚图片,并要求ChatGPT修改成动画风格。
心心念念的垫图功能终于来了。这样可以根据需求修改照片,从而满足大量图片优化的场景。一旦新版本发布,如果只是用到文章配图,或者使用相对简单绘画场景的朋友们,感觉真的可以放弃MJ会员了。
三、合并图片
案例中将 滑板 、水豚 进行图片合并。
以及,将 穿着羽绒服的教皇 、水豚 进行图片合并。
之前利用MJ玩儿童绘本的时候,当一张图片里出现多个人物时,他们的样子总会有很大几率长的差不多,即不同主体之间会造成相互污染, 如下图。
现在新版本升级后,就可以独立生成人物,并将他们合并在一起,从而解决前面提及的问题。
下图中要求生成熊、兔子、狐狸的三只小动物,结果很多次生成的结果都是存在 主体相互污染 的情况。
四、联网生成图片
下图中网友查询了 美国丹佛 的天气,并生成了一张以丹佛地形为背景的天气预报图片。
这个场景,主要说明新版本可以通过联网查询对应地点的实时信息,并根据信息生成图片,即时性 的优势不言而喻。那么,未来会有更多的场景因此诞生:
- 旅游规划:用户可以询问某个旅游地点的实时天气、交通人流等情况,并获得图像化的反馈。
- 市场分析:企业用户可以查询某个地区最近一段时间的经济数据或商业活动情况,并获得可视化的数据分析。
- 文章写作:文章作者可以利用实时数据转换后的图片、图表进行即兴创作,让文章内容更具真实性。
需要注意的是,联网查询可能会遭遇虚假或误导信息。
五、根据历史数据预测未来
本场景中预测了明年飓风最有可能出现在什么位置,最后生成一张明年飓风可能出现所在位置的地球云图。
该场景主要是利用历史数据来推测未来可能发生的事件, 并通过可视化来呈现。我相信未来会存在其他的应用场景:
- 股市预测:投资者可以查询某只股票的未来走势预测,并通过图像形式得到未来的趋势图。
- 气候预测:根据过去的天气数据,预测未来的气候情况,为农业、旅游等行业提供参考。
- 销售预测:商家可以预测未来的销售趋势,帮助他们更好地制定销售策略。
- 流行趋势分析:例如,时尚行业可以预测未来的流行趋势,设计出更受欢迎的产品。
当然,任何预测都存在不确定性,依赖不准确的预测可能会导致错误的决策。并且,如果历史数据存在偏见,那么预测的结果也可能会受到影响。
六、上传文档进行聊天
新版本里可以支持上传PDF等格式文件,并针对文件进行提问,从而快速进行检索和分析。
这个功能一出来, ChatPDF,ChatPAN 等工具将存在被完全取代的可能性。针对长篇幅的文件,用户无需自己浏览全文,可以直接提问,迅速获取答案,可以极大的提高用户收集信息的效率。常规的使用场景如下:
- 学术研究:研究者可以上传学术文章或报告,针对特定的数据或结论提问。
- 企业报告分析:企业员工上传年度报告或市场研究报告,迅速获取关键数据或结论。
- 合同审查:律师或企业可以上传合同,询问合同中的特定条款或内容。
- 教育辅导:学生上传教材或复习资料,询问关于某一部分的问题。
为了最大化这个功能的优势并减少潜在的 信息安全问题 ,以及 答案生成不准确 的风险,用户在使用时应确保上传的文件不含敏感信息,并结合自己的判断对AI给出的答案进行评估。
七、总结
随着ChatGPT的新进展,我们不仅感受到技术的巨大潜力,同时也应反思其带来的挑战。在享受便利的同时,我们真的了解AI在我们生活中的角色吗?每项进步都值得我们深入思考其背后的意义。