一初始AIGC
AIGC即AI Generated Content。这就是利用AI技术生成的内容:
-
文本生成:可以用于自动生成新闻报道、广告文案、产品描述等。
-
图像生成:可以用于自动生成图像素材、艺术创作、设计等。
-
音频生成:可以用于自动生成音乐、电台广播等。
-
视频生成:可以用于自动生成视频剪辑、电影预告片等。
又称生成式AI,被认为是继专业生产内容(PGC)、用户生产内容(UGC)之后的新型内容创作方式。互联网内容生产方式经历了PGC------UGC------AIGC的过程。
AIGC已经成为从AI 1.0到AI 2.0演变的一个关键标志,代表着从基本的计算和感知智能向更复杂的认知能力迈进。它整合了多个技术领域,并利用多模态技术来产生更具多样性和强大性的内容。通过从大量数据集中学习,AI模型可以被微调以执行跨不同领域的任务,展示出类似人类认知的理解和生成内容的能力。
AIGC的应用跨越各个行业,包括新闻媒体、广告、游戏、教育、数字营销、短视频制作等。它不仅在短期内转变了基本的生产工具,还有潜力在中期重塑社会生产关系,并在长期内引发全球生产率的质的突破。AIGC突显了数据作为数字时代核心资源的重要性,加速了社会的数字化转型。
总之,AIGC标志着人工智能技术中的一波变革浪潮,自动化内容创作,影响着我们如何生产、消费和与数字媒体互动,可能改变内容驱动型行业和经济的本质。
二为什么要学习AIGC
这就是今天的主题了:爬虫,传统编程与提示词工程的碰撞。接下来我们就用简单的爬虫示例来向大家展示:传统编程与提示词工程的区别。
传统编程:
传统编程通常指的是使用静态编程语言(如C、Java、Python等)按照既定逻辑编写代码的过程。它强调结构化或面向对象的设计思想,通过算法和数据结构解决具体问题。在处理爬虫任务时,传统编程用来实现网页的请求、解析、数据存储等核心功能,以及异常处理、日志记录等辅助功能。它要求开发者具备扎实的编程基础和对目标网站结构的深入理解。
比如我们要爬取一段电影网站的电影信息,传统的代码实现是这样的:
l 发出一个http请求 html 字符串
l 对字符串做正则/伪代码
-
聚焦 .article movies 列表
-
table 列表 电影列表
-
title pic。。。。
得到电影列表JSON数组[{name:'',pic:'',desc:'',score:3.5},]
大概代码是类似于这样的:
手敲这么多代码既费时又费力。反观提示词工程就运用上了AIGC。
提示词工程:
提示词工程(Prompt Engineering)是近年来随着大模型(如GPT系列)的兴起而发展起来的一个概念,特别是在自然语言处理和人工智能生成内容(AIGC)领域。它涉及设计高效、精准的输入指令(即"提示词"),以引导这些模型生成高质量、符合特定需求的输出。在某些场景下,提示词工程可以被应用于优化爬虫的任务指令,比如通过精确构建查询语句来指导爬虫更有效地搜索和筛选信息。
上一段传统编程爬虫代码是那么多,而对于AIGC来说我们只需要在相应的页面找到相应的html代码给AIGC喂数据、告诉LLM它是什么、然后输入你要的东西、它在返回结构给你。
下面就是一段示例:
然后返回的结果与传统编程的结果都是:
这样对比就显得提示词工程是如此的轻松简单。
总结:
在传统编程与提示词工程的对比之中,传统编程繁琐的大量代码衬托出在AIGC辅助下的提示词工程的便利与简单,大大降低了技术难度。对于大量或重复性任务提示词工程能显著提高生产效率。但需注意的是AI生成的内容依赖于算法理解和解释提示词的方式,有时候可能偏离初衷,所以在提出指令是必须精确精准。随着人工智能的大爆发,我们正迎来数据分析的新时代,其中AIGC)的应用成为引领潮流的重要方向。现在,我们就要把握好这次机会,跟紧时代脚步,拥抱AIGC!