爬虫,传统编程与提示词工程的碰撞

一初始AIGC

AIGC即AI Generated Content。这就是利用AI技术生成的内容:

  1. 文本生成:可以用于自动生成新闻报道、广告文案、产品描述等。

  2. 图像生成:可以用于自动生成图像素材、艺术创作、设计等。

  3. 音频生成:可以用于自动生成音乐、电台广播等。

  4. 视频生成:可以用于自动生成视频剪辑、电影预告片等。

又称生成式AI,被认为是继专业生产内容(PGC)、用户生产内容(UGC)之后的新型内容创作方式。互联网内容生产方式经历了PGC------UGC------AIGC的过程。

AIGC已经成为从AI 1.0到AI 2.0演变的一个关键标志,代表着从基本的计算和感知智能向更复杂的认知能力迈进。它整合了多个技术领域,并利用多模态技术来产生更具多样性和强大性的内容。通过从大量数据集中学习,AI模型可以被微调以执行跨不同领域的任务,展示出类似人类认知的理解和生成内容的能力。

AIGC的应用跨越各个行业,包括新闻媒体、广告、游戏、教育、数字营销、短视频制作等。它不仅在短期内转变了基本的生产工具,还有潜力在中期重塑社会生产关系,并在长期内引发全球生产率的质的突破。AIGC突显了数据作为数字时代核心资源的重要性,加速了社会的数字化转型。

总之,AIGC标志着人工智能技术中的一波变革浪潮,自动化内容创作,影响着我们如何生产、消费和与数字媒体互动,可能改变内容驱动型行业和经济的本质。

二为什么要学习AIGC

这就是今天的主题了:爬虫,传统编程与提示词工程的碰撞。接下来我们就用简单的爬虫示例来向大家展示:传统编程与提示词工程的区别。

传统编程:

传统编程通常指的是使用静态编程语言(如C、Java、Python等)按照既定逻辑编写代码的过程。它强调结构化或面向对象的设计思想,通过算法和数据结构解决具体问题。在处理爬虫任务时,传统编程用来实现网页的请求、解析、数据存储等核心功能,以及异常处理、日志记录等辅助功能。它要求开发者具备扎实的编程基础和对目标网站结构的深入理解。

比如我们要爬取一段电影网站的电影信息,传统的代码实现是这样的:

l 发出一个http请求 html 字符串

l 对字符串做正则/伪代码

  • 聚焦 .article movies 列表

  • table 列表 电影列表

  • title pic。。。。

得到电影列表JSON数组[{name:'',pic:'',desc:'',score:3.5},]

大概代码是类似于这样的:

手敲这么多代码既费时又费力。反观提示词工程就运用上了AIGC。

提示词工程:

提示词工程(Prompt Engineering)是近年来随着大模型(如GPT系列)的兴起而发展起来的一个概念,特别是在自然语言处理和人工智能生成内容(AIGC)领域。它涉及设计高效、精准的输入指令(即"提示词"),以引导这些模型生成高质量、符合特定需求的输出。在某些场景下,提示词工程可以被应用于优化爬虫的任务指令,比如通过精确构建查询语句来指导爬虫更有效地搜索和筛选信息。

上一段传统编程爬虫代码是那么多,而对于AIGC来说我们只需要在相应的页面找到相应的html代码给AIGC喂数据、告诉LLM它是什么、然后输入你要的东西、它在返回结构给你。

下面就是一段示例:

然后返回的结果与传统编程的结果都是:

这样对比就显得提示词工程是如此的轻松简单。

总结:

在传统编程与提示词工程的对比之中,传统编程繁琐的大量代码衬托出在AIGC辅助下的提示词工程的便利与简单,大大降低了技术难度。对于大量或重复性任务提示词工程能显著提高生产效率。但需注意的是AI生成的内容依赖于算法理解和解释提示词的方式,有时候可能偏离初衷,所以在提出指令是必须精确精准。随着人工智能的大爆发,我们正迎来数据分析的新时代,其中AIGC)的应用成为引领潮流的重要方向。现在,我们就要把握好这次机会,跟紧时代脚步,拥抱AIGC!

相关推荐
小李子呢021142 分钟前
前端八股Vue---Vue2和Vue3的区别,set up的用法
前端·javascript·vue.js
邂逅星河浪漫1 小时前
【银行内网开发-管理端】Vue管理端+Auth后台开发+Nginx配置+Linux部署(详细解析)
linux·javascript·css·vue.js·nginx·html·前后端联调
星空椰1 小时前
JavaScript 进阶基础:函数、作用域与常用技巧总结
开发语言·前端·javascript
奔跑的呱呱牛1 小时前
@giszhc/vue-page-motion:Vue3 路由动画怎么做才“丝滑”?(附在线示例)
前端·javascript·vue.js
gCode Teacher 格码致知3 小时前
Javascript提高:小数精度和随机数-由Deepseek产生
开发语言·javascript·ecmascript
冴羽5 小时前
请愿书:Node.js 核心代码不应该包含 AI 代码!
前端·javascript·node.js
mmmmm123425 小时前
深入 DOM 查询底层:HTMLCollection 动态原理与 querySelectorAll 静态快照解析
前端·javascript
淸湫5 小时前
前端JavaScript:数据类型、实例对象 、内置对象、构造函数之间的关系
javascript
别看我只是一直狼6 小时前
从观察者模式到 RxJS:让复杂的异步逻辑变得优雅又舒服
javascript
|晴 天|6 小时前
我如何用Vue 3打造一个现代化个人博客系统(性能提升52%)
前端·javascript·vue.js