爬虫,传统编程与提示词工程的碰撞

一初始AIGC

AIGC即AI Generated Content。这就是利用AI技术生成的内容:

  1. 文本生成:可以用于自动生成新闻报道、广告文案、产品描述等。

  2. 图像生成:可以用于自动生成图像素材、艺术创作、设计等。

  3. 音频生成:可以用于自动生成音乐、电台广播等。

  4. 视频生成:可以用于自动生成视频剪辑、电影预告片等。

又称生成式AI,被认为是继专业生产内容(PGC)、用户生产内容(UGC)之后的新型内容创作方式。互联网内容生产方式经历了PGC------UGC------AIGC的过程。

AIGC已经成为从AI 1.0到AI 2.0演变的一个关键标志,代表着从基本的计算和感知智能向更复杂的认知能力迈进。它整合了多个技术领域,并利用多模态技术来产生更具多样性和强大性的内容。通过从大量数据集中学习,AI模型可以被微调以执行跨不同领域的任务,展示出类似人类认知的理解和生成内容的能力。

AIGC的应用跨越各个行业,包括新闻媒体、广告、游戏、教育、数字营销、短视频制作等。它不仅在短期内转变了基本的生产工具,还有潜力在中期重塑社会生产关系,并在长期内引发全球生产率的质的突破。AIGC突显了数据作为数字时代核心资源的重要性,加速了社会的数字化转型。

总之,AIGC标志着人工智能技术中的一波变革浪潮,自动化内容创作,影响着我们如何生产、消费和与数字媒体互动,可能改变内容驱动型行业和经济的本质。

二为什么要学习AIGC

这就是今天的主题了:爬虫,传统编程与提示词工程的碰撞。接下来我们就用简单的爬虫示例来向大家展示:传统编程与提示词工程的区别。

传统编程:

传统编程通常指的是使用静态编程语言(如C、Java、Python等)按照既定逻辑编写代码的过程。它强调结构化或面向对象的设计思想,通过算法和数据结构解决具体问题。在处理爬虫任务时,传统编程用来实现网页的请求、解析、数据存储等核心功能,以及异常处理、日志记录等辅助功能。它要求开发者具备扎实的编程基础和对目标网站结构的深入理解。

比如我们要爬取一段电影网站的电影信息,传统的代码实现是这样的:

l 发出一个http请求 html 字符串

l 对字符串做正则/伪代码

  • 聚焦 .article movies 列表

  • table 列表 电影列表

  • title pic。。。。

得到电影列表JSON数组[{name:'',pic:'',desc:'',score:3.5},]

大概代码是类似于这样的:

手敲这么多代码既费时又费力。反观提示词工程就运用上了AIGC。

提示词工程:

提示词工程(Prompt Engineering)是近年来随着大模型(如GPT系列)的兴起而发展起来的一个概念,特别是在自然语言处理和人工智能生成内容(AIGC)领域。它涉及设计高效、精准的输入指令(即"提示词"),以引导这些模型生成高质量、符合特定需求的输出。在某些场景下,提示词工程可以被应用于优化爬虫的任务指令,比如通过精确构建查询语句来指导爬虫更有效地搜索和筛选信息。

上一段传统编程爬虫代码是那么多,而对于AIGC来说我们只需要在相应的页面找到相应的html代码给AIGC喂数据、告诉LLM它是什么、然后输入你要的东西、它在返回结构给你。

下面就是一段示例:

然后返回的结果与传统编程的结果都是:

这样对比就显得提示词工程是如此的轻松简单。

总结:

在传统编程与提示词工程的对比之中,传统编程繁琐的大量代码衬托出在AIGC辅助下的提示词工程的便利与简单,大大降低了技术难度。对于大量或重复性任务提示词工程能显著提高生产效率。但需注意的是AI生成的内容依赖于算法理解和解释提示词的方式,有时候可能偏离初衷,所以在提出指令是必须精确精准。随着人工智能的大爆发,我们正迎来数据分析的新时代,其中AIGC)的应用成为引领潮流的重要方向。现在,我们就要把握好这次机会,跟紧时代脚步,拥抱AIGC!

相关推荐
摘星编程21 分钟前
React Native + OpenHarmony:UniversalLink通用链接
javascript·react native·react.js
qq_1777673742 分钟前
React Native鸿蒙跨平台数据使用监控应用技术,通过setInterval每5秒更新一次数据使用情况和套餐使用情况,模拟了真实应用中的数据监控场景
开发语言·前端·javascript·react native·react.js·ecmascript·harmonyos
烬头88211 小时前
React Native鸿蒙跨平台应用实现了onCategoryPress等核心函数,用于处理用户交互和状态更新,通过计算已支出和剩余预算
前端·javascript·react native·react.js·ecmascript·交互·harmonyos
程序员清洒2 小时前
Flutter for OpenHarmony:Text — 文本显示与样式控制
开发语言·javascript·flutter
雨季6663 小时前
Flutter 三端应用实战:OpenHarmony 简易“动态内边距调节器”交互模式深度解析
javascript·flutter·ui·交互·dart
会飞的战斗鸡3 小时前
JS中的链表(含leetcode例题)
javascript·leetcode·链表
方也_arkling4 小时前
别名路径联想提示。@/统一文件路径的配置
前端·javascript
qq_177767374 小时前
React Native鸿蒙跨平台剧集管理应用实现,包含主应用组件、剧集列表、分类筛选、搜索排序等功能模块
javascript·react native·react.js·交互·harmonyos
qq_177767374 小时前
React Native鸿蒙跨平台自定义复选框组件,通过样式数组实现选中/未选中状态的样式切换,使用链式调用替代样式数组,实现状态驱动的样式变化
javascript·react native·react.js·架构·ecmascript·harmonyos·媒体
web打印社区4 小时前
web-print-pdf:突破浏览器限制,实现专业级Web静默打印
前端·javascript·vue.js·electron·html