文章目录
- [1. 市场营销](#1. 市场营销)
-
- [1.1 Marketing(市场营销) 和 Advertising(广告) 的区别](#1.1 Marketing(市场营销) 和 Advertising(广告) 的区别)
- [1.2 市场营销的两大经典框架](#1.2 市场营销的两大经典框架)
-
- [1.2.1 营销漏斗(Marketing Funnels)](#1.2.1 营销漏斗(Marketing Funnels))
-
- [1.2.1.1 漏损就是浪费](#1.2.1.1 漏损就是浪费)
- [1.2.2 4P营销理论](#1.2.2 4P营销理论)
-
- [1.2.2.1 Product(产品)](#1.2.2.1 Product(产品))
- [1.2.2.2 Price(价格)](#1.2.2.2 Price(价格))
- [1.2.2.3 Place(渠道/地点)](#1.2.2.3 Place(渠道/地点))
- [1.2.2.4 Promotion(促销/推广)](#1.2.2.4 Promotion(促销/推广))
- [1.3 流量来源(Traffic Sources)](#1.3 流量来源(Traffic Sources))
- [2. SEO(搜索引擎优化)](#2. SEO(搜索引擎优化))
-
- [2.1 SEO(搜索引擎优化)和 SEM(搜索引擎营销)的区别](#2.1 SEO(搜索引擎优化)和 SEM(搜索引擎营销)的区别)
- [2.2 什么是搜索引擎(Search Engine)](#2.2 什么是搜索引擎(Search Engine))
- [2.3 倒排索引(Inverted Index)](#2.3 倒排索引(Inverted Index))
-
- [2.3.1 目录(Contents)和索引(Index)的区别](#2.3.1 目录(Contents)和索引(Index)的区别)
- [2.3.2 Yahoo(雅虎)](#2.3.2 Yahoo(雅虎))
- [2.3.3 中国互联网商业](#2.3.3 中国互联网商业)
- [2.3.4 为什么"分类目录"模式无法应对海量网站](#2.3.4 为什么"分类目录"模式无法应对海量网站)
- [2.3.5 PageRank 算法和 BackRub 项目](#2.3.5 PageRank 算法和 BackRub 项目)
- [2.4 搜索引擎(Search Engine)的三大核心工作流程](#2.4 搜索引擎(Search Engine)的三大核心工作流程)
-
- [2.4.1 搜索引擎建立倒排索引(Inverted Index)](#2.4.1 搜索引擎建立倒排索引(Inverted Index))
- [2.4.2 Elasticsearch](#2.4.2 Elasticsearch)
- [2.4.3 主流搜索引擎](#2.4.3 主流搜索引擎)
- [2.4.4 搜索引擎如何进行排名](#2.4.4 搜索引擎如何进行排名)
-
- [2.4.4.1 排名算法](#2.4.4.1 排名算法)
- [2.5 SEO(搜索引擎优化)的完整定义](#2.5 SEO(搜索引擎优化)的完整定义)
- [2.6 14条SEO实战技巧](#2.6 14条SEO实战技巧)
-
- [2.6.1 全面关键词研究](#2.6.1 全面关键词研究)
- [2.6.2 内容优化](#2.6.2 内容优化)
- [2.6.3 保持网站新鲜度](#2.6.3 保持网站新鲜度)
- [2.6.4 即时加载](#2.6.4 即时加载)
- [2.6.5 所有用户的无障碍访问](#2.6.5 所有用户的无障碍访问)
- [2.6.6 优化URL](#2.6.6 优化URL)
- [2.6.7 移动优先](#2.6.7 移动优先)
- [2.6.8 合理构建内容结构](#2.6.8 合理构建内容结构)
- [2.6.9 社交媒体](#2.6.9 社交媒体)
- [2.6.10 内部链接](#2.6.10 内部链接)
- [2.6.11 优化图片](#2.6.11 优化图片)
- [2.6.12 高质量外链](#2.6.12 高质量外链)
- [2.6.13 基于位置的结果](#2.6.13 基于位置的结果)
- [2.6.14 标签(Title Tags)和元描述(Meta Descriptions)](#2.6.14 标签(Title Tags)和元描述(Meta Descriptions))
- [2.7 SEO的多因素驱动](#2.7 SEO的多因素驱动)
- [2.8 SEO中不推荐的做法](#2.8 SEO中不推荐的做法)
- [2.9 新的网站没有被搜索引擎收录怎么办](#2.9 新的网站没有被搜索引擎收录怎么办)
- [2.10 每次访问都意味着金钱](#2.10 每次访问都意味着金钱)
- [3. SEM(搜索引擎营销)](#3. SEM(搜索引擎营销))
-
- [3.1 什么是SEM(搜索引擎营销)](#3.1 什么是SEM(搜索引擎营销))
-
- [3.1.1 什么是付费列表](#3.1.1 什么是付费列表)
- [3.2 SEM的形式](#3.2 SEM的形式)
- [3.3 Google的收入](#3.3 Google的收入)
- [4. 总结](#4. 总结)
-
- [4.1 漏斗模型](#4.1 漏斗模型)
- [4.2 相关指标](#4.2 相关指标)
-
- [4.2.1 网站流量的指标](#4.2.1 网站流量的指标)
- [4.2.2 SEO(搜索引擎优化)的指标](#4.2.2 SEO(搜索引擎优化)的指标)
- [4.2.3 用户参与度(Engagement)的指标](#4.2.3 用户参与度(Engagement)的指标)
- [4.2.4 转化指标(Conversion Metrics)](#4.2.4 转化指标(Conversion Metrics))
- [4.2.5 整体效果指标(Overall Metrics)](#4.2.5 整体效果指标(Overall Metrics))
- [4.3 GMV(商品交易总额)](#4.3 GMV(商品交易总额))
-
- [4.3.1 Gross Sales(总销售额)和 Net Sales(净销售额)的关键区别](#4.3.1 Gross Sales(总销售额)和 Net Sales(净销售额)的关键区别)
- [4.4 互联网的三个层次](#4.4 互联网的三个层次)
-
- [4.4.1 私有市场的搜索引擎](#4.4.1 私有市场的搜索引擎)
- [4.4.2 Robots.txt](#4.4.2 Robots.txt)
- [4.4.3 App 搜索](#4.4.3 App 搜索)
- [4.5 短视频营销(Short-Form Video Marketing)](#4.5 短视频营销(Short-Form Video Marketing))
- [4.6 AI 时代](#4.6 AI 时代)
1. 市场营销
1.1 Marketing(市场营销) 和 Advertising(广告) 的区别
广告只是市场营销的一个子集/组成部分,不是全部。

| MARKETING 市场营销 | ADVERTISING 广告 | |
|---|---|---|
| 过程 | 品牌奖章 → 精准目标人群 | 促销商品 → 购物车 |
| 核心目标 | 建立品牌价值 ,连接正确目标市场 | 影响/说服客户购买产品或服务 |
| 关注点 | 长期:品牌定位、客户关系、市场调研 | 短期:促销、转化、直接销售 |
| 范围 | 大(包含广告、公关、产品、定价、渠道等) | 小(只是营销的一个工具) |
下面给出例子。
| 场景 | 这是 Marketing | 这是 Advertising |
|---|---|---|
| 苹果发布会 | ✅ 整体品牌体验设计 | ❌ |
| 苹果官网"Shot on iPhone" campaign | ✅ 品牌价值观传递 | ✅ 也包含广告 |
| 天猫双11 banner"限时5折" | ❌ | ✅ 纯促销广告 |
| 星巴克营造"第三空间"氛围 | ✅ 品牌定位 | ❌ |
| 钉钉在腾讯大楼投"让工作回归工作"广告 | ✅ 战略级营销 (钉钉 = 专业办公,微信 = 业余聊天,直接攻击对手软肋,改变用户认知) | ✅ 战术级广告 |
1.2 市场营销的两大经典框架
市场营销的两大经典框架:营销漏斗和4P营销理论(经典营销组合)。
营销漏斗是从"消费者视角"出发:描述用户从知道到购买的完整心理路径。
4P营销理论是从"企业视角"出发:企业用这4个要素来设计营销策略。
1.2.1 营销漏斗(Marketing Funnels)
营销漏斗是一个可视化模型,描述潜在客户如何逐步从"知道品牌"变成"付费客户"。因为每个阶段人数逐渐减少,形状像漏斗。

这三个阶段如下所示。
| 阶段 | 中文 | 目标 | 关键指标 |
|---|---|---|---|
| Awareness | 认知/曝光 | 让新人知道你的品牌,产生兴趣 | 曝光量、触达人数(impressions & reach) |
| Consideration | 考虑/意向 | 让潜在客户考虑你而非竞争对手 | 网站点击、点击率(clicks & CTR) |
| Conversion | 转化/成交 | 促成最终购买或行动 | 总转化数、转化成本、ROI |
1.2.1.1 漏损就是浪费
营销漏斗中的"漏损"问题指潜在客户在进入漏斗后,在各个环节流失掉,导致营销投入白费。

少量流量引入然后又因为转化损漏导致客户又进一步流失,所以最后成交客户极少。
解决方案有两种:

| 方案 | 策略 | 说明 |
|---|---|---|
| Fix #1: More Leads | 加大流量投入 | 漏斗顶部开口更大,进入更多人 |
| Fix #2: Better Conversion | 提升转化率 | 堵住漏洞,让更多人流向底部 |
但是与其花大钱买更多流量,不如先修好漏斗别让客户溜走。
1.2.2 4P营销理论
| 元素 | 含义 | 例子 |
|---|---|---|
| Product 产品 | 卖什么?功能、质量、设计 | iPhone的iOS系统、摄像头 |
| Price 价格 | 卖多少钱?定价策略 | 高端定价vs性价比路线 |
| Place 渠道 | 在哪卖?分销渠道 | 直营店、电商平台、经销商 |
| Promotion 促销 | 怎么推广?传播沟通 | 广告、公关、折扣活动 |
1.2.2.1 Product(产品)
营销前必须搞清楚:
- 产品独特卖点是什么?(如仰望U8的应急浮水)
- 与竞品有何不同?
- 能否搭配互补产品?(如车+投影设备)
- 市场上有无替代品?(substitute products)
例子:仰望U8不卖"代步",卖"极端路况安全保障"------这是其他车没有的。
1.2.2.2 Price(价格)
定价要考虑:
- 成本:生产成本 + 营销成本 + 渠道成本
- 竞品价格:对手卖多少?
- 用户感知价值:价格是否是用户的合理选择(reasonable alternative)?
例子:仰望U8售价百万级,定价逻辑是"用技术稀缺性支撑高端价格",而不是性价比。
1.2.2.3 Place(渠道/地点)
这是关于分销渠道的决策。
| 渠道类型 | 说明 | 例子 |
|---|---|---|
| OFFLINE 线下 | 实体店铺销售 | 苹果直营店、超市货架、经销商门店 |
| ONLINE 线上 | 互联网销售 | 天猫、京东、品牌官网、抖音直播 |
| OMNI-CHANNEL 全渠道 | 线上线下结合 | 线上下单+线下提货、线下体验+线上购买 |
渠道决策要考虑:
线下(Storefront)
- 店铺位置选在哪?(商圈、人流量)
- 产品在店内怎么摆放?(货架位置、陈列方式)
- 是直营还是加盟?
线上(Digital)
- 在哪些平台卖?(淘宝、抖音、拼多多、独立站)
- 产品在平台上的展示位置?(搜索排名、推荐位、Banner)
- 物流配送怎么解决?
实际例子由下面的表格所示。
| 品牌 | Place策略 |
|---|---|
| 苹果 | 线下直营店(体验)+ 线上官网(便捷) |
| 完美日记 | 线上起家(小红书种草+天猫),后开线下店 |
| 特斯拉 | 直营模式,砍掉4S店,线上预订+线下体验中心 |
| 瑞幸咖啡 | 线上点单+线下自提/配送,没有传统门店座位区 |
1.2.2.4 Promotion(促销/推广)
Promotion是整合营销传播(IMC),包含:广告、销售、促销活动、公关、直销、赞助、游击营销等。
营销漏斗三阶段 + 对应推广策略如下表所示。
| 阶段 | 简称 | 目标 | 推广内容/渠道 |
|---|---|---|---|
| TOFU | Top of Funnel(漏斗顶部) | Awareness 认知 | 博客文章、网络研讨会、社交媒体、信息图、视频、播客、SEO、研究报告 |
| MOFU | Middle of Funnel(漏斗中部) | Evaluate 评估 | 付费广告、案例研究、社交媒体、邮件营销、优惠折扣、白皮书下载 |
| BOFU | Bottom of Funnel(漏斗底部) | Convert 转化 | 产品演示、销售资料、购物车、客户评价、产品规格表、竞品对比分析 |
有效的推广需要根据用户在漏斗中的位置,匹配不同的内容和渠道------而不是从头到尾只打一种广告。
1.3 流量来源(Traffic Sources)

流量来源有六大传统流量来源:
| 来源 | 图标 | 说明 | 例子 |
|---|---|---|---|
| Context Ads 上下文广告 | 🔍 | 根据内容匹配的广告 | 百度竞价、Google Ads |
| Blogging 博客 | 📝 | 内容营销引流 | 企业博客、Medium文章 |
| Social Networks 社交网络 | 👥 | 社交媒体流量 | 微信、微博、抖音、小红书 |
| SEO 搜索引擎优化 | ⚙️ | 自然搜索排名 | 百度搜索结果页 |
| Video Services 视频服务 | 📺 | 视频平台引流 | YouTube、B站、抖音视频 |
| Email Marketing 邮件营销 | 📧 | 邮件触达用户 | newsletter、促销邮件 |
这些都流向 Landing Page(落地页) ------ 用户最终到达的页面。
搜索引擎仍是核心流量来源(SEO/SEM),我们后面会详细叙述。
而AI正在成为新的流量入口 ------ 如ChatGPT推荐、AI搜索、智能助手导流。
2. SEO(搜索引擎优化)
2.1 SEO(搜索引擎优化)和 SEM(搜索引擎营销)的区别
| 缩写 | 全称 | 核心含义 |
|---|---|---|
| SEO | Search Engine Optimization | 自然/有机流量 ------ 不花钱,靠优化内容获得搜索排名 |
| SEM | Search Engine Marketing | 付费流量 ------ 花钱买广告位,立即见效 |

| 维度 | SEO(黄色) | 共同部分 | SEM(红色) |
|---|---|---|---|
| 性质 | ORGANIC 自然 | DRIVES TRAFFIC 都带来流量 | PAID 付费 |
| 效果 | LASTING EFFECT 持久 | INFORMS STRATEGY 都指导策略 | IMMEDIATE EFFECT 即时 |
| 目标 | IMPROVE BRAND LOYALTY/TRUST 提升品牌忠诚/信任 | SALES/LEADS FOCUSED 聚焦销售/线索 |
如图所示,搜索"apple iphone 13" 时:

绿色框 Paid = SEM付费广告(花钱买的顶部位置)
橙色框 Organic = SEO自然排名(靠内容质量获得)
因此下表可以规定两者的适用情形。
| 场景 | 选SEO | 选SEM |
|---|---|---|
| 新品牌急需曝光 | ❌ | ✅ |
| 预算有限,追求长期 | ✅ | ❌ |
| 竞争关键词难排名 | ❌ | ✅ |
| 建立行业权威 | ✅ | ❌ |
2.2 什么是搜索引擎(Search Engine)
搜索引擎是一个软件系统,用于找到与网络搜索匹配的网页。)
用户输入关键词,它帮用户找到相关信息。
搜索引擎就与在图书馆找书类似,搜索引擎寻找网页需要:
- 清晰的标题(像书名)
- 准确的标签(像分类号)
- 优质的内容(像书的内容质量)
搜索引擎就像一个超级图书馆管理员,帮我们从几十亿网页中快速找到你想要的那本书。
传统图书馆中我们可能会遇到分类系统的局限性。
例如我们现在不记得书名,但记得封面是红色的。
按传统分类系统,找"红色的书"是不可能的任务------ 红色封面可能分散在不同学科的书架上。
因此我们需要让搜索引擎比图书馆更聪明------它允许用户用任何记得住的特征来找信息,而不必知道标准分类号。
也就是好的搜索系统应该理解用户的"不完美记忆",而不是要求用户掌握完美分类。
细化为每一点那就是,优化时不能只考虑"标准分类",要覆盖:
- 视觉描述(红色、大图标、简洁设计)
- 场景描述(适合新手、快速上手)
- 口语化表达("那个红色的APP")
当然在图书馆找书这样的分类式寻找问题之后,出现了黄页------它是按行业分类查找商家电话。
这就是一种演变,用户不再按分类来找答案,而是按自己的问题和需求来搜索。就像2010年的时候还是流行百度知道,用户提出问题,下面有人进行回答,这种方式现在已经不再流行。
随着时代发展,我们更需要通过模糊信息找到目标内容。例如寻找歌曲的时候我们可能知道歌曲的片段而不知道歌名,这时候需要模糊搜索。
因此SEO要优化的是用户可能输入的各种模糊表达,而不只是标准术语。
2.3 倒排索引(Inverted Index)
倒排索引,是搜索引擎的核心技术原理,它帮助搜索引擎能快速找到网页。

过程如下。
| 步骤 | 说明 | 例子 |
|---|---|---|
| 1. 原始文档 | 收集所有网页/文档 | Doc1讲大象,Doc2讲数字世界,Doc3讲苹果... |
| 2. 过滤处理 | 去掉"Stop Words"停用词 | 去掉"a, and, is, the, we"等无意义词 |
| 3. 建立倒排索引 | 关键词 → 文档列表 | 记录每个词出现在哪些文档中 |
因此这个例子中的倒排索引如下。
| 关键词 | 包含该词的文档 |
|---|---|
| apple | 3, 5, 6 |
| australia | 1, 8 |
| digital | 2, 4, 8 |
| elephant | 1, 6 |
为什么叫"倒排"?
传统索引(正排):文档 → 包含哪些词
例如:Doc1: [wild, elephants, australia...]
倒排索引:词 → 出现在哪些文档
例如:apple: [Doc3, Doc5, Doc6]
elephant: [Doc1, Doc6]
因此用户通过倒排索引就可以通过歌词片段精准找到歌曲。
2.3.1 目录(Contents)和索引(Index)的区别
目录(Contents):帮助用户浏览、理解网站结构
索引(Index):帮助用户搜索、快速找到具体内容
详细对比如下。
| Contents 目录 | Index 索引 | |
|---|---|---|
| 目的 | 展示结构 | 快速定位 |
| 排序方式 | 逻辑顺序 | 字母顺序 |
| 使用场景 | "这本书讲什么?" | "量子力学在哪页?" |
| 网站对应 | 网站导航、分类 | 搜索引擎、站内搜索 |
在互联网时代,搜索引擎的索引比网站自己的目录更重要。现代用户找网站,几乎100%通过搜索引擎(索引),而不是记住网址或层层导航(目录)。
2.3.2 Yahoo(雅虎)

Yahoo(雅虎)是基于网络的目录/字典先驱的互联网目录式搜索的先驱。
因为Yahoo(雅虎)"坚持用'目录'思维做互联网,而用户想要的是'索引'思维",因此Google用索引技术超越了Yahoo(雅虎)。
2.3.3 中国互联网商业
中国黄页是中国版的网络商业目录,由1995年马云创办,是中国最早的互联网商业目录之一。
类似Yahoo,是目录式B2B信息平台,后来演变为阿里巴巴。、
阿里巴巴的成功在于突破"目录"思维:
- 早期:企业黄页(类似ChinaPages)
- 进化:在线交易平台(让商家直接成交)
- 最终:淘宝/天猫(C2C/B2C)、支付宝、阿里云...
2.3.4 为什么"分类目录"模式无法应对海量网站
爬虫技术实现:自动访问网页、抓取内容。
从已知页面开始 → 跟踪超链接 → 发现新页面。
理论上爬虫可以收集所有开放网站。

全球网站数量爆炸式增长。
分类无法应对海量网站,因此2000年后,网站数量激增,人工分类不再可能,这也是搜索引擎诞生的必然性:不是Google比Yahoo聪明,是规模倒逼技术变革。
2.3.5 PageRank 算法和 BackRub 项目
| 项目 | 说明 |
|---|---|
| BackRub | 1996年斯坦福大学的搜索研究项目 |
| 创始人 | Larry Page(拉里·佩奇),Google联合创始人 |
| 目标 | 创建"通用数字图书馆" |
| 核心技术 | PageRank 算法------通过链接关系给网页排名 |
下表展示了PageRank 算法原理。
| 步骤 | 说明 |
|---|---|
| 1. 收集页面 | 从一组网页开始 |
| 2. 爬取链接 | 分析网页之间的链接结构 |
| 3. 初始排名 | 每个页面初始权重 = 1/N |
| 4. 迭代计算 | 被越多高质量页面链接,排名越高 |
下图给出了一个计算的例子。这里计算的核心是一个页面的权重 = 来自其他页面的权重之和,一个页面如果有 N 个外链,每个外链获得 1/N 的权重。

假设初始每个页面权重都是 0.2。
因此页面E的排名 = 来自C的权重 + 来自D的权重
就是 P R ( E ) = P R ( C ) / 3 + P R ( D ) / 2 = 0.17 PR(E) = PR(C)/3 + PR(D)/2 = 0.17 PR(E)=PR(C)/3+PR(D)/2=0.17
拉里·佩奇曾试图以仅100万美元卖给Yahoo!但是Yahoo拒绝了。后来1998年 Google 正式成立,2004年 Google 上市,市值230亿美元。Yahoo 逐渐衰落,2016年被Verizon收购。
2.4 搜索引擎(Search Engine)的三大核心工作流程
在我们介绍完基础知识之后,我们可以阐述搜索引擎的三大核心工作流程了。
| 步骤 | 图标 | 说明 | 对应前面课程 |
|---|---|---|---|
| 1. Crawling 抓取 | 🕷️ 蜘蛛爬网页 | Google爬虫(bots)自动访问网页,发现新内容 | 前面讲的 Web Spider |
| 2. Indexing 索引 | 📚 数据库 | 把抓取的内容整理、分类、存储,建立倒排索引 | 前面讲的 Inverted Index |
| 3. Ranking 排名 | 📊 搜索结果 | 用户搜索时,按算法决定展示哪些网页、什么顺序 | 前面讲的 PageRank |
2.4.1 搜索引擎建立倒排索引(Inverted Index)
我们前面说的建立倒排索引是以文章为例,现在我们是搜索引擎,在这个例子中,我们处理的对象是原始网页也就是HTML文件。
处理流程如下。
| 步骤 | 处理内容 | doc 1 示例 | doc 2 示例 |
|---|---|---|---|
| source text 原始文本 | 带HTML标签的原始内容 | The <em>Quick brown</em> fox jumped over the lazy dog |
The two <em>lazy</em> dogs were slower than the less lazy <em>dog</em>, Rover |
| html_strip filter 去除HTML | 去掉标签,保留纯文本 | The Quick brown fox jumped over the lazy dog |
The two lazy dogs were slower than the less lazy dog, Rover |
| standard tokenizer 分词 | 按空格拆分成单词 | The, Quick, brown, fox, jumped, over, the, lazy, dog |
The, two, lazy, dogs, were, slower, than, the, less, lazy, dog, Rover |
| lower case filter 转小写 | 统一大小写 | the, quick, brown, fox, jumped, over, the, lazy, dog |
the, two, lazy, dogs, were, slower, than, the, less, lazy, dog, rover |
| stop words filter 去停用词 | 去掉无意义词(the, were, than等) | quick, brown, fox, jumped, over, lazy, dog |
two, lazy, dogs, slower, less, lazy, dog, rover |
因此刚刚的例子的倒排索引(Inverted Index)如下。
| 关键词 | 出现在哪些文档 |
|---|---|
| quick | 1 |
| brown | 1 |
| fox | 1 |
| jumped | 1 |
| over | 1 |
| lazy | 1, 2 ← 两个文档都有 |
| dog | 1, 2 ← 两个文档都有 |
| two | 2 |
| dogs | 2 |
| slower | 2 |
| less | 2 |
| rover | 2 |
搜索引擎能快速检索就是因为倒排索引。刚刚介绍的就是倒排索引的完整技术实现细节。
2.4.2 Elasticsearch
Elasticsearch是一个流行的开源搜索引擎技术。
Elasticsearch = 可扩展的数据存储 + 搜索引擎 + 向量数据库
- 底层使用 Apache Lucene(Java全文搜索库)
- 支持近实时搜索、索引、存储、分析
- 现代应用:网站搜索、日志分析、AI向量搜索
Elasticsearch 是实现倒排索引和全文搜索的工业级工具------它把前面讲的理论变成了可落地的技术方案,支持海量数据实时搜索。

2.4.3 主流搜索引擎
| 搜索引擎 | 特点/地区 |
|---|---|
| 全球最大,技术领先 | |
| Bing | 微软,北美第二 |
| 百度 | 中国最大 |
| Ask | 问答式搜索 |
| Yahoo | 老牌目录起家 |
| DuckDuckGo | 隐私保护,不追踪用户 |
| AOL | 美国老牌门户 |
| 搜狗 | 中国,腾讯系 |
| Yandex | 俄罗斯最大 |
| Ecosia | 环保搜索,种树公益 |
| Internet Archive | 网页历史存档 |
每个搜索引擎都有自己的网络爬虫。
除了爬虫自动抓取网页链接,浏览器也会监控新网站。
用户访问的新网站,通过浏览器反馈给搜索引擎,实现更快收录。
SEO不仅要讨好爬虫,还要让用户通过主流浏览器访问,加速被搜索引擎发现。
2.4.4 搜索引擎如何进行排名
排名质量决定用户体验。
百度就是因为经常最上面是广告因此被广大网友讨厌。
好的排名:
- 官网排在第一
- 相关信息(百科、招生、评价)紧随其后
- 垃圾/无关信息靠后
2.4.4.1 排名算法
| 算法 | 核心功能 | SEO启示 |
|---|---|---|
| Panda 🐼 | 打击低质、单薄内容,奖励原创、有深度的内容 | 内容要原创、有深度,拒绝采集拼凑 |
| Penguin 🐧 | 打击链接作弊(买卖链接、链接农场) | 外链要自然获取,拒绝黑帽手段 |
| Hummingbird 🐦 | 语义理解------理解整体意图,而非匹配单个关键词 | 优化长尾词,回答完整问题,不堆砌关键词 |
| Pigeon 🕊️ | 本地搜索优化------结合地理位置和距离排名 | 本地商家要完善地址、地图、评价信息 |
| Mobilegeddon 📱 | 移动优先------移动端友好的网站在移动搜索中排名更高 | 网站必须响应式设计,移动端体验好 |
| RankBrain 🧠 | AI机器学习------更好理解查询含义,匹配最佳结果 | 内容要真正解决用户问题,而非机械优化 |
| Possum 🐨 | 本地搜索升级(2016)------改善本地商家排名 | 本地SEO更重要,距离和 relevance 是关键 |
| Fred 👤 | 打击黑帽战术------广告过多、低价值内容、无用户收益 | 广告和内容要平衡,提供真实价值 |
2.5 SEO(搜索引擎优化)的完整定义
SEO 是修改网站以提高其在搜索引擎自然排名(非付费)的行为。
下图展示了一个搜索例子。
顶部 "[Ad] Learn Search Engine Optimization"是SEM,花钱买的位置。
"What is SEO / Search Engine Optimization? - Search Engine Land"是SEO优化的目标,免费排名。
"Search engine optimization - Wikipedia"是权威网站,自然排名高。
"Beginner's Guide to SEO..."是优质内容,获得好排名。
所以SEO追求自然排名(免费),SEM是付费广告。
排名基于爬虫抓取的索引内容。
排名越高,流量越多。
总结一下SEO的终极目标是当用户搜索时,让你的网站出现在自然搜索结果的前列,获得免费流量。
2.6 14条SEO实战技巧
这些是将前面讲的技术原理转化为可执行的操作清单。
| 编号 | 技巧 | 对应前面内容 |
|---|---|---|
| 1 | 全面关键词研究 | 了解用户搜索什么词 |
| 2 | 高质量、吸引人的内容 | Panda算法------内容为王 |
| 3 | 定期更新内容 | 搜索引擎喜欢新鲜内容 |
| 4 | 提升网站加载速度 | 用户体验,Mobilegeddon |
| 5 | 提升网站可访问性 | 爬虫能顺利抓取 |
| 6 | 优化URL结构 | 简洁、含关键词的URL |
| 7 | 移动端优化 | Mobilegeddon算法要求 |
| 8 | 合理组织内容结构 | 标题层级、段落清晰 |
| 9 | 善用社交媒体 | 社交信号、流量来源 |
| 10 | 优化内链 | 网站内部链接结构 |
| 11 | 优化图片 | 图片SEO、加载速度 |
| 12 | 高质量外链 | Penguin算法------链接质量 |
| 13 | 本地SEO优化 | Pigeon/Possum算法 |
| 14 | 撰写吸引人的标题和描述 | 提高点击率(CTR) |
2.6.1 全面关键词研究
进行关键词研究的主要目的是找到潜在客户或客户在搜索引擎上搜索的词语或短语,一些技巧如下:
- 确定每个关键词的搜索量和竞争程度。
- 在博客中自然地包含长尾关键词。
- 理解客户的目的,如信息性、导航性和交易性需求,以找到最佳关键词。
- 找出竞争对手的关键词规划技术,分析它们,并根据结果使用最佳方案。像SEMrush或SpyFu这样的工具可以帮助你找到对排名提升更有效的关键词。
- 将选定的关键词分类到合适的组或主题中。
- 确保持续监控你的内容和关键词。你可以使用Google Analytics和Search Console等工具来监控内容和关键词的表现。根据分析结果,你可以进一步改进以提高SEO排名。
2.6.2 内容优化
内容始终是排名的王者。没有优质内容,你根本无法考虑网站排名。谷歌的Panda和Penguin算法已通知,内容可能会主要影响你的SEO策略。一些技巧如下:
- 确保在内容中自然地添加所有相关关键词。
- 使用高质量图片、信息图表、视频和动画来增加内容的视觉吸引力,并提升用户互动。
- 页面内容应与你试图排名的关键词相关!
- 保持所需的关键词密度以提升排名。
- 创建引人注目的标题和副标题以降低跳出率。
- 使用短段落、短句、项目符号、副标题和空白区域来提高可读性,并推动预期结果。
- 包含指向网站其他页面的相关内部链接和外部链接,以提升内容的可信度。
- 确保你的内容具有灵活性,以便在每个屏幕尺寸上都能调整。
2.6.3 保持网站新鲜度
你不希望用户点击你的内容,但因为网站内容过时而跳出。及时刷新和更新内容至关重要。一些技巧如下:
- 用最新信息更新网站的统计数据和数据。
- 呈现与主题相关的新想法、扩展或趋势。
- 找到最近与主题相关的热门新关键词。
- 添加新图片、图形、视频或其他多媒体元素以增强视觉冲击力。
- 展示更新内容的日期、时间和天数,以显示内容的相关性。
2.6.4 即时加载
网站速度慢也会对你的排名和用户体验产生更大影响。一些技巧如下:
- 确保优化图片以提升网站速度。
- 压缩JavaScript和CSS文件以提高速度。
- 删除不必要的渲染阻塞脚本。
- 实现懒加载/动态加载。
- 升级服务器性能以确保快速响应时间。
- 优化网站字体和内容。
- 确保你的网站是移动响应式的,并能快速适应多种屏幕尺寸和设备。
2.6.5 所有用户的无障碍访问
网站无障碍访问从根本上意味着网站应该准备好为所有用户提供愉快和引人入胜的体验,无论他们可能有什么残疾或限制。一些技巧如下:
- 在文本中使用标题标签,帮助视障用户了解何时到达重要节点。
- 使用对比度强烈的颜色,使读者更容易区分文本和背景。
- 使用在不同屏幕和设备上易于阅读的字体大小。
- 使你的网站可通过键盘访问。
- 使用带有说明性替代文本(Alt text)的图片,以提高无障碍性。
- 为视频甚至内容添加文字记录或启用字幕。
2.6.6 优化URL
尽可能保持URL透明可见、相关、有吸引力且更新,对于使用户和搜索引擎方便访问至关重要。一些技巧如下:
- 使URL聚焦于页面的基本主题。
- 使用代表网站概念的短URL。
- 设计人类可读的URL,让用户能够概览网站内容。
- 在URL中添加与内容相关的适当关键词。
- 使用连字符(-)分隔URL中的关键词。
- 避免使用下划线(_)或空格,因为它们可能造成可读性问题。
- 通过用文件夹分类内容来正确构建URL。
2.6.7 移动优先
在当今时代,手机和平板电脑的使用已经超过了PC。一些如下:
- 你的网站设计应具有响应性,以适应任何屏幕尺寸。
- 使用在移动屏幕上清晰可见且易于阅读的字体。
- 优化加载速度。
- 使你的内容易于在小屏幕上阅读和导航。
- 使用尺寸准确且能在所有设备上即时加载的图片。
- 在按钮和链接周围保持足够的空间,以避免误点击。
- 使你的元标题和描述尽可能简洁且吸引人。
2.6.8 合理构建内容结构
结构良好的网站不仅能改善用户体验,还能使搜索引擎更容易抓取和索引你的网站。一些技巧如下:
- 找到目标受众可能用来查找你内容的适当短语和关键词。
- 使用标题标签(H1、H2、H3......)为内容创建有组织的结构。
- 创建易于导航的URL。
- 撰写独特、有价值且信息丰富的内容,配以适当的标题和副标题,回答目标受众的需求和疑问。
- 在必要处使用重要关键词,使其易于访问。
- 在网站上添加内部链接,以便搜索引擎能够轻松识别你的网站内容。
2.6.9 社交媒体
由此产生的社交信号,如点赞、分享和评论,也可以间接增强你的SEO。一些技巧如下:
- 将关键词研究与发布概念相匹配。
- 当客户访问社交媒体资料时,确保他们获得有关公司的所有所需信息。
- 在你的网站甚至博客上包含所有分享图标。
- 每当内容出现在客户的时间线上时,确保他们可以一键分享到社交媒体。
- 生成高质量内容以发布在社交媒体平台上。
2.6.10 内部链接
内部链接还有助于搜索引擎轻松快速地查找、搜索和理解网站上的所有页面。一些技巧如下:
- 创建内部链接时,使用信息丰富且适当的锚文本。
- 使用所有与内容相关的内部链接。
- 进行关键词研究,找出网站所有页面最重要和最佳的关键词。
- 重要页面应易于查找,并应从顶部导航菜单或页脚链接。
- 你的网站应进行深层链接,这意味着链接不仅出现在主页上,还出现在内部页面上。
- 定期检查网站是否有损坏或过时的链接。
- 使用面包屑导航。
- 确定网站最重要的页面,并优先更定期地链接到它们。
面包屑导航(Breadcrumb Navigation) 是一种网站导航方式,用来显示用户当前页面在网站结构中的位置路径。
例子如下:
首页 > 电子产品 > 手机 > iPhone 15 Pro
首页 / 服装 / 男装 / 衬衫
2.6.11 优化图片
优化后的图片在系统上需要更少的存储空间,使网站能够快速加载,同时提供交互式客户体验。一些技巧如下:
- 避免使用大图片。在不牺牲质量的情况下减小图片尺寸。
- 使用适合的图片格式,如JPEG、PNG和WebP。
- 为图片应用相关的替代文本(alt text)。
- 提供标题和说明,以提供额外信息和关键词。
- 图片应具有响应性,并在各种屏幕尺寸上显示合适。
- 添加一些相关图片,但不要添加太多图片。
2.6.12 高质量外链
外链是列在其他网站上的你的网站链接,它就像一封推荐信。一些技巧如下:
- 为了吸引高质量外链,专注于创建引人入胜且有价值的内容,让其他网站觉得值得链接。这包括博客文章、文章、信息图表、视频或任何其他为目标受众提供价值的材料。
- 开始通过 reputable 分销公司发布新闻稿,用于重要的公告、活动或与你业务相关的成功。
2.6.13 基于位置的结果
有些信息与位置非常相关,例如:餐馆。一些技巧如下:
- 为你的网站实施位置特定的页面。
- 从本地网站、博客和目录获取高质量外链。
- 在社交媒体渠道保持活跃存在,并与本地客户互动。
- 在整个网站中包含位置特定信息,包括标题、标题和内容。
- 在你的网站上应用 schema 标记,以帮助搜索引擎了解你公司的位置、联系信息和其他相关详情。
- 在本地博客或网站上添加客座文章。
2.6.14 标签(Title Tags)和元描述(Meta Descriptions)

标题和元描述帮助Google和用户理解特定网页的内容。撰写有用的标题和元描述可以显著提升来自搜索结果页的点击率。它将帮助你从Google获取更多流量并产生更多销售。一些技巧:
- 你网站的标题标签和元描述应该与行业内其他网站相比具有吸引力和独特性。
- 标题标签的长度应为50到60个字符,元描述的长度应约为160个字符。
- 标题标签和元描述应匹配搜索意图。
- 在标题标签和元描述中添加目标关键词。
2.7 SEO的多因素驱动
基于对150多名SEO专家的调查,下面的图展示了Google算法中排名因素的影响。

| 排名因素 | 占比 |
|---|---|
| 域名级链接特征 | 8.22% |
| 页面级链接特征 | 8.19% |
| 页面级关键词与内容特征 | 7.87% |
| 页面级关键词无关特征 | 6.57% |
| 参与度与流量/查询数据 | 6.55% |
| 域名级品牌指标 | 5.88% |
| 域名级关键词使用 | 4.97% |
| 域名级关键词无关特征 | 4.09% |
| 页面级社交指标 | 3.98% |
2.8 SEO中不推荐的做法
- Flash和shockwave(实际上HTML5中已不再使用)- 爬虫无法抓取这些文件
- 纯图片网站 - 爬虫无法抓取图片
- 图片站点地图 - 爬虫无法读取图片地图
不要在主页或关键页面上使用它们 - 框架(Frames) - 只能给一个页面加标题(标题在搜索排名中至关重要)
如果爬虫无法读取完整页面(因为框架),它将无法被正确索引
有些爬虫甚至可能无法读取框架网站 - 拼写错误、JavaScript或HTML错误(验证你的代码)
2.9 新的网站没有被搜索引擎收录怎么办
我们可以使用免费SEO工具,获取我们网站的性能数据,分析洞察以提升我们网站在必应搜索结果中的页面排名。
对于新网站,我们可以将其提交给搜索引擎(SEs)。
2.10 每次访问都意味着金钱
这个时代流量就可以转化为金钱,而谷歌推送广告的方式就是带来流量,通过这样的方式赚钱。
换句话理解,那就是"Google是'信息中介'------把想搜东西的人(流量)和想卖东西的人(商家)连接起来,每次点击都是一笔交易"。
这就是搜索广告的商业模式,也是Google的主要收入来源(占收入80%+)。
3. SEM(搜索引擎营销)
3.1 什么是SEM(搜索引擎营销)
SEM 是通过购买付费列表,在搜索引擎上营销网站的行为。
3.1.1 什么是付费列表
这些是搜索引擎出售给广告商的列表,通常通过付费展示位置或付费收录程序。相比之下,自然列表不是出售的。
3.2 SEM的形式
SEM有两种形式:
- 付费收录(Paid inclusions)
广告程序,页面保证被包含在搜索引擎索引中,以换取付费
不保证排名
按每次点击成本(CPC)付费
广告商付费被包含在目录中,按CPC或按URL付费,不保证特定位置 - 付费展示位置(Paid placements)
广告程序,列表保证出现在自然列表中
费用越高,排名越高
例如赞助链接和Google AdWords
可以从门户或搜索网络购买
搜索网络通常设置在拍卖环境中,关键词和短语与每次点击成本(CPC)费用相关联
3.3 Google的收入

如图所示 Google 的收入15年间增长15倍。
Google在搜索市场占据绝对主导地位(全球市场份额90%+),这种垄断地位带来了:
- 广告定价权
- 规模效应
- 数据优势
- 网络效应
因此收入就可以持续指数级增长,让 Google 成为了互联网时代的最大赢家之一。
4. 总结
4.1 漏斗模型
我们回到前面的漏斗模型。
营销不仅仅是流量。

漏斗模型的解决方案有:
- 增加进入漏斗的线索数量。
- 提高线索到购买者的转化率。
因此不要浪费流量。

| 阶段 | 定义 | 目标 | 策略 | 衡量指标 |
|---|---|---|---|---|
| REACH 触达 | 有人在任何地方看到你的信息 | 提高目标受众的可见性和流量 | SEO、PPC、社交媒体、线下和付费广告 | 搜索引擎排名、展示次数、网站流量 |
| ENGAGEMENT 互动 | 有人与你的品牌、内容或媒体互动(阅读博客或观看视频) | 鼓励受众消费你的内容,将你视为可信权威 | 创建以客户为中心的内容(博客、网页文案、音频和视频) | 网站停留时间、跳出率、社交分享、页面浏览量 |
| CONVERSION 转化 | 有人执行期望的行动(选择加入或购买) | 产生合格的线索、订阅者和客户 | 网页表单、电子书、电话号码、在线聊天 | 线索转化率(电话和网页表单)、选择加入 |
网页流量的互动和最终交易也非常重要!
4.2 相关指标
4.2.1 网站流量的指标

对于PC网页:
| 指标 | 说明 | 图中数据示例 |
|---|---|---|
| User(用户) | 访问网站的独立用户 | 17,413(全部),12,542(自然流量) |
| Session(会话) | 用户的一次访问过程 | 20,691(全部),14,789(自然流量) |
| PV(Page View,页面浏览量) | 页面被浏览的总次数 | 34,399(全部),23,710(自然流量) |
| UV(Unique Pageview,独立页面浏览) | 去重后的页面浏览 | 与PV对比看重复访问 |

对于移动应用:
| 指标 | 全称 | 说明 |
|---|---|---|
| DAU | daily active user(日活跃用户) | 每天使用应用的用户数 |
| WAU | weekly active user(周活跃用户) | 每周使用应用的用户数 |
| MAU | monthly active user(月活跃用户) | 每月使用应用的用户数 |
两者的区别如下表所示:
| PC网页 | 移动应用 | |
|---|---|---|
| 核心指标 | UV、PV、Session | DAU、WAU、MAU |
| 关注重点 | 流量规模、页面深度 | 用户活跃度、留存率 |
| 关键比率 | 跳出率、转化率 | DAU/MAU比率 |
PC看流量规模(UV/PV),App看用户活跃(DAU/MAU)------不同平台,不同核心指标。
4.2.2 SEO(搜索引擎优化)的指标

SEO 综合得分的指标有五个方面:
- Backlinks(外链)
- Content(内容)
- Optimization(优化)
- Technical(技术)
- User Experience(用户体验)
SEO 检测工具的功能如下:
- 输入域名 → 点击检测按钮
- 扫描全站 → 分析所有页面
- 生成评分 → 基于多维度因素计算综合得分
- 提供优化建议 → 给出个性化的改进方案,帮助提升搜索流量
SEO 检测工具可以量化评估网站的搜索优化健康度,帮助网站管理员识别短板并针对性改进,从而获得更多自然搜索流量。
4.2.3 用户参与度(Engagement)的指标

上图展示了一个 Google Analytics 中的参与度指标
| 指标 | 数值 | 含义 |
|---|---|---|
| Sessions(会话数) | 43,604 | 总访问次数 |
| Users(用户数) | 28,595 | 独立访客数 |
| Pageviews(页面浏览量) | 118,663 | 页面被浏览的总次数 |
| Pages/Session(每次会话页数) | 2.72 | 用户平均每次访问浏览 2.72 个页面 |
| Avg. Session Duration(平均会话时长) | 00:02:15 | 用户平均停留 2 分 15 秒 |
| Bounce Rate(跳出率) | 40.87% | 只看一页就离开的用户比例 |
| % New Sessions(新会话占比) | 55.29% | 超过一半是新用户 |
这里跳出率(只看一个页面就离开的用户百分比)略高说明通过搜索引擎来的用户可能没找到预期内容。
跳出率行业基准(Benchmark),也就是不同网站类型的健康跳出率范围,如下表所示。
| 网站类型 | 正常跳出率范围 | 特点 |
|---|---|---|
| 电商和零售网站 | 20% - 45% | 目标明确,用户有购买意图,跳出率应最低 |
| B2B 网站 | 25% - 55% | 决策周期长,用户会多方比较 |
| 潜在客户生成网站 | 30% - 55% | 需要用户填写表单,转化门槛中等 |
| 非电商内容网站 | 35% - 60% | 资讯类,用户看完即走也正常 |
| 落地页(Landing Pages) | 60% - 90% | 单页设计,用户完成单一动作后离开 |
| 词典、博客、门户 | 65% - 90% | 信息查询型,找到答案即离开 |

跳出率最高的行业(用户最容易离开):
- 餐饮(Food & Drink): 65.62%
- 科学(Science): 62.24%
- 参考类(Reference): 59.57%
跳出率最低的行业(用户参与度最高): - 房地产(Real Estate): 44.50%
- 购物(Shopping): 45.68%
- 游戏(Games): 46.70%

因此如果低于行业基准,那说明网页优秀,用户参与度高。
如果高于行业基准,说明网页需优化,可能存在:页面加载慢、内容不匹配、导航不清晰等问题。
4.2.4 转化指标(Conversion Metrics)
下图同样出自 Google Analytics。

这是一个典型的购物行为漏斗,展示了用户从访问到购买的流失过程:
| 阶段 | 用户数 | 转化率 | 流失情况 |
|---|---|---|---|
| 所有会话(All Sessions) | 27,843 | 100% | 起点 |
| 浏览商品(Product Views) | 14,987 | 53.83% | 12,677人无购物活动(45.53%流失) |
| 加入购物车(Add to Cart) | 3,383 | 12.15% | 11,597人未加购(77.38%流失) |
| 进入结算(Check-Out) | 1,657 | 5.95% | 1,805人放弃购物车(53.36%流失) |
| 完成交易(Transactions) | 870 | 3.12% | 894人放弃结算(53.95%流失) |
整体转化率仅 3.12%,转化率低背后的原因有很多:
他们要么改变主意,要么等待优惠券等。
新老用户对比如下。
| 用户类型 | 会话数 | 商品浏览率 | 加购率 | 结算率 | 购买率 |
|---|---|---|---|---|---|
| 新访客 | 20,828 | 51.11% | 10.85% | 5.37% | 2.46% |
| 回访用户 | 7,015 | 61.88% | 16.01% | 7.67% | 5.09% |
这里回访用户的转化率是新访客的 2 倍以上,说明用户忠诚度对电商至关重要。
4.2.5 整体效果指标(Overall Metrics)
ROI(投资回报率)的公式如下。
R O I = R e t u r n (收益) − I n v e s t m e n t (投资) I n v e s t m e n t (投资) ROI=\frac{Return(收益)−Investment(投资)}{Investment(投资)} ROI=Investment(投资)Return(收益)−Investment(投资)
或简化为:
R O I = 利润 成本 ROI=\frac{利润}{成本} ROI=成本利润
所以 ROI 指的是每投入 1 元钱,能赚回多少利润。ROI > 0 表示盈利,ROI < 0 表示亏损。
下面的文章说了更多。
7个流行的营销投资回报率公式
电商运营的核心逻辑------不仅要吸引流量,更要通过优化每个转化环节,最终提升 ROI(投资回报率),实现商业盈利。
4.3 GMV(商品交易总额)
GMV = Gross Merchandise Value(商品交易总额)
衡量一定时期内销售总金额的指标,包含所有下单金额,无论是否实际成交。
所以 GMV 是"虚高"的数字,包含了大量未完成的交易。
其的计算公式如下:
GMV=实际销售额+取消订单+拒收订单+退货订单 (GMV=sales + cancel order + reject order + return order)
所以会出现下图的情况。

4.3.1 Gross Sales(总销售额)和 Net Sales(净销售额)的关键区别
净销售额 = 总销售额−销售退货−折让−折扣 (Net Sales=Gross Sales−Sales Return−Allowances−Discounts )
| 指标 | 含义 | 用途 |
|---|---|---|
| Gross Sales | 所有订单金额总和(含退货/折扣) | 对外PR、融资、招商 |
| Net Sales | 实际到账金额 | 内部经营分析、财务报表 |
其他关键电商指标如下表所示。
| 指标 | 全称 | 含义 |
|---|---|---|
| CAC | Customer Acquisition Cost | 获客成本(获取一个客户的成本) |
| LTV | Customer Lifetime Value | 客户终身价值(一个客户全生命周期贡献) |
| NMV | Net Merchandise Value | 净商品价值(扣除退货后的GMV) |
| Churn Rate | 流失率 | 客户流失比例 |
| AOV | Average Order Value | 平均订单价值 |
| Conversion Rate | 转化率 | 访客转化为客户的比例 |
| Profit Margin | 利润率 | 每产品的利润占比 |
4.4 互联网的三个层次
通过 robots.txt 或 meta 标签阻止搜索引擎索引,因此大多数网络资源其实不被搜索引擎覆盖。
互联网的三个层次(冰山模型)展示了这一情况,如下图所示。

- Surface Web(表层网络)------4%
| 特征 | 说明 |
|---|---|
| 可被搜索引擎索引 | Google、百度等能抓取到 |
| 公开访问 | 普通浏览器即可查看 |
| 占比 | 仅 4% |
| 例子 | 新闻网站、博客、电商平台公开页面 |
- Deep Web(深网)- 96%
| 特征 | 说明 |
|---|---|
| 搜索引擎无法索引 | 占互联网内容的绝大部分 |
| 需要权限/付费 | 密码保护、付费墙、私人数据库 |
| 占比 | 96%(绝大多数!) |
| 例子 | 私人邮箱、付费学术数据库、企业内部系统、银行账户、医疗记录 |
Deep Web 不是非法的,只是"不公开"------就像你的微信聊天记录,属于 Deep Web。
- Dark Web(暗网)- <1%
| 特征 | 说明 |
|---|---|
| 需要特殊工具访问 | 如 Tor(洋葱路由器) |
| 加密匿名 | 流量经过多层节点跳转,难以追踪 |
| 占比 | <1% |
| 风险 | 主要用于犯罪和反社会活动(非法交易、黑客服务等) |
4.4.1 私有市场的搜索引擎
下图展示了三个封闭/半封闭的电商搜索平台:

| 平台 | 特点 |
|---|---|
| 亚马逊海外购 | 亚马逊生态内的搜索,商品数据不对外开放给 Google |
| 京东(JD.com) | 自营+第三方,搜索仅在站内 |
| 淘宝/天猫 | 阿里生态,海量商品但封闭索引 |
这些电商平台故意不让 Google/Baidu 抓取商品详情,迫使你必须:
- 进入他们的 App/网站
- 使用他们的搜索功能
- 留在他们的生态内完成交易
这就是 "Private Market"(私有市场)------把内容和搜索都封闭在自己的围墙花园里。
4.4.2 Robots.txt
我们在上学期 INT303 中的爬虫中介绍过这一部分。Robots.txt 是一个放在网站根目录的文本文件,用于告诉搜索引擎爬虫哪些页面可以抓取,哪些不可以。

| 无 Robots.txt | 有 Robots.txt | |
|---|---|---|
| 爬虫行为 | 自由抓取所有页面 | 按规则限制抓取 |
| 示意图 | 所有页面(admin、private、tmp)都被抓取 ✅ | admin、 private 和 tmp 被禁止 🚫 |
善意爬虫(Google、百度)会遵守,恶意爬虫可能无视。
| 要点 | 说明 |
|---|---|
| 不是技术对抗 | 只是一种"声明"或"君子协定",靠爬虫自觉遵守 |
| 违反有后果 | 无视 Robots.txt 违反道德规范,可能违法 |
| 保护服务器 | 防止恶意爬虫过度抓取导致服务器崩溃 |
| 保护商业利益 | 防止未经授权的商业抓取,保护知识产权 |
4.4.3 App 搜索

移动应用则通过封闭的应用商店生态天然隔绝了通用搜索引擎,形成各自为政的"信息孤岛"。
因此移动应用搜索的特点是排名、优化和营销------付费买排名。
| 特点 | 说明 |
|---|---|
| 封闭生态 | 每个应用市场独立运营,数据不互通 |
| ASO | App Store Optimization(应用商店优化),类似 SEO |
| 付费推广 | 竞价排名、首页推荐位、搜索关键词购买 |
| 无统一索引 | 不像网页有 Google 统一搜索,应用分散在各商店 |
4.5 短视频营销(Short-Form Video Marketing)
近年来,短视频(例如小红书、抖音)对营销策略变得越来越重要。
为什么短视频成为营销核心?
| 优势 | 说明 |
|---|---|
| 注意力经济 | 15-60秒快速抓住用户注意力 |
| 算法推荐 | 个性化推送,精准触达目标人群 |
| 低门槛创作 | 人人可参与,UGC内容丰富 |
| 高转化率 | 短视频+直播带货直接变现 |
| 病毒传播 | 内容易于模仿、二创、扩散 |
4.6 AI 时代
随着 ChatGPT、DeepSeek 等 AI 工具成为新的信息入口,传统的 SEO 正在面临颠覆:
| 传统搜索 | AI 搜索 |
|---|---|
| 用户输入关键词 | 用户用自然语言提问 |
| 返回 10 个网页链接 | 直接生成整合答案 |
| 网站争夺排名 | 内容被 AI 直接引用/总结 |
| SEO 优化网页结构 | AIO 优化内容被 AI 采纳 |
如果用户不再点击网页链接,而是直接看 AI 生成的答案,网站流量从何而来?
品牌如何确保自己的内容被 AI 引用和推荐?
新的 "AI 可见性" 优化(AIO)会成为下一代营销核心吗?
AIO(AI 优化) 已经成为继 SEO、ASO 之后的下一个关键战场,上面提出的三个问题的答案只能等时间给我们答案了。
