SEO 是什么?
搜索引擎优化(英语:search engine optimization,缩写为SEO)是透过了解搜索引擎的运作规则来调整网站,以及提高目的网站在有关搜索引擎内排名的方式。
所谓"针对搜索引擎作优化的处理",是指为了要让网站更容易被搜索引擎接受。搜索引擎会将网站彼此间的内容做一些相关性的资料比对,然后再由浏览器将这些内容以最快速且接近最完整的方式,呈现给搜索者。搜索引擎优化就是通过搜索引擎的规则进行优化。(来自 wikipedia)
所以 SEO 是了解搜索引擎搜索的规则后,针对性的进行规则的适配优化。
搜索引擎搜索的基本步骤
网页抓取:搜索引擎会有自动程序从互联网上发现各类网页,并下载其中的文本、图片和视频。
索引编制:搜索引擎会分析网页上的文本、图片和视频文件,并将信息存储在大型数据库索引中。
呈现搜索结果:当用户在搜索引擎中搜索时,会返回与用户查询相关的信息。
SEO 的基本思路
● 让搜索引擎可以更容易在网上抓取到我们的数据
● 让搜索引擎更易于理解抓取到的数据
● 了解搜索引擎索引编排时的影响因子和算法,进行特定的优化
PageRank 算法
很经典的计算网页权重的算法,刚推出的时候计算所占权重比例很大,现在影响因子增加后,权重会有所下降,但还是 seo 很关键的一点。
PageRank 本质上是一种以网页之间的超链接个数和质量作为主要因素粗略地分析网页的重要性的算法。其基本假设是:更重要的页面往往更多地被其他页面引用(或称其他页面中会更多地加入通向该页面的超链接)。 其将从A页面到B页面的链接解释为"A页面给B页面投票",并根据投票来源(甚至来源的来源,即链接到A页面的页面)和投票对象的等级来决定被投票页面的等级。简单的说,一个高等级的页面可以提升其他低等级的页面。(来自Wikipedia)
算法链接:
The PageRank Citation Ranking: Bringing Order to the Web by Larry Page et al.
Baidu 的算法
百度搜索算法规范详解_引言_搜索学堂_百度搜索资源平台包括飓风算法、劲风算法、细雨算法等等 。一万种算法,它只告诉你别做什么,没有具体的 seo 措施。
一力降十会,建议直接给百度上供提高搜索排名。
影响索引编排的影响因子
太多了,直接贴个图吧
站内措施
robots.txt
允许搜索引擎爬取和分析网页的内容的关键文件 xxxx.com/robots.txt
需要检查在 xxxx.com 域名下的网页 path 是否被 Allow 。
验证工具:search.google.com/test/mobile...
title
● 准确描述网页内容
● 为每个网页创建独一无二的 元素
确保网站上的每个网页在 元素中都有对应的唯一性文字,包括首页、内容页等
● 使用简短但描述准确的 元素
meta description
● 准确总结网页内容
描述需要准确、详略得当,长度适中,控制在 75 -150 字之间。需要提供实用性的描述,我们是什么?我们有什么功能?我们可以为用户带来什么价值?
● 为每个网页使用不同的说明
相关网页的 description 不要高度同质化,需要各自有各自的重点。
一些典型网站的 description:
百度一下,你就知道:全球领先的中文搜索引擎、致力于让网民更便捷地获取信息,找到所求。百度超过千亿的中文网页数据库,可以瞬间找到相关的搜索结果。
Google 搜索中心:Google 搜索中心提供了各种 SEO 资源,可协助您使网站显示在 Google 搜索结果中。立即了解如何让您的网站更容易被用户发现。
必应:必应可帮助你将理论付诸实践,使得搜索更加方便快捷,从而达到事半功倍的效果。
稀土掘金:掘金是面向全球中文开发者的技术内容分享与交流平台。我们通过技术文章、沸点、课程、直播等产品和服务,打造一个激发开发者创作灵感,激励开发者沉淀分享,陪伴开发者成长的综合类技术社区。
mate keywords (keywords 的权重下降的很厉害,Google 推荐的 seo 实践都没有提到这个词了)
关键词最好选用 4-5 个,不要有一直重复的关键词,选择适当的长尾关键词,可以有效提高精准关键词的搜索。
结构化数据标记(Google 有用,百度不确定)
作用:为网站启用富媒体搜索结果
结构化数据是一种提供网页相关信息并对网页内容进行分类的标准化格式。可以在网页上添加结构化数据,向 Google 提供有关该网页含义的明确线索,从而帮助我们理解该网页。通过增加 video 和 image 属性描述,可以在富文本搜索结果中展示网页内容。
推荐格式 :JSON-LD - JSON for Linking Data
结构化数据介绍:developers.google.com/search/docs...
创建站点地图
创建一个 XML 站点地图文件,确保搜索引擎能够发现网站上的新增网页和更新后的网页,文件中要列出所有相关网址及其主要内容的最后修改日期。
简洁和 path 有明确意义的 URL
这样的网址易于传达信息。
arduino
// bad
https://www.brandonsbaseballcards.com/folder1/22447478/x2/14032015.html
// good
https://www.brandonsbaseballcards.com/article/ten-rarest-baseball-cards.html
网页结构
● 网页结构需要尽可能的简洁,合理的使用语义化 html 标签,常见的有 header 、footer 、section 等。便于搜索引擎更容易的理解网页和重点。
● 使用图片时尽可能使用 img 和 picture 标签,并为图片提供说明性文件名和 alt 属性说明
SSR
因为网页的内容呈现很多是 js 逻辑来渲染的,在搜索引擎的策略里面如果 js 渲染的 dom 节点太延迟的话,呈现的内容是不会被抓取到在索引编排时当作网页内容来分析的。
1.1 技术选型
● React + Nextjs
● pre-render
1.2 CSR 工程化改动
流水线等工程化改动往 SSR 方向迁移
1.3 逻辑同异构
根据技术方案选型判断是否涵盖
1.4 定向 spider 流量优化
针对主流搜索引擎 spider 流量与普通访问流量区分,如定向直出高权重内容(包括后续考虑性能优化)
内部网页链接的建立
在内部页面的跳转上,尽可能使用可以被搜索引擎识别的 a 标签和准确的 alt 说明,不要使用 js 代码。
显示实用的 404 网页
404 页面上需要有可以返回首页的链接。
网页加载速度
网页加载速度过慢会让搜索引擎认为是空白或者内容短少的页面,会被当成垃圾网页过滤掉
措施(感觉不如直接做 ssr)
- 包体积优化
站外措施
外链
基于 PageRank 的算法,需要提高外链的数量和质量。
增加网页的点击量和预览量
例子
- 可以通过服务端无头浏览器写脚本来增加对首页等页面的访问量。频率不要太高,会有被认为在恶意刷访问量被打击的风险。
SEO 分析工具
百度站长工具
需要身份验证才能获取网站的数据
Google search console
需要上传生成的验证文件到根目录才可以分析
Bing Webmaster Tools
需要上传生成的验证文件到跟目录才可以分析
Semrush(付费)
业内顶尖的 seo 分析工具