《这就是搜索引擎》读书笔记:网页作弊
Opened this issue · 0 comments
guodongxiaren commented
要首先牢牢记住:作弊的目的是出于商业利益驱使!
即在做不正当的营销。
主要作弊类型
1. 内容作弊
- 增加目标作弊词的词频
i. 页面隐藏元素增加大量词表(css隐藏、alt、meta)
ii. 页面内容中大量使用 - 增加主题无关的热门query词引流
i. 主题无关热门词加到标题(主要是主题无关,主题相关是蹭热度,不算作弊)
ii. 页面隐藏元素增加主题无关词(方式同a.i) - 关键位置插入作弊词
i.<b> <h> <strong>
等也是搜索引擎重要的排序依据
2. 链接作弊
- 链接农场(Link Farm):构建大量相互链接的网页集合
- 锚文字诱导。标签的文字和链接无关,文字是主题相关,但链接无关(出现过Google轰炸)。
- 交换友链/购买链接 让高排名网站指向自己。(正常网站也会做)
- 购买过期域名。高排名的旧域名,指向自己
- 门页(Doorway Pages)作弊:
i. 门页即hao123类型的聚合导航页。构造这种网页,实际链接指向同一个网站(色情网站经常这样做)
3. 页面隐藏作弊
- 隐形作弊:通过失败搜索引擎爬虫的IP和User-Agent,来针对性的返回伪造页面(用户正常检索不会触发),伪造页面可能质量很高,而用户看到的页面往往是营销页面。
i. IP地址隐形作弊(IP Cloaking )
ii. User Agent隐形作弊(User Agent Cloaking) - 网页重定向:让搜索引擎收录一个页面,用户点击被重定向到新页面
4. Web2.0作弊方法
- 博客作弊:
i. 作弊博客(Splog):类似写软文的思路,不过博文目的是嵌入链接。增加目标页面(作弊页面)的排名
ii. 博客评论作弊
iii. TraceBack作弊:TraceBack为博文作者互相通知协议。作弊者通过引用高热度的博文来触发TraceBack(如果原作者博客支持该协议,会在原文增加引用者博文的链接) - 点评作弊:类似大众点评的评论中,加入其他网站链接
- 标签作弊:某些网站支持标签,比如博客标签,图片、视频分享的标签,在标签中加入推广内容来导流
- SNS作弊:在SNS网站建立虚假账号,用色情等信息来吸引点击,诱导分享
- 微博作弊:微博、推特都存在互粉行为,通过大量关注他人来获取互粉,在粉丝足够的时候,开始发布营销信息。
小结
内容作弊和链接作弊,主要是针对搜索引擎的算法来操作的。
搜索引擎两个重要排序依据:
- 内容质量
- 链接分析
也可以通俗的理解为:
- 一种是想尽办法(作弊的方式)增加营销页面中被搜索引擎所关心的内容。
- 另一种是用尽办法从其他地方通过链接来给自己的营销页面导流。
貌似后者比较常见,花样也比较多。