guodongxiaren/Blog

《这就是搜索引擎》读书笔记:网页作弊

Opened this issue · 0 comments

要首先牢牢记住:作弊的目的是出于商业利益驱使!
即在做不正当的营销。

主要作弊类型

1. 内容作弊

  1. 增加目标作弊词的词频
    i. 页面隐藏元素增加大量词表(css隐藏、alt、meta)
    ii. 页面内容中大量使用
  2. 增加主题无关的热门query词引流
    i. 主题无关热门词加到标题(主要是主题无关,主题相关是蹭热度,不算作弊)
    ii. 页面隐藏元素增加主题无关词(方式同a.i)
  3. 关键位置插入作弊词
    i. <b> <h> <strong> 等也是搜索引擎重要的排序依据

2. 链接作弊

  1. 链接农场(Link Farm):构建大量相互链接的网页集合
  2. 锚文字诱导。标签的文字和链接无关,文字是主题相关,但链接无关(出现过Google轰炸)。
  3. 交换友链/购买链接 让高排名网站指向自己。(正常网站也会做)
  4. 购买过期域名。高排名的旧域名,指向自己
  5. 门页(Doorway Pages)作弊:
    i. 门页即hao123类型的聚合导航页。构造这种网页,实际链接指向同一个网站(色情网站经常这样做)

3. 页面隐藏作弊

  1. 隐形作弊:通过失败搜索引擎爬虫的IP和User-Agent,来针对性的返回伪造页面(用户正常检索不会触发),伪造页面可能质量很高,而用户看到的页面往往是营销页面。
    i. IP地址隐形作弊(IP Cloaking )
    ii. User Agent隐形作弊(User Agent Cloaking)
  2. 网页重定向:让搜索引擎收录一个页面,用户点击被重定向到新页面

4. Web2.0作弊方法

  1. 博客作弊:
    i. 作弊博客(Splog):类似写软文的思路,不过博文目的是嵌入链接。增加目标页面(作弊页面)的排名
    ii. 博客评论作弊
    iii. TraceBack作弊:TraceBack为博文作者互相通知协议。作弊者通过引用高热度的博文来触发TraceBack(如果原作者博客支持该协议,会在原文增加引用者博文的链接)
  2. 点评作弊:类似大众点评的评论中,加入其他网站链接
  3. 标签作弊:某些网站支持标签,比如博客标签,图片、视频分享的标签,在标签中加入推广内容来导流
  4. SNS作弊:在SNS网站建立虚假账号,用色情等信息来吸引点击,诱导分享
  5. 微博作弊:微博、推特都存在互粉行为,通过大量关注他人来获取互粉,在粉丝足够的时候,开始发布营销信息。

小结

内容作弊和链接作弊,主要是针对搜索引擎的算法来操作的。
搜索引擎两个重要排序依据:

  1. 内容质量
  2. 链接分析

也可以通俗的理解为:

  • 一种是想尽办法(作弊的方式)增加营销页面中被搜索引擎所关心的内容。
  • 另一种是用尽办法从其他地方通过链接来给自己的营销页面导流。

貌似后者比较常见,花样也比较多。