这篇blog主要是实验一些东西,如果你感兴趣的话,接着看下去,否则可以忽视……
我们都知道网络审查主要有两种,一种是GFW(对外),一种是网站的自我审查(对付内部不良信息)。像Google.cn那样的审查就是对内。
Google.cn,或者是所有搜索引擎的审查一般有两种――针对关键词,和针对结果里的网页。针对关键词的封锁很容易辨认,当你看到这种情况发生时, 就是搜索引擎上的关键词封锁起了作用――至于我搜的是什么词,我就不说了,自己看:)但这种审查很容易被绕过,因为只是关键词被封锁,搜索结果其实还在 Google的索引里,因此稍微改一下关键词就可以跳过 - 至于怎么跳过,为了保护我朝的青少年,好像不方便在这里说,俺们要反低俗。
另一种就是针对内容的审查了。通常这是相当"反动"的网站才有的待遇,网站中部分或全部页面被Google移除,也就是说,无论你再怎么改你的关键词,也不可能看到来自这些网站的结果。但因为这通常是人工处理的结果,费时费力,一般只针对大网站,否则像我这种全身上下爬满了敏感词的blog,你是不太可能从Google里看到我的。
说起这个原因是最近关于"08宪章(零八宪章)"的封锁。我怀疑可能和这个有关系。当你在 Google.cn里搜索"零八宪章"时,你虽然看不到任何结果,但显示出的页面和我前面提到的那种关键词封锁所显示的页面是不一样的。因此这不像是关键词审查,而是对内容和网站的审查。
这也就是说,搜索引擎的封锁最近更上了一层楼。以前是人工分辨有害内容然后加以封锁,现在可能刚好相反,除非人工把你放出来,否则带有零八宪章关键 词的页面全部都先从索引里屏蔽甚至删除掉了再说。如果这属实的话,对很多网站,特别是论坛或者是博客网站是很可怕的,因为一旦有一个人在某一个角落里发了 带关键词的帖子,那么它将会通过像很多博客侧栏中都有的"最新评论"之类的东西,牵连一群页面。
还记得前段时间我说我的主页从Google.cn中神秘消失再恢复?我怀疑和这个有关,因为在发那篇blog之后,刚好把和08宪章有关的那一篇给挤出了首页。
为了证实一下这是否属实,我故意没有处理这一篇里的所有关键词。如果我的判断没错的话,这篇blog在被Google收录之后,再次导致我的首页不可见。到时候我再在下面更新。
---
Google 比较快,一分钟内就收录了。
和我想象的不一样,我的首页还在,但大概了解是怎么回事。"据当地法律法规和政策,部分搜索结果未予显示"这个过程应该是自动的,但只有在搜索结果中会显示出charter 08四个中文字的时候,才会把你从Google.cn里去除。可以尝试一下搜索上文中离关键词比较近的句子,再搜索离得比较远的句子,你会看到区别的。
但这条规则好像不适用于所有网站:
难道我被特别眷顾了?
没有评论:
发表评论