艾未未新浪博客的一些数据统计

来源:http://blog.youxu.info/2009/07/04/aiweiwe/

整一个月零一天前,我在北京和 zuola 老师见了一面,商量怎么恢复 aiweiwei 老师被新浪和谐掉的博客的内容。 因为 Google Reader 这些阅读器实际上缓存了博客的 feed, 而我以前又有专门抓 Google Reader 内容的代码,所以很容易就抓到了所有的数据。

根据我抓到的数据,我说几个统计数据: Aiweiwei 老师从 2007 年 7月22 日 开博一来,到 2009年5月27日被和谐,一共有 1639 篇文章

这 1639篇文章中, 有这样几个数据:

1. 从2008 年 11月 27 日某个一直想要说法的公民死亡开始,aiweiwei 的博客上每天贴了一张 “蜡烛”, 从”一“ 开始到 ”蜡烛 一百八十一 09.05.27“ 结束,中间只缺了 08年12月14日这一天。 我也写博客,我知道坚持一天贴一张图需要的坚持和毅力。 但就这样的贴图,都被新浪删除了不少。

2. “5.12遇难学生名单 补充” 系列,从“一”开始, 到 “一百三十二”, 里面全是一个一个活生生的名字。 这些文章,平均被新浪删除三次,艾未未老师也不和新浪发火,删了三次,就重新贴三次。 因为 aiweiwei 老师把新浪的删除日志也贴出来,所以,像以下这样的句子在我抓到的数据里比比皆是, 比如,数据中有以下这几行:

您的文章《5.12遇难学生名单补充(二) 09.03.17″>已被管理员转移到回收站。给您带来的不便,深表歉意。

您的文章《被删除文章 5.12遇难学生名单补充(二) 09.03.17″><已被管理员转移到回收站。给您带来的不便,深表歉意。

您的文章《被删除文章 5.12遇难学生名单补充(二) 09.03.17″> 已被管理员删除。给您带来的不便,深表歉意。

就 “被删除文章 5.12遇难学生名单补充(二)  09.03.17” 这篇文章, aiweiwei 贴了三次。 像这种文章,一般刚贴出来,新浪就很快删除了,所以我们读者根本看不到痕迹。可是,这些痕迹在 RSS 里面每条都有,所以很容易看到一条条这样触目惊心的删除,贴,再删除,再帖。在看不到数据之前,我们都不知道这样列着遇难学生名单的文章居然能被这样删三 次,贴三次。这种持久的删了再帖的耐心,我想普通人是做不到的。

我知道有人不喜欢艾未未老师,以为他是在搞行为艺术,是想出名,看了数据之后,我想至少大家能够对他做的事情多点支持和理解,也就行了。

为了让更多的人看到 aiweiwei 老师在新浪博客上付出的心力和做的事情,我愿意将我抓到并处理后的数据与所有的人分享。 因为数据非常大, 想要的读者请给我发邮件。您拿到数据之后,可以直接导入任何 WordPress 博客。另外,我有一整套的从 Google Reader 恢复 Wordpress 的代码,只要您的 WP 博客有人订阅,全文输出,如果数据因为某些原因丢失了, 我的代码可以帮你很快的恢复博客。 稍后等我有空,我会把代码和恢复中的技术要点全部贴出来。


没有评论: