Twitter   Forum  Wiki  Article   Saying  Pictorial   Book   bookmark   Photo   More

 

  • 2006-01-08

    再谈365key的防垃圾问题 - [互联网络]

    版权声明:转载时请以超链接形式标明文章原始出处和作者信息及本声明
    http://shawn.blogbus.com/logs/1801754.html

    一个多星期以前,写了《365Key防作弊影响了我正常使用》,网站开发者曾登高留言说:“这项措施主要是为了防止大量垃圾网站作弊。原则是24小时内同一用户收录同一网站的网摘数不超过10篇。”并说希望有更好的防垃圾的方法,希望和我探讨。我不懂技术,提不出具体的技术路线,只能从一个普通用户的角度谈一点想法。

    垃圾信息问题的确是令国内所有社会性的信息发布(如Blog)和信息存储(如书签、网摘)服务商头痛的事。但在我看来,限制同一用户24小时内收录同一网站的文章数量,肯定不是365Key解决垃圾信息问题的好方案,因为它在阻止垃圾信息的同时阻止了良性信息的收录,影响了合法用户的正常收录。

    24小时内同一用户收录同一网站文章上限定为10篇文章,这个限额太苛刻。以新浪等为代表的门户网站以及其他大型新闻网站每天有成千上万条更新,报纸的网络版每天也有十几甚至几十版的更新,而收录限额却定在10篇,这未免太不符合用户实际需要了。或许365Key定这个限额,所考虑的主要是个人Blog每天的更新量不会太大,但365key的用户可不见得仅收录个人Blog上的文章。因此,我建议365key放宽同一用户每天收录文章数量的限额。

    365Key计算同一用户收录同一网站文章数量的时间单位定为24小时,这没有充分考虑用户收藏行为的具体情况。有些用户的收藏行为可能很有规律,他们也许会每天拿出一定时间去阅读自己订阅的新闻或浏览感兴趣的网站,而有的用户则很可能由于工作或学习较忙而无法做到每天都浏览和收录文章。有一种用户就极有可能遇到某一个网站上有超过10篇文章需要收录的情况。比如,就在我写这个post的时候,我发现在我的bloglines里,keso的Feed已经有65更新,WebLeOn的Feed已经有46个更新。Donews.com的Feed已经有200个更新……对我来说,这里提到的每一个Feed中应当收藏的肯定都超过10篇。这么多更新需要浏览和收藏,只不过是因为近半个月来工作较忙而无暇阅读自己订阅的新闻。这些更新是我感兴趣的,我不愿意简单地把它们标为已读了事,我希望等有时间了在一一浏览和收藏。但由于365key限制了每天的收录量,我即使有时间浏览和收藏了也无法把感兴趣的文章悉数收录。为了能收藏自己感兴趣的东西,用户不得不改变自己的工作和生活习惯,甚至需要放弃自己的工作而去适应365key的规矩,这样用户怎么能满意呢?其实,不是没有解决问题的办法,只要把24小时的计算单位改为更长一些时间,比如一个星期或10天或20天或一个月就可以了。

    即使放宽单位时间内同一网站文章的收录量,延长收录文章数量计算单位的时间都还不是解决问题的根本办法,因为这在一定程度上满足了合法用户的同时也给垃圾信息收藏提供了方便。这就需要改变防垃圾信息的思路。指望通过简单的一刀切的方式来解决问题,只会在泼掉洗澡水的同时把孩子也一同泼出去。解决问题的上策是采用更为复杂、具体的计算方法,分门别类地对待不同的信息源以及用户。不妨在建黑名单的同时,建一个白名单,动态地列出一些用户需要且较少垃圾的信息源,给它们发一块“信得过”的牌扁,即放开这些信息源的收录量限制。

    总之,简单化的管理是行不通的,要站在用户的立场上,采用更为复杂、灵活的管理方式,为用户提供更多的方便。这可能会增加网站管理的技术难度,也可能需要更多的人力投入。但如果真的是要让网站可持续发展,恐怕不能不如此。


    收藏到:Del.icio.us




    引用

    下面Blog引用了该文: