PageRank, 网络世界的标准?

Google的创始人Page和Brin在1998年发明了PageRank (PR)技术给互联网上的网页排序。排序原理很简单,但却影响深远。有兴趣的可以看Page和Brin等的原文: http://dbpubs.stanford.edu:8090/pub/1999-66 。简单地说,一个网页的重要性,取决于链接这个网页的网页数量,以及链接这个网页的网页的重要性。因为网页之间是互相链接的,所以计算PR是个循环迭代的过程。PR值的大小决定了网页在google搜索结果中的排名位置,也就是网页的影响力。

已经有研究表明,PR的算法可能代表了更一般的自然法则。比如给你一个字母D,让你说出以字母D开头的单词。最先说出的不是使用频率最高的那个单词,而是PR值最高的单词。这说明人的记忆提取也符合PR的法则 (原文: http://www.blackwell-synergy.com/doi/abs/10.1111/j.1467-9280.2007.02027.x )。

最近Nature发文章批评传统的学术期刊影响因子 (IF)的计算方法 (原文: http://www.nature.com/news/2008/080102/full/451006a.html )。传统的方法只考虑了文章被引用的次数,但是没有考虑到引用文章的质量,因此可能导致某些流行学科的影响因子超高,比如医学。文中认为既考虑引用次数,又考虑引用文章的质量更能够评价一篇文章和一个期刊的影响力。比较发现,采用PR算法以后,New England Journal of Medicine和Lancet等影响因子超高的期刊的影响系数都大大下降。这也许更符合事实,因为流行并不代表有影响力。

另外,blog的影响力也表现在被链接的数量,而不是访问量。要想知道自己的网页被哪些网页链接,可以通过下面的链接。 http://www.altavista.com/web/webmaster

评论

此博客中的热门博文

如何画出漂亮的图

12平均律vs.自然律 频率vs.音高