外部因素对维基百科序化过程的影响分析

来源:互联网 发布:网站域名证书可以干嘛 编辑:程序博客网 时间:2024/05/16 08:42
 

外部因素对维基百科序化过程的影响分析

罗志成[1],付真真

(武汉大学信息资源研究中心,武汉430072)

 

 要:维基百科是一个开放的知识系统,从而不可避免受到外部环境的影响。本文以维基百科为研究对象,选择了“可信度危机”和“政府限制访问”等若干具有代表性的因素,研究了外界环境对于维基百科序化过程的影响。结果表明,外部因素的确影响了维基百科的发展,但是并没有遏制其发展趋势。

关键词:维基百科,有序性,可信度危机,中国政府

 

The Impact Analyzeof Some External Forces on the Wikipedia Order Process

Luo ZhichengFu Zhenzhen

(Center for Studies of informationResourcesWuhan University , Wuhan 430072 )

 

AbstractWikipedia is an open knowledge system, which inevitably affected byexternal environment. Based on Wikipedia for research targets, this paperselects some repetitive events, like the “credibility crisis” and “thegovernment limit access to Wikipedia”, and studies the effects of the externalenvironment impact on the Wikipedia order process. The results showed that, externalfactors had affected the development of Wikipedia, but did not curb itsdevelopment trend.

KeywordsWikipediaOrderCredibility Crisis, ChineseGovernment

 

1引言

马费成教授指出[1],无论是主观知识结构还是客观知识结构,都是开放系统,它与外界处于不断的知识,情报(还包括物质、能量)交换过程中,可以形成类似于普里高津提出的“耗散结构”。这种有序状态需要不断地与外界交换物质和能量才能维持,并保持一定的稳定性,不因外界的微小扰动而消失。维基百科(Wikipedia)是目前世界上最大的知识库[2],并且因为其奉行的“中立”的原则,可以将其视为客观知识结构。维基百科也在与外界不断交换情报、物质与能量,那么必然在一定程度上受到外界作用力的影响。那么此类外力对于系统和系统序化过程的影响有多大呢?本文拟通过研究一些典型事件的影响来回答这一问题。

    在复杂自适应系统理论中,霍兰[3]提出了“刺激-反应”模型,主体在受到外界刺激时,会产生某些应对;每个“刺激”引起主体内部状态的改变,状态的改变会触发相应的规则。进而,霍兰认为,主体的主动性以及它与环境的反复的、相互的作用,才是系统发展和进化的基本动因。

但是复杂自适应系统理论没有专门针对外力对系统影响的研究,而主要研究的用户主体、内容主体和功能主体之间的交互作用。事实上,因为系统外力多种多样,变幻莫测,使得全面分析外力的影响显得不可能。特别是在Web 2.0环境下,人人参与的原则使得外力更为复杂,涉及到政治、经济、社会和文化等各个方面,外力分析更为困难,目前也尚无学者作过类似的研究。本文以维基百科为研究对象,选择了若干具有代表性的事件,研究了外力对于维基百科发展的影响。结果表明,外力的确在一定程度上影响了维基百科的发展,但是并不能遏制其发展趋势。

 

2维基百科及其有序性

2.1 维基百科的特征

维基百科[2]已经在《应用starlogo进行wiki演化过程的模拟探析》做了较为详细的介绍,此处不再详述。中文维基百科[4]是维基百科协作计划的中文版本,自20021024正式成立,由非营利组织──维基媒体基金会维持负责,截至2007121802:44,中文维基百科已拥有157,440个条目,此外还设有其他独立运作的中国地方语言或汉语版本,包括闽南语维基百科、粤语维基百科、文言文维基百科、吴语维基百科、闽东语维基百科及客家语维基百科等。

经过包括我国用户在内的全球维基百科人持续努力,中文维基百科其内容的丰富性、时效性、中立性以及全面性,无论在国内还是全世界,都已成为众多中文用户检索资料时会经常使用的网站之一。

 

2.2 影响维基百科发展的因素

按照霍兰的复杂自适应系统理论,系统中存在三类主体,包括用户主体、内容主体和功能主体。笔者将系统内主体与主体间的交互作用定义为系统内力;而主体总是存在于一定的环境之中,主体与环境之间的交互则定义为系统外力。系统内力和系统外力共同推动了系统的发展,不断走向更加有序化。

在维基百科中,用户主体是注册或匿名的编辑者,内容主体则包括随着维基百科发展而产生的行为规则和各种数据,如文章、图片、链接等,而功能主体包括修订版控制系统(RCSRevision Control System)Talk功能等。而除此之外,其余社会、经济、政治、文化等因素则构成了外界环境。外界环境与主体的交互多种多样,其中包含了下文所述社会对于维基百科可信度的质疑,政府对维基百科的访问限制等等。

 

2.3 维基百科与有序性

马费成教授提出[1],情报结构的有序性来源于科学体系的有序性和人的创造过程的有序性;情报结构的有序性充分体现了情报生产过程中的自组织机理;知识体系(知识结构)的自组织功能和情报的有序性使其在长期的累积中形成了一个有规则的系统。

基于此,笔者认为,在维基百科中有序度的最终标志是文章的质量和用户利用文章所创造的新价值,即文章质量越高,创造价值越大,则维基百科越有序。虽然文章的质量和创造的价值无法直接度量,但是维基百科某些特征间接反映了文章质量和新增价值。本文将这些维基百科的特征归为有序度的三类指标:

 

1 维基百科有序度的指标

类别

举例

用户的有序性

用户访问量,网站排名,新增用户数量

知识结构的有序化

文章内部的链接数,新增文章数

规则的有序化

管理员制度,页面修改规则

 

传统信息组织主要对文献进行组织,是一种典型的他组织方式,初期网络信息组织未改变这种方式。Web2.0颠覆了过去由少数资源控制者集中控制主导的信息组织方式,使在用户集体智慧和力量重构主导下的信息自组织方式得到充分施展的空间。在他组织方式下,如果每天新增的作者越多,新增文章数越多,如果没有外界的干预和及时处理,则系统不断添加和膨胀的结果必然越混乱。但对于维基百科而言,由于其独特的自组织和序化机制,每日尽管新增用户数量越多,新增文章数越多,参加编辑的人越多,网站反而越有序,其影响力也越大,为用户创造的总价值也越大;用户访问越多,文章内部的链接数越多,则说明文章的质量越高越权威。维基百科的这种独特的序化过程,正是Web2.0特有的群体竞争和协同机制所形成的序参量导致系统不断向“序”演化的结果。

规则与有序性的关系非常紧密。规则产生于系统对外界挑战的应对,所以知识结构的自组织功能和情报的有序性必然产生一个规则的系统。而系统规则保证了系统的持久和健康发展,也是系统有序的重要特征。

综上所述,用户访问越多,网站排名越靠前,每日新增用户数量越多,则系统越有序;文章内部的链接数越多,新增文章数越多,则系统越有序;规则体系越完善,则系统越有序。如此,则构成维基百科的序化过程。下文将以两个具有代表性的事件为例,应用表1中的若干指标来分析它们对维基百科序化过程的影响。

 

3、可信度危机的影响

3.1 事件回放

对于维基百科可信度的质疑伴随着网站成长而始终存在。不少人认为wiki缺乏权威和专家,有很多词条是不可信的。2004年,《大不列颠百科全书》的前任主编Robert Mchenry在谈到维基百科时曾尖锐的批评[5],也说出了wiki在运行过程中存在的一个潜在的问题:词条不需要给原作者以署名权,这使用户不得不对词条编辑者身份产生质疑。

20059月曾是罗伯特·F·肯尼迪助手的约翰·塞根塔勒在维基百科有关他的条目中发现自己被怀疑与肯尼迪兄弟的刺杀事件有关。该条目在维基百科维持了4个多月也没人作出修改。塞根塔勒自己在《今日美国》撰文抨击该事件[6]。此事件也为维基百科惹来大量负面报道。

以上述事件为背景,2005年11月15英国Nature杂志刊登了一篇名为Internet Encyclopedias Go Headto Head的文章[7]Nature杂志社相关人员主持进行了一项比较:挑出42个科学词条,将维基百科与权威的大英百科全书比较,结果是维基百科与大英百科全书错误率之比仅为43

而在20072月,英文维基百科再次爆出负面新闻[8]。一位化名为“Essjay”的词条贡献者在维基社群里的个人简介显示是一所私立大学的终身宗教教学教授,通晓教会法规。20072月下旬,《纽约客》在它的网站上披露Essjay其实是一位住在肯塔基州的24岁学生,从未拥有任何大学学位[9]。此事被揭发后,除了在维基百科社群引发热烈讨论外,包括纽约时报在内的各个传媒也纷纷报道此事。

 

3.2 对维基百科用户访问量和排名的影响

正如2.3节所提到的,网站的访问量和排名对于判断一个系统是否有序存在影响,笔者认为,网站的访问量越大,排名越靠前,则系统就越有序。以维基百科为例,其访问量和排名一直呈现出在一个总体上升趋势下波动的状态,这里通过对维基百科访问量和排名的数据分析来揭示外力(这里主要是指“可信度危机”)对维基百科有序性的影响。

1为维基百科从2005年至今页面访问量的统计情况,从图中我们可以看出,维基百科的访问量呈现一种稳步增长的趋势。2005年末维基百科访问量的增长速度突然激增,日访问量从10%增长到30%。这一时期Nature杂志对维基百科的分析结果从很大程度上澄清了有关维基百科“权威性的质疑,笔者认为这也是维基百科访问量激增的主要原因。

 

  1 日浏览量在整个因特网浏览量中的百分比

 (来源于: www.alexa.com/data/details/traffic_details/Wikipedia.org)

 

3.3 对维基百科内部运作方式的影响

随着维基百科词条的积累和访问量的激增,如何提高维基百科的准确度引起了广泛的关注。最终的解决方式是增加规则,这也是系统走向有序化的一个标志。包括如下:

(1)管理员规则。200110月,维基百科的创始人威尔斯任命了一小群管理员,负责管理网站避免滥用。管理员可以删除文章,或者保护文章不被改写,阻止用户编写,比普通用户更快速地恢复文本。截至200711月,英文维基百科共有管理员1418人,中文维基百科共有管理员90人。

(2)3R原则(Three-revertrule)。2004年,维基百科把3R原则正式定为站规(此前它只是指导方针),其中之一规定:24小时内三次恢复相同文本的用户将被禁止编写条目一天。崇尚“自由共享平等的维基百科,为了使维基百科不至于被垃圾信息和无尽的口水战淹没,最终导致了站规的诞生。

(3)事实校验和实时同级评审规则。自2005年,维基百科推出新的事实校验和实时同级评审等程序,这使得维基百科内容的可信度得到很大提升。

(4)禁止匿名用户编写新文章规则。自2005年底,维基百科禁止匿名用户编写新的文章,仅有注册用户才可以编写新文章。这也是“约翰·塞根塔勒”事件后对维基百科编写规则的一个修改。

 

2 新管理员人数增长变化图[10] (来源于:www.Wikipedia.org)

 

2描述的是从20051月到200710月维基百科网站中管理员数量的变化。从图中可以看出2005年末是管理员数量增加最快的一段时间,从2006年中期开始管理员增加速度基本上呈现一种平稳增长的趋势。但是到了2007初,相比全部编辑速率而言,新管理员任命峰值下降了近30%,这很大一部分原因就是在“埃斯杰事件”影响下,维基百科任命新管理员更为慎重。为了防止此类事件再次发生,维基百科对管理员提出了更高的要求,并且要求所有已有的管理员提供学历证明。

管理员及其管理控制规则也对维基百科自身的序化和自组织功能产生了影响。首先,管理控制规则是维基百科发展的产物,可以提高系统的效率,例如3R原则使得系统可以避免某些恶意的破坏行为,从而也加快了优质条目的产生;其次,管理员具有保护页面、封锁用户、删除内容等权限,这对维基百科能够正常运转从而提高其有序性是起到很大的作用的。“自由”的维基百科并不意味着“放任自流”,而是意味着给所有参与者平等的权利来构建一部客观公正、有序的百科全书。

研究结果表明,迫于现实的压力,维基百科正在建立越来越多的规则,似乎与其“开放”的原则相违背,但实际上却是其对于大部分人更加开放的保障。笔者认为,随着规模的增大,所有Web2.0站点都会成为真实社会的镜像,必然由人人平等走向不平等,建立与现实社会类似的层级制度。维基百科必然如此。

 

4、政府限制访问的影响

4.1 事件回放

我国采用对因特网进行内容审查的制度,政府有权依法对网络内容进行审查,对那些有争议或违反中国国家法律的网页内容采取限制或屏蔽措施。维基百科网站对一般民众是容易接触获得的,在维基百科成长的纪录上,我国曾经限制过六次[12]

 

2 我国政府限制维基百科访问情况表

次数

起始时间

结束时间

限制范围

1

200463

2004621

局部

2

2004923

2004927

局部

3

20051019

2006119

全部

4

20061117

2007721

全部

5

2007725

2007730

局部

6

200782

至今

全部

 

对维基百科的限制,无论从短期还是长期,都对中文维基百科走向有序化产生了较大影响。从短期而言,此类限制阻碍了维基网站的发展,从长期而言,此类限制阻碍了中文维基的中立性和中华文化的交流与发展。下文将从长期和短期两个方面的影响来做分析。

 

4.2 短期影响

    4.2.1与其它语言版本的比较

    全球使用中文的人数达14亿以上,为世界主要语言之一。然而,中文维基百科的规模与中文的普及率远远不成正比,甚至远不及英语维基百科的1/15 [10]。有观点将原因归咎于我国限制维基百科。不过,即使只计算非中国大陆的约1亿名中文使用者(部分中文非母语使用者),参与中文维基百科的人数还是远远比不上其他语言的维基百科。例如瑞典语仅约900万人使用,但瑞典语维基百科的条目数却已是中文维基百科的两倍多[10]。除了中文维基自身的问题外,某些小语种和强势语言的通用性也可能是瑞典语维基的快速增长原因之一,例如瑞典语和德语非常相似,从德语维基百科中翻译文章到瑞典语维基百科非常的容易。

    3是中文维基百科与邻近条目数量的语言版本的条目历史增长比较图。自从200611月中文维基百科条目数突破十万大关之后,其条目增长出现速度大幅减慢之势。20071月,中文维基百科只增加了3180篇条目,平均每日增加只有约103篇,比半年前20067月整个月的6219篇,少了接近50%[11]。被同一时间排名于中文维基百科之前的俄语维基百科条目数逐渐抛离。

3 中文维基百科与邻近条目数量的语言版本历史增长比较图,该图源于维基百科数据[11]

 

4.2.2 对中文维基百科发展的影响

4描述了中文维基百科随着时间的变化而变化的情况,包括每日新增用户数量(只计算注册后至少编辑了10次的新维基人数量)、每日新增加的条目数(条目最少包含一个内部链接并且最少有50个字符的文本;计算长度时忽略wiki-html代码,隐藏链接等;也不包括标题)和每月编辑次数超过100的用户数。

如果将新增用户和新增条目视为外界的输入,则此输入状态明显受到限制的影响。从图4中可以看出,第一次限制(20046月)导致中文维基百科的每日新增用户、每日新增条目、每月编辑次数超过100的用户数的增长速度明显减缓或下降,每日新增用户数量到051月才超过045月的水平;每日新增加的条目数到0410月才超过045月的水平。

 

4 中文维基百科日增新人、月编辑次数大于100次人数、日增新条目的时间序列图

 

5 中文维基百科正式条目总数的时间序列图

 

而外界输入的变化也使得整个系统的序化过程受到影响。如图5所示,第三次限制将中文维基百科条目数量突破50,000条的时间显著推迟。2006119,大量用户回报中文维基百科已可以访问,这是20051019限制长达一年多以来我国首次可以重新访问。解封前,中文维基百科每天增加300400个用户,在这短暂的解封期间,每天增加超过1200个用户,比解封前上升了三倍以上,使中文维基百科的增长速度仅次于英语维基百科。类似地,解封的一个星期里创建的条目数比前一个星期增加了75%。在这期间中文维基百科条目数突破了十万大关。当时曾有人预计很快就能上升到二十万条目,但是因为随之而来的限制,使得中文维基百科目前的条目总数仍然没有达到二十万。

 

4.3 长期影响

在中文维基百科中,对于限制访问维基有详细说明[12],下文引用了其中部分观点,并结合有序性做出分析。

(1)中文维基的中立性受影响

我国用户在中文维基计划的缺席,影响中文维基各项目内容的完整性、中立性。例如介绍中国大陆地理、社会、文化、历史等的诸多条目,将因编者缺乏而逐渐荒疏,或依旧保留空白。政治方面的条目中,我国的主流观点将难于体现在内容中。这些实际上都制约了中文维基百科有序性的演化。

(2)阻碍了中华文化的交流与发展

中文维基不能在中国大陆地区正常使用,也是整个中文知识累积过程的损失,可能会导致中文知识的逐渐匮乏。普通百科全书的价格、知识面、便携性远远没有维基百科强。可能会给大量网民、新闻工作者、科学研究者甚至学生带来莫大的不便。

中文维基的各个项目,由于有众多的参与者,在华语圈的学术思想观念交流、词汇统一等方面有很大的影响,中文维基的简繁系统所衍生出来的各项工作,比如简繁词汇对应、译名统一、字形整理、规则设立等,不仅仅只限于技术,对中华文化认同、交流、统一起了极大作用。我国隔断了维基这一国际性的项目,使得文化隔阂将会重新加剧,使得“互联网”、“网际网路”这样有区域性的指称多起来。这可能会为整个中文维基未来的发展带来麻烦。

 

5、结论

    从图1和图5可以看出,不管是可信度危机还是对维基百科访问的限制,都并没有改变维基百科用户访问量不断增加、规模不断扩大的趋势。这也说明维基百科系统在持续开放状态下,具有一定的稳定性。

但是,上述两个事例都对维基百科的序化过程产生了一定的影响。在可信度危机中,维基百科的访问量和运行规则受到影响,并作出了相应的调整。而在政府限制访问维基百科事件中,中文维基百科的排名、外界输入量、中立性等各个方面受到影响。

维基百科目前仍处于不断发展的过程中,缺少任何国家人民的参与都无疑会造成维基百科有关内容的缺失和失实。为了使维基百科成为一部内容全面,准确性高的全书,为了让更多的人利用维基的知识,我们呼吁更多的人参与到维基的建设中。

 

参考文献:

[1] 马费成. 论情报学的基本原理及理论体系构建. 情报学报. 2007, 26(1):3-13.

[2]Wikipedia. http://www.wikipedia.org/. 访问日期:20071226.

[3] 约翰·霍兰著, 周晓枚, 韩晖译. 隐秩序:适应性造就复杂性. 上海:上海科技教育出版社, 2000.

[4] 中文维基百科. http://zh.wikipedia.org/. 访问日期:20071226.

[5]McHenry Robert. The Faith-Based Encyclopedia. TCS Daily. 2004-11-15. 

[6] JohnSeigenthaler Sr. A False Wikipedia 'Biography'. USA Today, 2005-11-29.

[7] Jim Giles. Internet Encyclopedias Go Head to Head.Nature. 2005,V438: 900-901.

[8] Cohen, Noam. A Contributor to WikipediaHas His Fictional Side. The New York Times. 2007-3-5.

[9] Stacy Schiff.Know It All. Can Wikipedia conquer expertise? 访问日期:20071226.

http://www.newyorker.com/archive/2006/07/31/060731fa_fact#editorsnote.

[10] User:Dragonsflight/Log analysis.

http://en.wikipedia.org/wiki/User:Dragons_flight/Log_analysis.访问日期:20071226.

[11] 维基百科数据统计.http://stats.wikimedia.org/. 访问日期:20071226.

[12] 中国大陆封锁维基百科事件. http://zh.wikipedia.org/wiki/中国大陆封锁维基媒体事件. 访问日期:20071226.

 



[1] 作者简介:罗志成,男,1984年生,硕士研究生。研究兴趣为:信息检索,Web2.0Email:luozhicheng.dut@gmail.com

原创粉丝点击