«上一篇
文章快速检索     高级检索
下一篇»
  科学与社会  2016, Vol. 6 Issue (2): 67-84  
0

引用本文 

林寒, 罗教讲. 互联网社会实验研究:社会学研究的变革与进步——基于国外已有成果的分析[J]. 科学与社会, 2016, 6(2): 67-84.
LIN Han, LUO Jiao-jiang. Internet Experiment for Sociology Research: the Revolution and Progress of Sociological Research——Analysis Based on Foreign Research Results[J]. Science and Society, 2016, 6(2): 67-84..

作者简介

林寒,武汉大学社会学系博士研究生。研究方向为社会学理论与方法;
罗教讲,武汉大学社会学系教授。研究方向为经济社会学与行为经济学、历史社会学与空间社会学、社会心理学、社会研究方法等。

互联网社会实验研究:社会学研究的变革与进步——基于国外已有成果的分析
林寒, 罗教讲    
武汉大学社会学系
摘要: 互联网社会实验研究的出现是社会研究发展、互联网相关技术进步与普及的必然结果。本文基于互联网社会学实验的两个典型案例,总结互联网社会学实验研究的特点,分析互联网社会学实验研究较传统的社会学研究的优势和局限。目前互联网社会实验研究尚处于初步阶段,成果不多,但是所具有的优势不容忽视,可能成为今后社会学研究的一种主流,非常值得我们关注和借鉴。
关键词: 互联网社会实验研究    社会学研究    典型案例    进步    
一、问题的提出

互联网是信息高速交换的网络,便捷地获得、传递、处理“大”数据,提高数据交换的效率、降低数据交换的成本是其特点之一。如今,互联网已融入人类生产和生活的方方面面,已经成为国家综合实力的重要体现。重视和利用互联网与促进社会经济的发展有着紧密的关系;对于学术研究来说,互联网的重要性也日益显现。

一些学科领域已经开始利用互联网实验开展学术研究,如计算机领域、经济学领域、心理学领域、社会学领域等。利用citespace进行文献统计和分析可以发现,自1995年开始便有了利用互联网开展学术研究的成果,最近几年更是学术成果不断涌现。从1995年到2014年间,共有78篇相关成果(见图 1)。从文献类型来看,普通论文有50篇,会议论文有26篇,评论和书籍各有1项。从作者国籍来看,美国有33篇相关成果,占论文总数的44.6%;中国有12篇,占论文总数的16.2%;英国有11篇,占论文总数的14.9%;德国有5篇,占论文总数的6.8%;加拿大有4篇,占论文总数的5.4%。发文较多的机构包括牛津大学、伦敦大学、普林斯顿大学、康奈尔大学、北京大学、巴贝什·博尧依大学(位于罗马尼亚的克鲁日城市)等,每个机构都有3篇成果。从涉及的学科领域来看,计算机领域的成果最多,共有26篇,占总成果的35.1%;社会学领域也有16篇,占总成果的21.6%。

图2 实验格局图

互联网实验已被应用于社会学研究中。比如,美国哥伦比亚大学的社会学家用互联网实验研究了弱关系的力量,发现只要通过“电子邮件的6次信息接力”,任何一个普通人都可以同世界上任何一个陌生人联系上[1]。这个实验广为流传,且经典、简单、通俗,但未形成正式的研究成果。

前面文献统计涉及的互联网社会学实验研究绝大多数来自美国。比如哥伦比亚大学的Matthew J. Salganik团队利用互联网实验研究了人类文化市场的不平等性和不可预测性。研究发现一首歌曲之所以能够成功,其质量很重要,而机遇则更关键。该研究成果于2006年发表在(Science)杂志上[2]。2010年又一篇互联网社会学实验研究的成果发表在《科学》杂志上,这是麻省理工大学斯隆管理学院的经济社会学教授Damon Centola领导指挥的一个有1528人参加的互联网实验。该实验通过人工虚拟社区健康行为扩散研究了社会网络对行为扩散的影响,发现被实验者收到社会网络中的邻居的强化信息时,后续行为将被这些信息影响[3]。Arnout van de Rijt团队用互联网做了“成功积累成功”的动力学网络实验,研究发现初始优势对成功产生了正向的反馈,但对成功的作用呈递减的趋势。研究成果于2014年发表在《美国科学院院刊》(PNAS)上[4]。Milena Tsvetkova等人用互联网随机测试了“慷慨”行为的传染。结果表明,那些接收过陌生人帮助的人增加了慷慨帮助他人的意愿,看到他人帮助陌生人而自己没有受到任何帮助的人其慷慨助人的意愿反而下降。该成果于2014年发表在PLOS ONE上[5]

国内只有罗炜、罗教讲等学者在综述性文章《新计算社会学——大数据时代的社会学研究》中提到“互联网社会学实验研究是运用互联网这个平台而开展的社会学实验研究,是真正理想的、在自然条件下进行的社会学实验研究,是一种全新的试验方法,该实验方法有可能成为未来社会学研究的主流方法”[6]。此外,没有关于互联网社会学实验方面的专门研究。虽然也有一些社会学领域的、与互联网相关的文章,但主要是关于互联网对人类生产、生活影响的研究,如宋巨盛用社会学视角分析了互联网对现代人际交往的影响[7],王胜利研究了互联网条件下社会学专业双语教学的实践[8]。国内社会学界已经意识到互联网融入且影响了人们的生活,使用互联网已成为人们的一种生活方式和生产方式,但是对于互联网作为社会学研究工具的认识还不够。

关于什么是互联网社会学实验研究,目前还没有一个明确的定义。互联网社会学实验研究既属于大数据研究的一个分支,也属于社会学实验研究的一个分支。大数据研究以云计算为基础进行信息储存、分享和挖掘,然后有效地将这些大量、高速、多变化的终端数据(包括结构化数据和庞大的、不规则的非结构化数据)储存下来,并随时进行分析计算,其目的不是解释因果关系,而是让数据自己“发声”展示相关关系[9]。传统的社会学实验研究主要分为实地实验研究和实验室实验研究两类,其收集资料的方法有自填式问卷、结构式问卷、结构式观察、量表测量等,处理资料的工具主要有SPSS软件、STATA软件等[10]。社会学实验研究是一种经过精心设计,并在高度控制的条件下,通过操作某些因素来研究变量之因果关系的、不可重复的研究。互联网社会学实验研究的产生是社会学研究发展的必然结果,它可以研究几乎所有的人类行为和社会现象。作者认为,互联网社会学实验研究是以计算机、互联网与人工智能技术等为平台,在高度控制的条件下,通过操作某些因素,利用云计算等新方法来获取数据与分析数据,从而研究和解释变量之间的相关关系的研究。其目的是发现两个变量之间是否具有相关关系。

互联网社会学实验包括了三对基本的实验要素:一是目标变量和相关变量。相关变量也叫影响变量,它是研究者对实验组进行前后测之间通过操纵引入的变量;目标变量是研究所测量的变量。二是前测与后测。在实验设计中,需要对目标变量进行前后两次相同的测量;第一次在给予实验刺激之前,称为前测;在给予实验刺激之后称为后测[10]。三是实验组和控制组。接受实验刺激的那组是实验组;控制组也叫对照组,各方面与实验组相同,但在实验过程中不会被给予刺激[10]。其实验的逻辑是先测量目标变量Y,得到结果1,引入相关变量X后再测量目标量Y,得到结果2,将结果1和结构2进行比较。[11]

运用传统的实验方法来研究人类行为和社会现象存在诸多难以克服的弊端和障碍[6]。以往的社会学研究中,运用实验研究方式的并不多[11]。互联网社会学实验研究运用互联网这个平台来进行社会学的实验研究,相比于传统的社会学实验研究和社会学调查研究、社会学实地研究、社会学文献研究都是一种创新,可能成为未来社会学研究的主流之一。这是社会学研究领域的重大变革与进步。

二、两个典型案例的分析

已有的关于互联网社会学实验研究的成果,其研究问题、使用的网站、具体方法和技术、实验步骤、实验模式、实验时间、实验介绍的详细程度等都不尽相同,难以统一归纳。为了方便比较和完整地呈现真正的互联网社会学实验研究,本部分选取了两项典型的成果进行分析。

1 .基于人类文化市场的不平等和不可预测性 的实验研究

为了弄清楚如何才能很快地在文化市场取得与平均业绩有显着差别的成功,及以利润为动机且进行了广泛市场调研的专家们为什么很难预测产品的成功,哥伦比亚大学Matthew J. Salganik团队(团队的成员基本是社会学专业人员)根据实际条件,利用互联网为平台,做了相应的社会学实验。[2]

该实验创建了一个人工“音乐市场”,共有14341人参加。参与者主要是来自世界各地、对音乐感兴趣的青少年。他们阅读了一份写满来自不知名乐队的、不知名歌曲的清单(总共48首歌曲)。在实验条件下,参与者不知道自己正在被研究,更不知道自己的所思、所为被转换成了数据。所有参与者被随机分配到两个实验环境中的一个:独立的实验环境和有影响力的社会环境,有社会影响力的实验环境共分为彼此相互独立而向前发展的8个小“世界”。 被实验者被要求从一星(“我恨它”)到五星(“我爱它”)给歌曲打分,他们有机会(但不被要求)下载这些歌曲。这里将这一实验格局简化如下:

图2 实验格局图

实验的目标变量是人类文化市场的不平等性与不可预测性。实验的相关变量(影响因素)是以前的参与者的下载量、歌曲流行程度排序等。

第一组实验的目标变量是人类文化产品成功的不平等问题。实验由两个部分组成,第一部分:在独立实验环境中的被试验者(控制组1)可以试听歌曲,但是没有其它任何的干扰因素(前测1);在有社会影响力的试验环境中的被实验者(实验组1)可以试听歌曲,也可以看到前人对歌曲的下载量(后测1)。第二部分:在独立实验环境中的被试验者(控制组2)可以试听歌曲,但是没有其它任何的干扰因素(前测2);在有社会影响力的试验环境中的被实验者(实验组2),可以试听歌曲,也可以看到前人对歌曲的下载量,还可以观察到歌曲流行程度的排序(后测2)。实验结果的计算原理公式如下:

${{M}_{i}}={{d}_{i}}/\sum\limits_{k-1}^{s}{{{d}_{k}}}$

其中,歌曲i的市场份额是Mi,di是某首歌i的下载次数,i是可以变化的,S是歌曲的数量;

$G={{d}_{i}}/\sum\limits_{i=1}^{s}{\sum\limits_{j=1}^{s}{|{{m}_{i}}-{{m}_{j}}|/2S\sum\limits_{k-1}^{s}{{{m}_{k}}}}}$

其中,歌曲i成功的不平等性由基尼系数G表示,G的取值在0—1之间。0表示完全平等,1表示最大的不平等,Mii歌曲的市场份额,Mj是j歌曲的市场份额,dii歌曲的下载次数,S是歌曲的数量。

结果显示,后测1中的文化产品成功的不平等性大于前测1中的文化产品成功的不平等性,后测2中的文化产品成功的不平等性大于前测2中的文化产品成功的不平等性,这表明社会影响因素明显造成了文化产品成功的不平等性;后测量2与前测量2的不平等系数大于后测量1与前测1的不平等系数,也就是说在其它条件不变的情况下,相关影响因素增加,不平等系数也会随之增加。

第二组实验的目标变量是人类文化产品成功的不可预测性问题。第二组实验也是由两个部分组成,除了目标变量不同外,其相关变量(影响因素)、前测1与后测1、前测2与后测2的相关程序和逻辑是一样的。实验结果的计算原理公式如下:

${{u}_{i}}=\sum\limits_{j-1}^{W}{\sum\limits_{k-j+1}^{W}{|{{m}_{i,j}}-}}{{m}_{i,k}}|/\left( \frac{W}{2} \right)$

其中,ui是歌曲i的不可预测性,mi,j是歌曲ij世界里的市场份额,mi,k是歌曲ik世界里的市场份额,W指的是某个“世界”,2是将某个单一的世界拆分成两个亚群体;

$U=\sum\limits_{j=1}^{s}{{{u}_{i}}/S}$

其中,U指整体的不可预测性,ui是歌曲i的不可预测性,S是歌曲总数。

结果显示,后测1中的文化产品成功的不可预测性大于前测1中的文化产品成功的不可预测性,后测2中的文化产品成功的不可预测性大于前测2中的文化产品的不可预测性,这表明社会影响因素明显造成了文化产品成功的不可预测性;后测量2与前测量2的不可预测系数大于后测量1与前测1的不可预测系数,也就是说在其它条件不变的情况下,相关影响因素增加,不可预测系数也会跟着增加。

实验结果回答了研究者提出的问题,即要想在文化市场脱颖而出,除了文化产品本身的质量过硬外,社会影响因素很重要,可以采取宣传手段等方式增加产品的成功机率;用传统方法进行了广泛市场调研的专家们之所以很难预测产品成功与否,不是因为他们是不称职的专家,而是因为外界不可知的影响因素太多。成功只有一部分取决于质量,最好的文化产品很少失败,而那些最差的文化产品则很少成功,其它处于中庸状态的绝大多数普通文化产品成功与否则主要看机遇。

Matthew J. Salganik团队研究了文化产品成功的不平等性和不可预测性两个问题,设计了两组实验。两组实验同时完成,每组实验的模式相似,都包括了两组前后测,但计算原理不相同。但是在公开发表的成果中,作者没有对该实验花费的时间、具体使用的网站、具体的处理技术和软件进行说明。其计算原理、实验逻辑和具体方法可以用于研究其它人类行为和社会现象,但以后的研究者很难简单地模仿。

2 .“成功积累成功”动力学的网络实验研究

“成功积累成功”动力学的网络实验研究是由Arnout van de Rijt团队完成的。[4]该团队由社会学专业的人才和计算机专业的人才组成。研究者首先提出了疑问:“为什么看似相似的成功者往往经历了迥然不同的成功轨迹,有些人是经历了多次失败才成功,另一些人则一直成功”?然后给出了研究假设:不同类型的成功经验揭示了未观察到的相关维度,而这些维度和先前已发生的事件相关;另外天生的初始优势对成功产生了正向反馈,加速了成功者和失败者的分化,造成了无法控制的不平等。

该研究由四个独立的子实验组成。这四个子实验的ID号分别为:373335,366647,230771和442574。实验由纽约石溪大学人类研究委员会批准并服从kickstarter.com,epinions.com,wikipedia.org和change.org的使用条款。每个子实验的被实验对象都是随机选择和随机安排的,每个实验中都设定了控制组和实验组,实验开始后,研究者通过第三方对每一个实验中的控制组和实验组每天的后续资助、评级、褒奖和签名保持记录。实验的目标变量是各种类型的成功:获得资助(kickstarter.com)、获得好的评级(epinions.com)、获得社会地位(wikipedia.com)、获得签名支持(change.org)等,实验的相关变量(影响因素)是初始优势:资金、评价、地位、支持度。

第一个实验以公众筹资网站Kickstarter.com为平台。每个项目的每笔资助都在网站上有记录,后来的资助者可以看到这些记录。实验抽取了若干个符合条件的、新的、没有获得资助的项目(作为抽样框),并从中随机选取大约一半的项目,在项目开启之时给予其融资目标一定比例的资助(初始优势)。有资助的是实验组,没有资助的是控制组。实验共有两轮,两轮共得到293个研究案例。第一轮选择了集资最低目标为1000美元、最长期限为24天的筹资项目项目若干个;从中随机抽取一个子集,在实验控制条件下给予其最低集资目标的1%或10%的的投资(实验组);其它没被抽中的项目则没有实验操作下的投资(控制组)。第二轮选择了集资最低目标为5000美元、最长期限为24天的筹资项目若干个;从中随机抽取一个子集,在实验控制条件下给予其最低集资目标的1%的单独投资或4%的分为4个投资者投入的投资——实验组;而没有被抽中的项目没有实验操控下的投资(控制组)。第一轮的资料收集时间区间为2012年7月到2014年2月,第二轮的资料收集时间区间为2013年9月到2014年3月。

第二个实验以消费者评论网站epinions.com为平台。新产品都有书面评估,而那些书面评估会被网站的浏览者评定为“非常有用”、“有用”、“有点用”、“没有用”四个等级。每个书面评估的评级都在网站上有记录,后来的浏览者可以看到。评审人为这些书面评估付款,且评审人会对那些被认为很有用的书面评估支付更多的报酬。实验抽取了若干个新的、未被评定的、具有一定水准的书面评估,然后从中随机抽取一个子集,在实验控制下给予“非常有用”的评级(初始优势)。有初始优势的子集为实验组,而没有初始优势的为控制组。实验共有两轮,两轮共得到481个研究案例。第一轮中的初始优势是一个单独的积极评级“非常有用”,第二轮中的初始优势是一个单独的积极评级“非常有用”或来自实验团队的四个人分别给出的四个评级“有用”,在控制组中则没有这样的评级。第一轮收集资料的时间为2012年10月到2013年8月,第二轮收集资料的时间为2013年9月到2014年1月。

第三个实验以百科全书网站wikipedia.org为平台。在这个网站里,编辑们通过对网络社区成员贡献的评定来获得地位的褒奖,而褒奖显示在相关编辑用户的网页上,后来者可以看到。研究者抽取了521个在总体中最高产的编辑(占总体的1%),再从这些编辑中随机抽取208人作为一个子集,研究者在实验控制的条件下给他们的用户网页留下了褒奖(初始优势),他们是实验组,其余则是控制组。资料收集的时间为2012年2月到2012年7月。

第四个实验以请愿网站change.org为平台。请愿帖子通过收集不同姓名的人或匿名的人的签名,获取带有社会或政治目的的公众支持信息,而不同请愿活动的签名都显示在网站上,后来者可以看到。研究者从早期请愿活动中抽取有5—15个签名、公开时间少于14天、最近24小时没有获得新的签名的请愿活动。最后,有200个请愿活动符合以上标准且通过了不良信息检测(这些被选的样本不会对发帖的个人或群体造成不良影响)。然后研究者从200个样本中随机选取100个样本放进实验组,100个样本放进控制组。研究者给实验组中的请愿活动增加了12个匿名签名(初始优势),在控制组中则没有这个优势。这一资料收集的时间为2012年的7至8月。

这四个实验代表了一系列的成功类型,如图 3(在不改变内涵的基础上,笔者对原图进行了一定的处理)所示,这些曲线显示了资助(①②线)、积极评价(③④线)、褒奖(⑤⑥线)和签名(⑦⑧线)的实时数目。实线代表实验组,虚线代表控制组。横轴在时间上经过标准化,零点代表实验干预的开始,1表示观察期的结束。纵轴也经过标准化处理,1代表了在实验时间和环境中所能获得的最大值。在每个子实验中,和控制组中的对象相比,初始优势为任意选中的实验对象提供了显著的支持,提高了他们在之后成功的机率。然而,初始优势对成功的作用呈递减趋势,具有初始优势的样本并不是一直都能取得最大的成功,过了一定的时间后,它们成功的步伐开始放慢(递减的边际效益)。

图3 成功积累成功的变化图

Arnout van de Rijt团队通过四个子实验研究了不同的成功类型,回答了研究者的疑问。研究者提出的研究假设在一定程度上是成立的,比如,有初始优势的个体较没有初始优势的个体更加容易成功,但是初始优势对成功的作用呈递减趋势。该成果对实验花费的时间(历时长)、具体使用的网站都有介绍,但是没有说明具体的处理技术和软件。该实验成果是由计算机界与社会学界合作完成的,技术问题和软件问题主要依靠计算机专业的成员。社会学界的学者很难单独地做类似研究。

三、互联网社会学实验研究的特点

基于对已有成果的分析,互联网社会学实验研究较其它传统的社会学研究而言,有自身的特点。

一是研究条件的理想化。互联网社会学实验研究的研究条件是真正理想化的自然条件。控制组是理想的控制组,实验组受到的刺激也是在实验控制的条件下给予的。如在人类文化市场的不平等和不可预测性的实验研究中,控制组在独立的环境下被实验,实验组的影响因素仅包括以前参与者的下载量、歌曲的流行等级排序等。这与现实社会中的社会影响力不完全相同,现实社会中有太多的未知影响因素。

二是受到政治、伦理、道德等方面的限制。大数据是自然的形态,个人的点滴信息都处于信息的汪洋大海中。社会实验研究为了保证研究结果的相关性,需要孤立、净化实验环境,且需要操作、控制、改变某些变量,而这些操作、控制和改变都发生在人的身上,涉及到人的研究都必须考虑政治的、伦理的、道德的限制[10],不能越界。如在“成功积累成功”实验中,被选中的请愿活动不会对发帖的个人或群体造成不良影响。

三是强调相关性。互联网社会学实验的研究目标是探索和解释现象之间的相关关系。通过随机化地选择实验对象、建立实验组与控制组,引入和操作实验刺激,进行前测和后测,通过比较控制组与实验组、前测与后测揭示出变量或现象之间的相关关系。如文化产品成功的不平等性和不可预测性与以前参与者的下载量、歌曲的流行等级排序等影响因素有相关关系,而初始优势与成功的关系则是:有初始优势的个体较没有初始优势的个体更加容易成功,但是初始优势对成功的作用呈递减趋势。

四是跨学科性突出。与传统社会学研究相比,互联网社会学实验的跨学科的特性非常突出。互联网社会学实验研究强调社会学与自然科学、技术科学的交流合作,因为新型工具和软件的开发需要社会学家、计算机、互联网、人工智能等各方面专家的合作才能完成[6]。互联网社会学实验研究融合了不同学科的研究特点。

五是结果的无限性。互联网社会学实验可以动用任何地方、任何时候、几乎任何人的大数据,所以可预见的结果是无限的,这给社会学家提供了无限的想象力,一是大样本量和大信息量给研究结果带来了无限的可能,二是信息的杂、乱,及互联网真实世界的各种无法预期的干扰因素和偏态样本导致了研究结果的无限可能。

四、互联网社会学实验研究的优势

各类传统社会学研究都有一些缺陷,缺陷的多寡不一。根据研究需要,研究者通常会选择调查研究中的抽样调查、实地研究中的参与观察和个案抽样研究等方法,当然文献研究的方法也常被使用,但是实验研究难以控制,所以在社会学研究中运用较少。常用的传统社会学研究方便开展,且取得了相当的成就,但人的特殊性、社会现象的复杂性、研究易受干扰、研究难保持客观性等给传统的社会学研究提出了许多不同于自然科学的难题[11]。而已有的互联网社会学实验研究(属于实验研究的范畴),基于互联网平台,利用互联网技术和人工智能技术等高新科技(逻辑性强且不容易出错),吸取了自然科学研究和社会科学研究的优点,相对于传统社会学研究方法而言有不可忽视和不可替代的优势。

一是容易得到更大的样本量和信息量。社会学研究有时候需要大样本量和大信息量,如中国社会状况综合调查,其研究对象涉及全国,研究内容涉及人们生活的方方面面。但传统的研究方法很难获得大量样本、大量信息,只能采用抽样的方式来处理。传统社会学研究方法往往有这样一些局限:一则受人力、物力、财力的限制;二则研究者与被研究者之间存在时间距离和空间距离;三则研究者想从单个样本获取的信息量越大则越不容易获得更多的样本量,被研究者的态度也可以决定研究的耗时量(除了文献研究外);四则研究者的能力、素质(如不善表达,没法让被研究者配合)和被研究者的能力、素质(如记忆力差,没法回忆曾经发生在自己身上的事情)的限制。作者曾经参加了2014年的“中国社会状况综合调查”。这是带有强烈行政性质的调研,入户很容易,但是问卷很长,有时户主不一定有时间,常出现被调查者填到一半却临时有事要出去的情况。此外还有语言沟通的问题。作为调查者,我们带了能听懂当地方言的村民或村干部一起入户,很多时候是边问边答,中间还有人翻译,加上问卷较长,填完一份问卷需要五十分钟到两个小时。一天时间里能回收的问卷数量并不多(得到的数据基本是定量数据,定性资料很少)。而以个案访谈的方式开展全国性的实地调研,收集定性资料则更加难以实现。很少有研究者进行尝试。

以大数据为基础,利用互联网技术和人工智能技术等高新科技手段收集和处理信息,可以获取、处理无限大的样本量和信息量(定性和定量)。但这不是说互联网实验研究可以获取大样本量和大信息量就会“只要整体不要样本,只要模糊不要精确”。人类文化产品的不平等性和不可预测性的实验研究随机选择的研究对象为来自世界各地的、对音乐感兴趣的青少年,严格的实验逻辑精确地推断出了外界影响与文化产品成功的不可预测性和不等性有相关关系(研究的目的就是发现和讨论相关性)。而“成功积累成功”的动力学网络实验也是根据实验的需求在成千上万的网民中抽取一部分作为研究的对象,不同网站的4个不同的子实验反复论证了同一个问题。相比之下,互联网社会学实验的抽样研究较传统抽样研究更先进。

二是容易得到更真实和更客观的信息。在传统的社会学研究中,研究者与被研究者必须有直接或间接的接触(文献研究除外),加上各种复杂因素的干扰,研究者很难获得真实和客观的信息。比如,传统的问卷调查研究一般通过入户面对面、邮寄问卷、电话访问、互联网问卷星等方式。为了让被调查者提供真实、客观的信息,研究者在设计问卷时会尽量把问题设计得合理,把问卷的问题语言与被调查者身份特征联系起来;在调查过程中调查员不仅要注意衣着、形象,还要尽量注意说话的语言语调;除了人们不愿意回答真实客观的信息外,年龄太小、年岁过高、智力低下、记忆力差等都会造成信息的失真。

互联网社会学实验研究能够获得更真实、客观的信息是基于理想化的、自然的实验条件。实验组和控制组都在实验条件的控制下,研究者能够集中针对某个目标进行研究。互联网实验收集的数据不是由被调查者自己说出来的,而是被调查者通过互联网开展相关活动时上留下的记录,研究者利用互联网的记录提取有用的数据进行研究。如“成功积累成功”的互联网实验中,研究者根据研究需要选择一些筹资项目、书面评估、最高产的编辑、请愿活动,随机分配到实验组和控制组,给实验组一定的刺激,人们在不知情的情况下、在常用的网站上正常开展活动而成为实验对象的。“不知情”是实验结果客观、真实的关键,但是这不代表研究者可以逾越政治、伦理、道德而获得被研究者的信息。

三是能更方便快捷地收集和处理所得信息。假设现在要预测中国大陆公民在2015年的国庆节期间会选择什么交通工具出游和到什么地方旅游,以2015年6月1日为起始日期,2015年9月30为终止日期。时间有限,地域范围涉及到全国。传统的研究方式中只有抽样的调查研究最可靠。如果用传统的方式发问卷,按照一定的标准在各个省、市、县抽取一定比率的样本,发问卷、收集问卷、统计分析问卷都非常繁琐,很难在2015年国庆节前得到基本的数据。且不说因为人力、物力有限,很难在短时间内对全国开展旅游动向和旅游方式的调查,就问卷设计、问卷发放、问卷回收、问卷统计分析,每个环节都要经过漫长的时间。可以预料到的结果是:最后调研工作没有完成,国庆节已经结束。这种具有一定时效性、涉及地域广,需要大量样本的研究需要借用互联网平台方便、快捷地完成。

互联网社会实验研究得到了计算机、互联网、人工智能等各方面专家的支持,时间和空间问题得以解决。不管在哪里、不管什么时候人们一旦使用互联网,他们的行为信息便被记录下来。我们可以在很短的时间内得到充足的数据,在较短的时间内利用互联网技术将数据进行统计分析。如人类文化市场的不平等性和不可预测性实验有世界各地的14341位被实验者参与,研究了两个问题,涉及到两组实验,但两组实验是同时完成的。而要预测我国2015年国庆节的旅游动向和旅游方式,基于互联网平台,收集人们购买车票或机票的信息、人们用网络地图查询某个地点的信息、人们查询和预定酒店的信息、人们预定和团购餐饮的信息等,利用云计算工具就可以方便、快捷地分析和预测出人们国庆节外出旅游的基本情况,提醒相关地方的旅游部门提早做接待准备。

四是获得信息的成本更低。传统的社会学研究方法,包括调查研究、实地研究、实验 研究,常需要耗费大量的人力、物力、财力。传统的文献研究的成本稍微少一些。从研究的设计到研究的开展,再到收集和分析资料,得出研究结论,每个环节都会产生费用。比如因为耽误了被研究者的时间,研究者需要给被研究者物品、金钱等礼物作为报酬;如果派研究员到外地调研,还需要给他们支付差旅费、劳务报酬等。如2014年某985高校的社会学系主持了某省级市的社会综合状况调查,由系主任牵头,包括教授、博导在内的所有老师都参与设计问卷,由博士生和硕士生担任调研督导,出动了几乎所有的本科生和硕士生去实地调查。问卷用五号字体、正常排版、共45页。历时一年多后共回收了1878份有效问卷,花费100多万人民币。用传统的研究方式收集资料,需要获得的信息量越大、样本量越大、被研究者分布越分散,花费的人力、物力、财力就越多。

互联网社会学实验研究在各个学科的支持下,可以轻松快捷地得到真实的、客观的大样本量和大信息量,且节省成本。如“成功积累成功”动力学的网络实验的5个小实验不用招募被试验者,来自世界各地的被实验者在不同的网站根据自己的需要选择自己的行为,研究者不用以研究的名义,花费高成本来获取他们的信息,而相应的网站和方法技术还可以开展其它的研究。

五是有先进的和可循环利用的技术和设备。传统研究需要一次一次地对研究人员进行培训。不同的项目要进行不同的培训,产生不同的费用。如国家统计局调查大队和社会科学院等机构,由于机构人员有限,一旦遇到需要很多研究人员参与的大项目,就需要从学校学生、机关公务员、村干部等中招聘和培训一些研究人员,然而有经验的研究人员在完成一个项目后可能不会参与下一个项目,因而参与人员可能年年都不一样,机构再做下一个项目又得重新招聘和培训没有经验的新人。

互联网社会学实验研究所使用的技术和设备较传统社会学研究使用的设备和技术先进。被研究者只要使用了互联网,研究人员就可以通过相关软件收集他们的行为信息。互联网社会学研究的信息收集员和信息处理员就是计算机设备。购买软件、复制软件或者研发软件,然后学习软件操作,利用软件就可以进行互联网社会学实验研究。已有研究所使用的软件和技术在一定条件下可以用于以后的研究,设备和软件只要不出问题就可以一直循环利用下去。学会一套或几套实用的软件便可以进行相关的数据收集和分析,且一套软件往往带了许多功能,可以进行多方面的研究。

五、互联网社会学实验研究的局限

互联网社会学实验研究是一种全新的研究,具有传统社会学研究无法比拟的优势,但还是有一些难以克服的局限性。

一是技术门槛较高,社会学界不易单独开展。一般社会学界的研究者难以掌握和准确使用互联网技术,开发软件、抽取样本、控制干扰因素、剔除偏态样本、收集数据、分析数据等步骤都需要依赖其它专业的人才。如“成功积累成功”的网络实验研究是社会学专业和计算机专业合作的成果,而文化产品的不平等性和不可预测性的实验虽然没有在成果中提及其他专业人才的贡献,但是软件平台的搭建、互联网技术的处理等还是需要相关的专业人才协助。

二是研究的过程较传统研究更加难于控制。社会学实验的平台是互联网,研究者与被研究者一般不会有直接的或间接的接触。被研究者通过互联网开展日常生活而留下可供研究的数据。参与互联网社会学实验研究的对象很多,他们根据自己的意愿开展行为活动。如“成功积累成功”动力学实验在完全开放的互联网平台进行,所有人在不知情的情况下可以随其意在互联网上产生行为活动,研究者在实验控制的条件下给实验组增加刺激量,但实验对象很难因某一种刺激而产生相同的反应。加上不可预测因素和偏态样本的存在,研究者很难控制实验的发展。

三是伦理问题难以把握。人们担心大数据给个人隐私带来危机,但又不得不使用互联网,而一旦使用就成了透明人。互联网社会学实验研究的被研究对象是人,在保证被研究者不会受到不好的影响,坚持基本的伦理和道德原则的基础上,如何遵循当事人“知情同意”的原则?事前同意如何保证结果的客观性和真实性?事后同意如何保证人们“真正的同意”?谁有资格收集和整理人们产生的大数据?谁有资格发布整理后的结论?这些问题还需要伦理的规范乃至法律的约束。目前已有的互联网社会学实验研究的内容还仅限于人们愿意公开的、非隐私的问题。

四是互联网社会学实验研究还不稳定。虽然国外已经逐步开展互联网社会学实验研究,但在16个已有的研究成果中,所用的数据收集方法不尽相同,其中一些实验通过临时和计算机等专业合作开发软件而开展,但目前还没有统一的、稳定的互联网社会学实验研究的软件、工具和方法。

五是互联网社会学实验属于人文实验,可重复性不高。后来的研究者可以理清已有研究的原理、程序,掌握所使用的研究方法,但时过境迁,社会大环境和人们的整体心态可能发生改变,利用相同的原理、程序、方法研究同样的问题也很难得出和以前完全一样的结论,而科学研究恰恰是要求可重复的。

六、结 语

互联网社会实验研究发展的外在条件是互联网相关技术的进步与普及,内在条件是社会学研究方法、研究问题与互联网特点的契合性,以及研究者勇于尝试、勇于创新的研究精神。互联网社会实验虽然出现的时间较晚,也有一些局限性,但其优点也是非常显著的。互联网实验不仅可以研究上述“人类文化市场的不平等和不可预测性”,“成功积累成功的动力学”等问题,还可以研究其它几乎所有的人类行为和社会现象。它是未来社会研究的一种主流方法,对于我国的社会学研究来说,非常具有借鉴意义。互联网社会实验研究的成果数量虽然不多,但不少都很有典型性。查阅这些互联网社会实验研究的成果,利用成果进行分析,可以找到互联网社会实验研究的规律和方法。

此外,基于互联网社会学实验研究的特点,加强学科间的交流不容忽视,这是在研究实践中需要重视的。在研究中,社会学研究往往需要借鉴其它已经成熟利用互联网实验开展研究的学科领域,加强与计算机、互联网等相关学科的联系,提出自己的研究设想和要求,合作开发应用软件。在完成某个互联网实验后,常常还会出现经济学家利用实验收集到的经济学数据做研究,社会学利用收集到的社会学数据做研究的情况,即不同学科可以用同一份数据进行研究。互联网社会实验研究的交叉融合的特征非常显著。

Internet Experiment for Sociology Research: the Revolution and Progress of Sociological Research——Analysis Based on Foreign Research Results
LIN Han, LUO Jiao-jiang    
Department of Sociology, Wuhan University
Abstract: Internet experimental study of the sociology is inevitable outcome of the development of social science research. The study was based on two typical cases, summarized the characteristics of the experimental internet study of the sociology, and analyzed the advantages and limitations of the internet experiment for sociological research over the traditional research. Although the experimental internet study of the sociology was at its early stage, its benefit is obvious and has the potential to become the mainstream of the social science research in the future.
Key words: internet experiment for sociology research    sociology research    typical cases    progress    
参考文献
[1] 教育部普通高中思想政治课课程标准实验教材编写组.思想政治必修4《生活与社会》. http://www.7wenta.com/topic/104768BAAE100C554112C19CFF6EBD84.html.[2016-05-05].(1)
[2] Matthew J. Salganik, Peter Sheridan Dodds, Duncan J. Watts. Experimental Study of Inequality and Unpredictability in an Artificial Cuitural Market. Science, 2006, 311(576):854-856.(2)
[3] Damon C. The Spread of Behavior in an Online Social Network Experiment. Science, 2010, 329(5996):1194-1197.(1)
[4] Arnout van de Rijt, Soong Moon Kang, Michael Restivo, and Akshay Patil. Field Experiments of Success-breeds-success Dynamics. PNAS, 2014, 111(19):6934-6939.(2)
[5] Milena T, Macy M W. The Social Contagion of Generosity. Plos One, 2014, 9(9):e87275.(1)
[6] 罗玮, 罗教讲. 新计算社会学:大数据时代的社会学研究. 社会学研究, 2015,(3):222-241.(3)
[7] 宋巨盛. 互联网对现代人际交往影响的社会学分析. 江淮论坛, 2003,(5):29-32.(1)
[8] 王胜利. 互联网条件下社会学专业双语教学的研究与实践. 陕西师范大学继续教育学报, 2006, (1):36.(1)
[9] 维克托·迈尔-舍恩伯格, 肯尼思·库克耶著. 大数据时代:生活、工作与思维的大变. 盛杨燕等译. 杭州:浙江人民出版社, 2013,Ⅰ-Ⅱ:1-2, 27-94.(1)
[10] 风笑天. 社会学研究方法(第二版). 北京:中国人民大学出版社, 2005:4-8.(3)
[11] 风笑天.社会研究方法(第三版). 北京:中国人民大学出版社, 2009:205-220.(3)