《澎湃新闻》:如何尽可能准确调查网络民意?
10月16日,复旦发展研究院传播与国家治理研究中心发布《中国网络社会心态报告(2014)》。
该报告以对包括专业技术人员(如大学教授、律师、医生、记者、IT工程师)、商界精英与高资产人士(如私营企业主、企业CEO)、党政军体制内工作者(如公务员、军人)和社会底层人士(如农民工、普通工人等)四大社会群体在内的1800名新浪微博用户在2012年到2014年间所发微博为原始研究素材,分析了不同年龄段、不同地域、不同学历的上述群体对包括反腐、房价、收入分配、环保、户籍、医疗、食品安全、就业、教育、养老、民族、宗教等在内的12个议题的态度,较系统呈现了当前中国网络的社会心态。
该报告部分内容发布后在社会上引起广泛反响,一些评论人士和网民希望更多了解报告研究对象的选取、研究方法的确定、对微博言论可靠性的处理等问题。为此,澎湃新闻记者专访了该研究项目负责人、复旦发展研究院传播与国家治理研究中心研究员、复旦大学社会学系教授桂勇,以及项目执行组长、复旦发展研究院传播与国家治理研究中心研究员郑雯博士,请他们解答了相关疑问。
复旦发展研究院传播与国家治理研究中心成立于2012年12月,是国内第一家也是唯一一家以“传播与国家治理”为方向的研究机构。该中心期待社会各界对该报告提出更多批评和指正。
一、在社会情绪表达方面,微博与微信发挥的功能不同
记者:为什么选择微博作为观察对象?
桂勇:我们没有选择博客作为观察对象,一是因为博客互动性差一些,二是因为博客使用的人数相对较少。如果是研究网络社会,那微博和微信更接近于网络社会的形态,人际互动比较明显。不过,到目前为止,微博还是一个比微信更合适的观察对象,因为微博是开放的,而微信是封闭的,会给数据收集工作带来很大困难。另外,微信在本质上不是一个自我呈现的平台,而是一个通讯平台,而微博自我呈现的内容较多,为用户创造网络上的虚拟人格提供了更为理想的空间。
微博与微信的上述两方面区别,使我们选择了微博作为观察对象。
记者:微博、微信的民意表达各有什么侧重点?
郑雯:在社会情绪表达方面,微博与微信发挥的功能不太一样,前者可概括为“弱表达”,后者可概括为“强动员”。微博是具有公开性质的社交媒体平台,人们可在这个虚拟的公共空间中发出各种声音,表达各种态度与情绪,但在大多数情况下这些声音仅停留在网络上,且有很大概率不会引起太大反响。类似于QQ群、微信群这样具有私密性的网络工具则可能成为动员型网络渠道,其情绪表达可能是线上线下一体化的。
微信有如下特点:私密性更强,信息主要在小圈子中流通;同质性高,更有利于群体意识的培育;更有可能提供集体行动的动员条件;微信小圈子中流传的信息更加莫测。
当然,在网络热点的传播上微信与微博也开始出现“协同”作用。比如,2014年的热点事件在传播上存在这样一个现象,即在微信中流传开来,在微博上引起热议,最后由传统媒体进行跟踪报道。
二、如何测量微博用户的态度与立场
记者:1800个样本用户两年间微博数据信息,是如何收集的,具体的研究方法是什么?
郑雯:我们用阅读1800个样本用户近2年发表博文的方式,进行了资料收集与数据编码。研究人员在阅读被抽中的微博用户所发表的全部博文之后,根据自己对博主的总体印象和博文中所显现的蛛丝马迹判断此用户对不同问题的看法与深层认识。
当然,我们的所有研究完全出于学术目的,绝对尊重和保障被研究对象的隐私,相关研究结果也以不同群体为单位,不会涉及到个人信息。即使是数据分析人员,也不会知道数据中的某个个案对应的是哪个网络ID(身份)。
因为无法获得微博用户的整体抽样框(这也是一般研究者在互联网抽样调查中面临的一大问题),而我们研究的着眼点又是以职业为核心指标的不同社会群体的网络心态,所以我们抽样方案的第一步是确定职业。项目组在确定好具体职业种类后,利用新浪微博提供的搜索功能搜索相应的职业人群,并采用系统抽样的方式从中确定最终的抽样名单。为最大程度地确保样本真正属于相应职业群体,项目组要求编码员在阅读样本的全部微博后对样本的职业状况作一总体判断,如果出现编码员实际判断与名义上的职业类别不符的情况,则用备选样本替代该样本。
在数据收集工作中,一个关键问题是编码员对样本作出的判断是否真实准确。与精心设计的线下问卷调查所获得的数据相比,互联网数据可能面临着更大的测量效度问题。由于语义学方面的障碍,用计算机抓取数据的方式在分析网络态度与心态时,准确性不尽如人意。为兼顾成本和准确性,我们尝试用抽样调查加人工编码的方式来解决网络心态研究的数据收集问题。我们要求数据收集人员在读完样本全部微博、了解这是一个什么样的人后再判断其具体态度。与数据抓取相比,这种办法可能效度更高,对心态的描述可能更准确。
桂勇:与线下问卷调查相比,用这种方式收集数据可能也有一个优势。线下的问卷调查往往是由研究者设计出访问的问题框架,再由被访者逐项回答。由于具体问题和问题选项都由研究者设计好,调查的结果实际上也被研究者部分定义好了。而网络世界是自然地呈现,可以通过观察某个ID在网上的整体自我呈现,再回过头判断这个ID的具体特征。研究者相当于使用了观察法而不是面访法来收集资料,这是比较有利的。
郑雯:但网上调查要保证调查员是个很强的人,即做出这个判断的人本身具有准确判断的能力。为此,我们选拔了一批对网络很熟悉,同时理解能力和分析能力都很强的研究生来做数据收集工作。
记者:会不会出现不同的人读同一个微博却得出不同结论的情况?郑雯:这是我们的调查面临的一个重要问题:可信度如何保障?我们花了很多心思在这个问题上,作了现有研究资源条件下的最大努力。首先,我们对怎样判断一个人的整体特征做了统一培训;其次,我们对每一个指标怎样判断也做了仔细培训,仅指标的说明就有2万多字;第三,我们安排编码员共同做了一部分个案,共同对多个ID进行编码测试,看是否存在不同判断,然后在编码员存在分歧的地方反复讨论分歧产生的原因,最终达成分析思路和判断标准的一致。
三、基于互联网的数据是否具有研究优势?
记者:你们觉得这个数据收集和研究方案能推广到其他网络研究中吗?
桂勇:我个人认为,研究方案的设计不能僵化,因为具体的调查研究活动总处于不同的具体情境之中,很难说存在一个绝对通用的版本。
在讨论具体的研究方法之前,我们必须首先讨论研究活动本身的“经济性”问题。只有放在“经济性”这么一个前提下,我们才可能比较客观地评估研究设计的质量问题。
人类基于外部经验的一切认知活动都应置于一个经济的框架下来理解,调查研究活动自然也不例外。我个人的感觉是,社会研究专业人士之外的人群往往低估了社会研究活动的昂贵和实现特定研究目标所消耗成本的巨大。这样,不仅仅是社会公众,甚至包括政府机构和商业组织,都常常会对社会研究工作者抱有过高的期望。这么说不是为社会研究工作者做辩解,至少我个人对自己的研究也是觉得非常不满意,是需要自我检讨的。在客观上,我们需要考虑的是,在给定的“社会研究活动非常昂贵”这么一个前提下,现有的研究活动在实际产出方面可能具有很大的不经济性。
如果放在经济的框架下来讨论社会研究,社会研究活动本身的进步实际上可以通过两条路径实现:第一条路径是提高研究活动的“性价比”,使同样的人力物力投入可以获得更多的研究产出,或是同样的研究产出所需人力物力投入有所下降;第二条道路是提高研究活动的质量,使整个研究的流程和技术都往“高精尖”方向前进。在具体社会研究实践中,专业人士往往更倾向于第二条路径,而基本忽视第一条途径。从资料收集的角度来看,由于现有研究资源无法支撑过多的“高精尖”数据,专业研究者对第二条路径的青睐可能造成部分研究为现有的资料和数据所限制,无法越雷池一步。这也是公众对少量社会研究嗤之以鼻的原因之一。
这并不是说改进研究活动的质量不重要。把研究活动往“高精尖”的方向推进,应该是每个研究者的内在责任。但我个人猜想,也许存在着这么一条“熟悉”的曲线:在改进研究质量的早期,额外多付出一点成本就可能带来质量的极大提升;随着改进的不断进行,当研究质量提升到某一个高度后,进一步提升研究质量所需要付出的成本慢慢变得难以承受。考虑到上述情况,改进研究质量的努力方向就不再是单纯提升研究的“高精尖”水平,而是在提升研究的“高精尖”水平与所支付的成本之间寻找最合适的平衡点。
不同研究所找到的平衡点可能是不同的,这需要研究者本人的精心评估。对互联网的调查研究是一个方兴未艾的领域,未来也许会出现相对公认的研究流程与方案,但不太可能存在绝对的标准方案。
记者:那么,跟线下的数据收集与分析相比,你们的研究方案有优势吗?
桂勇:正如我们在一篇论文中所指出的,在社会研究中,线下数据收集常采用的方案是在抽样调查的基础上对被研究对象进行结构式访问(如面访或电话调查等)。这种做法的优点是获得的信息比较全面,对调查结果的控制力也相对较强,但缺点是成本过高。
网络数据存在非常明显的缺陷,这些缺陷至少包括:第一,代表性可能不足,因为上网的人是特殊的,在网络上留下足供分析的信息的人更是特殊的(多数人是“沉默的”);第二,信息可靠性存疑,网络上的信息可能是有误的(如虚假信息),同时更是有偏的(如少数声音被放大);第三,信息不全、不系统。不过,网络数据的优点是相比标准的社会调查,成本非常低。
网络资料的另一个优势是,可以部分突破现实调查中资料收集的方向与测量框架本身被研究者预先确定的弊病。网络资料是被研究对象特征的自然呈现,且提供的信息相对完全。这一优势在社会心态研究上特别明显。
四、不能从网络“舆情”的角度去理解网络“民意”
记者:您认为“网络民意”靠谱吗?
桂勇:我个人观察的结论是部分靠谱,部分不靠谱。靠谱的是,大部分网民对很多问题都有清醒的认识和自己的思考,有时也会在网络上表达出来。部分不靠谱,是因为网络上“三个消费”——消费政治、消费思想、消费人心——的现象并不少见。一些网络热点推手很多,派系严重,商业化味道浓厚。另一个原因是网络上少数人的声音被不成比例地放大了。人们在互联网上获取信息、传播信息以及进行网络表达的成本很低,速度很快,这使网络上更容易拉帮结派。互联网降低了搜索同类人群的成本,促进了特定观点人群集体认同的发展。这造成了“同类聚集效应”,即同一立场或同一议题关注者借助于互联网集中起来,在相关问题上频繁发声,这样规模不大的人群可以通过同时聚焦于同一议题、同一网络事件而爆发出巨大的能量,造成浩荡的声势,给人一种占据舆论主流的错觉。这意味着,不能从网络“舆情”的角度去理解网络“民意”。
在过去,“发声”既是一种权利,也是一种权力;但在互联网给每个人都提供了发声条件的今天,发声更多是一种可供选择的权利,而不是权力。所以在很多网络热点中都存在“沉默的大多数”现象,大量的网络用户可能关心着相应问题,也在思考着相应问题并对问题作出自己的回答,但不会就每个具体问题发表言论。
郑雯:这也是我们以网络用户(而不是网络事件和网络现象)作为数据收集和研究分析单位的原因。以人为核心而不是以事件为核心,可能是我们的研究区别于其他一些研究的关键。记者:那您认为,互联网会在多大程度上影响中国社会稳定?
桂勇:我们的一个总体判断是,互联网在促成抗议性集体行动的出现上具有一定作用,但这种作用是受限制的,不用过分担心。正如我和合作者在一些文章中所指出的,社会运动爆发的基本机理并未被互联网根本改变,互联网不可能直接引发系统性大规模社会运动。需要其他社会条件的同时作用,才可能爆发社会运动。
当然,互联网上信息快速流动、信息获取与发送低成本等特征改变了社会运动的传统动员机制,也改变了中国网民的观念基础,从而为新的集体行动模式的形成提供了土壤。比如,对特定问题具有共同意见的人被互联网聚集在一起,由以利益聚合为中心的集体行动逐步转向以议题聚合为中心的集体行动。再比如,信息通过互联网传播到更为广泛的范围,地方性的情绪更容易扩散成为超越地理界限的集体行动。
五、网络民意要特别重视“沉默的大多数”
记者:网络真的充满戾气?你如何看待当前的网络舆论生态?
桂勇:从舆论生态的角度来看,网络自身也存在一个进化的过程。以新浪微博为例,网络权力结构正在走向多元分化。前几年网络舆论生态中的“单中心”现象——某个核心意见领袖一呼百应、应者云集——越来越少发生,普通网民的注意力更多地投入到分化、分散的不同议题与不同人物上。
另外,通过对网络世界的长期观察,通过对真假相间的网络信息的反复甄别,普通网民辨别是非的水平在提高,对事实与真相的需求在增长,由此也在整体上促进了网络自身的纠偏能力。
一个总的态势是,具有偏执倾向的极端派正成为少数派,而大多数人则显得更为成熟和理性,同时也逐步成为网络的中坚力量。冷静客观地看待问题、不为特定价值立场左右的“温和中间派”人数所占比例较高。我们这次调查的结果是,完全遵循“就事论事”原则的样本占总体的44.3%,大部分时候遵循“就事论事”原则的样本占总体的52.3%。
所以,我认为,普通网民的理性与成熟为网络生态的正常化提供了可能。引起那些沉默的理性思考者的共鸣、获取他们的支持至关重要。
在30多年的飞速发展后,社会呈现出利益分化的格局,社会成员中也出现了多元声音。信息技术的革命、互联网的发展,使得利益的分化和声音的多元更为引人注目。不同利益就在那里,新的声音也在那里,我们无法视而不见。唯一的解决办法,就是使不同利益、新的声音真正融入到国家整体中,同舟共济,凝聚共识,从而推动中国继续往前进。