科研学习|论文解读——了解在线环境中的多数观点形成过程：Facebook的探索性方法(IPM, 2018)

论文标题

Understanding the majority opinion formation process in online environments: An exploratory approach to Facebook

摘要

在在线社区的社会互动过程中，多数观点经常被观察到，但很少有研究用实证数据来解决这一问题。为了确定一个合适的理论视角来解释在线环境中的多数观点构建，本研究调查了偏度统计，它表明在Facebook帖子上有多少"赞"是偏向于主要评论的。从《纽约时报》的Facebook页面收集了3489个帖子，为期100天。结果表明，时间不是偏度增加的影响因素，但评论数量与偏度增加呈对数关系。回归模型和Chow检验显示，这种关系因话题内容不同而不同，但多数观点在总体上都是显著的。++这些结果表明，社会支持导致的从众效应可以成为解释在线环境中多数观点形成的一种合适机制，并且在线社区中的多数观点可能会因高估而被误解++ 。

关键词：在线社交网络；多数观点；从众效应；社会支持

1.引言

自2004年以来，Facebook的用户数量和使用量都在快速增长。Statista(2018)报告称，Facebook成为最知名和使用最频繁的在线社交网络(OSN)服务之一，并估计2018年第二季度Facebook用户数量为22.34亿。++在++ ++OSN++ ++服务的早期，其使用目的仅限于与朋友互动，但很快就变得多用途，可以在原来的社交圈之外分享信息或讨论某些问题++ 。随着用户数量的增加和OSN使用的多样化， OSN已经成为公众舆论的场所。

随着使用目的的变化，对Facebook的学术研究已经通过各种主题和方法完成。关注点之一是OSN社交互动与面对面个人互动之间的区别。具体而言，从社会资本的角度分析OSN的交互行为，分析其对用户感知的影响。特别是Lerman等人(2016)认为OSN可能会让用户误解大多数人表达的观点，因为网络结构允许用户认为某一观点被许多其他用户支持。他们提到，++这种过高估计会造成多数人的错觉，并引发误解。对公众舆论的误解往往会引发意识形态两极分化等问题++ 。因此，应从通信理论的角度对OSN的多数观点趋同问题进行详细研究。
++从众效应可以作为解释++ ++OSN++ ++中多数观点构建的理论++ 。从众效应是一种心理现象，指一群人根据一种感知到的趋势盲目地集中于某一特定选择上，而不根据趋势做出任何价值判断。如果对OSN的多数观点是由从众效应构建的，那么多数观点的形成不是因为其语义重要性，而是因为围绕观点偏斜形成的某种社会结构。换句话说，它意味着大多数关于OSN的观点在语义上并不像我们预期的那么重要。如果这一预测是正确的，那么多数观点并不代表公众观点，我们就可以理解为什么在线社区上发布的观点比实际用户的观点更容易被夸大。因此，一定的社会结构会影响观点偏斜（skewness）。

++除了从众效应的可能性，研究社会支持（++ ++social affordance++ ++）的研究人员还调查了多数观点自然地由社会结构提供的可能性++ 。社会支持来自于一种社会结构，直接提供用户的感知和行为，而没有心理表征或信息处理。借助用户与社会环境之间的动态相互关系，社会支持能够为某些用户行动提供帮助。社会支持概念表明，根据社会结构的类型以及结构是否随时间而变化，观点偏斜可以得到加强、维持或削弱。
++借鉴从众效应和社会支持背景评论，本研究将检查++ ++Facebook++ ++用户对纽约时报++ ++(NYT)++ ++的报纸文章的观点++ 。为了确定某条评论是否为多数观点，我们统计了该评论的"喜欢"数量，为了确认观点的形成是否取决于所讨论的报纸文章的类型，我们将报纸文章分为8类：艺术、商业、烹饪、纽约地区、舆论、体育、美国和世界。++通过回归分析和++ ++Chow++ ++检验++ ，我们发现时间不是造成观点偏斜的影响因素，但评论数量与偏斜程度的增加呈对数关系。回归模型和Chow检验显示，这一关系因话题内容而异，但多数观点总体上是显著的。这些结果表明，社会支持导致的从众效应是解释网络环境中多数观点形成的一种合适机制，而在线社区中的多数观点可能会因高估而被误解。考虑到观点通常倾向于向某些多数观点倾斜，并且每个话题都有自己的倾向性，传播研究人员、营销人员和观点分析者可以确定某个话题的某个观点是被多数人特别支持的观点，还是仅仅因为其主题特征而出现的观点。

2.研究背景

2.1 用户观点分析

++用户观点可以成为分析公众对某一问题或某一产品或服务用户细分市场的重要数据。一些研究提出了基于文本数据分析++ ++OSN++ ++用户观点的技术方法++ 。（Facebook评论文本识别用户感兴趣的事件/用户状态分为好、坏或平均）这些研究表明，各种文本特征可以用来分析OSN上的用户观点，但局限在于，每个用户的观点权重是均等的。几项实证研究表明，用户的关注焦点往往只偏向于一些流行的视频、帖子和评论。要准确把握用户对OSN的观点，就必须关注多数观点及其构建过程。

++在++ ++Facebook++ ++中，多数观点可以通过评论中"喜欢"的数量来识别++ 。一个有很多"赞"的评论可以被认为是一个有很多用户支持的主要评论。"赞"的影响已经在若干研究中得到验证。但在新闻媒体背景下，关于"赞"对评论影响的研究很少。然而，考虑到许多新闻媒体公司和记者已经利用在线社交网络，通过鼓励点击"赞"或"推荐"按钮来吸引用户参与新闻内容，我们可以预测，以前的研究结果将兼容解释新闻媒体背景下的"赞"的效果。
++其他网络科学家探讨了多数观点如何影响用户互动结果++ 。网络研究模型可分为离散和连续。在离散模型中，用户观点由1（同意）或0描述。相比之下，连续模型将用户观点描述为从0到1的连续值。然而，无论网络模型是将用户观点描述为离散值还是连续值，网络分析者都面临着一个重要的问题，即如何将某些文本数据中的一致程度表达为一个数值。为此，许多网络研究都采用了模拟方法或数值例子。然而，由于缺乏实际使用者的反思，这些研究一直受到批评。

2.2 从众效应

++传统上，研究者们关注的是这样一种现象，即人群的选择往往在没有明确判断的情况下趋向于某种观点++ 。例如显性消费现象中，从众效应使消费者对某种商品的偏好随着购买者人数的增加而增加。流行产品的从众效应诱使消费者购买该产品，以进入羊群中。

++研究人员已经在各个领域调查了这些网络效应++ 。例如：政治偏见、宪法议题。尽管这些研究报告了不同的效应大小，但从众效应被认为是多数人观点构建中的一个主要因素。

++一些研究报告指出，从众效应也可以在网络环境中发生++ 。例如：Chevalier和Mayzlin（2006）报告说，在线环境中的从众效应可以以积极和消极的方式发挥作用，而且当它以消极方式发挥作用时，其影响大小比积极方式更大；Sundar、Xu和Oeldorf-Hirsch（2009）表明，从众效应也能影响购买意向。Godes和Silva（2012）调查了在线系统中的一个系统模式，结果显示，随着更多评分的积累，从众效应以一种消极的方式发生。

2.3 社会支持

++与从众效应相关，社会支持为从结构角度解释社会环境中的用户行为提供了一个有用的框架++ 。Chemero（2003，2008）阐述了支持的概念，将其定义为一种将动物的能力与环境特征联系起来的功能。支持主要由生态心理学家讨论，他们声称在直接现实主义中，对象是直接被感知的，因此不需要对对象进行心理表征。一些大脑研究表明，视觉和行动的耦合（支持效应）先于概念分类和显性反应，从而证明了支持的存在。这些结果表明，在我们的意识通知我们看到的是什么之前，一个特定的动作就自动地产生了。

++早期的支持研究主要集中在个体与自然环境的相互作用上，后来扩展到群体与社会环境的相互作用上。++ Baron和Boudreau(1987)提出了社会支持的概念，认为某种合作结构能够承担个体的某种行为。一个人的感知需要与物理环境和社会环境的相互作用。社会承受力可以解释，在一个合作行动（如踢足球）的社会环境中，每个行动者为一个特定的目标所做的一组行动是如何自动和瞬间发生的。
++一些研究已经为社会支持提供了证据++ 。一项著名的研究提出了社会行为的自动性，这通常被称为行为启动效应（behavioral priming effect）。在这个实验中，参与者被分配到含有启动词的文章（例如，"粗鲁"、"麻烦"和"打扰"，这些都是用来启动粗鲁行为的），并被告知这个实验是为了测试语言能力。在阅读了这些文章后，参与者不自觉地表现出启动词所显示的刻板行为（例如，被启动的粗鲁参与者表现出更多的打断行为）。这个实验表明，无论我们的意识如何，社会行为都可以被自动支持。这些研究表明，用户对多数观点构建的行为可能是由某种社会结构无意识地提供的。

3.研究问题

++现有研究对在线环境中的多数观点构建提出了一个可能的解释：多数观点的构建是由在线环境中一定的社会结构所提供的++ 。尽管现有的研究以有限的方式考虑了在线环境（即消费者对产品的评论），但预计从众效应会出现在一般的环境中，因为从众效应本身只涉及能够承担多数观点的受众，而不是评论的主题。关于解释网络环境中多数观点构建的合适机制，本研究针对Facebook帖子提出了以下研究问题：

++RQ1. Facebook++ ++上的多数观点是如何根据帖子的主题产生的++ ++?++ ++多数人的观点是否可以被视为 "从众效应"的结果？++

++在线环境中的用户行为通常是随着时间的推移而改变的++ 。在这种情况下，多数观点会随着时间的推移而出现。然而，如果多数观点是由社会结构提供的，那么评论的数量，也就是被认为是Facebook的社会支持因素，将是多数观点构建的更重要的因素，而不是时间。因此，本研究解决了进一步的研究问题：

++RQ2.++ ++是时间还是评论的数量与多数人的观点构建过程更相关++ ++?++ ++这一发现对理解++ ++OSN++ ++上的用户观点有什么启示？++

通过回答研究问题，我们希望弄清楚在OSN中多数观点是如何构建的，以及在每个主题帖子中用户观点的倾向是什么。此外，研究结果可以为如何分析用户观点数据（偏向于一些多数观点的话题）提供一些指导。

4.研究方法

++为了解决这两个研究问题，本研究采用了由四个步骤组成的逐步分析程序++ 。首先，我们定义了++数据收集++ 的时段，并确定了在此时段创建的帖子。然后，记录这些帖子的变量进行分析。其次，给定数据后，我们通过++计算偏度值++ 和绘制收集到的帖子评论数与时间的关系来检查数据的时间效应。然后，我们画了两种视觉图，Y轴代表偏度统计值（因变量），X轴代表时间和评论数量（自变量）。我们检查了变量关系的模式和哪些自变量可以被认为影响偏度的变化。第三，我们++用确定的自变量进行了回归分析++ ，并解释了结果。最后，我们对数据进行了++Chow++ ++检验++ ，研究了从早期到后期的关系是否发生了显著变化。

4.1 数据收集

++为了分析++ ++Facebook++ ++上的多数观点构建，本研究收集了++ ++100++ ++天++ ++(2017.02.21-2017.05.31) Facebook《++ ++纽约时报++ ++》++ ++页面上的帖子及其评论的数据++ 。具体记录如下变量: (1) 某篇文章的评论数量，(2) 基于评论点赞数的偏度统计，(3) 文章的主题(通过文章中的URL地址识别)，(4)文章创建的时间。为了准确识别文章的主题类别，本研究仅考虑含有URL地址的文章。照片/视频帖子被排除在分析之外。通过比较不同主题帖子的属性，我们试图检验在网络环境中构建多数观点的用户行为特征。图2显示了纽约时报Facebook页面的截图和记录的变量。

4.2 偏度统计分析

++本研究考虑偏度统计量来描述帖子的"赞"分布++ 。偏度统计表明分布的偏度有多大，正偏度表示分布右倾，负偏度表示分布左倾，可以用来描述用户的行为特征和评论的话题差异。

++图++ ++3++ ++为偏度角度下评论数量与评论点赞数的关系++ 。偏度值为正时，表示有少数评论点赞最多，其余评论点赞较少。也就是说，一些主要评论的点赞越多，偏度值越积极。因此，偏度统计可以被认为是观点偏度的指标。

++正偏度分布的形状可以根据偏度值的变化而++

++改变++ 。分布尾变长（主要评论点赞数增加越多）

，偏度值增加。相反，如果分布尾部变厚（次要

评论收集Likes），偏度值就会下降。偏度交替增

大和减小，偏度值保持不变。

4.3 chow检验

用户在Facebook帖子上的行为可以是动态的。因此，偏度统计值与时间或评论数量之间的关系可以根据Facebook帖子讨论的进展阶段而变化。本研究考虑了一个额外的分析来捕捉动态属性，即Chow检验。++Chow++ ++检验是由++ ++Chow++ ++（++ ++1960++ ++）提出的，他设计了一个统计量来诊断回归模型中的结构性中断++ 。结构性中断是指回归模型的变量开始有不同关系的点。例如，若用年代数据测试回归模型中的一个结构断裂点，其目的是考察回归变量的关系在结构断裂点前后是否发生了变化（如早期和后期）。图4显示了本研究中使用的Chow检验的概念性解释。

++式（++ ++2++ ++）表示了一种计算++ ++Chow++ ++统计量的方法++ 。Chow统计

服从自由度为k和N1+N2 - 2k的F分布。因此，可以根据累积

F分布计算单侧p值。

其中Chow=Chow统计量，SSR**C=合并数据（数据1+数据2）残差平方和，SSR**1和SSR**2分别=除数据1和数据2的残差平方和，k=参数个数，N**1和N**2=数据1和数据2的观察次数。

++在这项研究中，我们通过偏度值的影响因素的中值来分割数据++ （即每个帖子创建次数的中值或每个帖子评论数的中值），++并在分割后的数据上构建两个回归模型++ 。然后，我们对这两个回归模型进行了Chow检验，检查了结构断点的存在。通过这种方式，我们确定了偏度的关系是否从早期到后期发生了显著变化。

5.结果

5.1 主题分类

在100天时段内，从《纽约时报》的Facebook页面上收集了6736个帖子，有47个主题。然而，由于样本量的原因（一些话题的帖子数量较少，无法进行分析），在报告问题方面，少于100个帖子的话题被排除在分析之外。++因此，本研究在分析中包括八个主题++ （括号中的数字是指帖子的数量，3422）。艺术（308），商业（296），烹饪（115），纽约地区（155），舆论（441），体育（171），美国（1143）和世界（860）。这些类别名称是由《纽约时报》的网页给出。

++为了分析的目的，我们删除了++ ++67++ ++篇没有评论或评论没有点赞的文章++ （括号中的数字表示文章数量及其占每个主题文章总数的百分比): ARTS(9;2.9%)、商业(6;2.0%)、烹饪(1;0.9%), NYREGION (5;3.2%),观点(8;1.8%)、体育(7;4.1%)、美国(10;0.9%)和WORLD (21;2.4%)。表1显示了关于帖子数量的详细信息。

5.2 可视化绘图

++如果帖子的时间戳（即图++ ++2++ ++中描述的"帖子创建后的时间"）向某些方向倾斜，就会有时间效应。因此，我们计算了每个主题的帖子的评论数随时间变化的偏度值++ 。艺术（-0.086），商业（0.087），烹饪（-0.033），纽约（-0.043），观点（-0.026），体育（-0.057），美国（0.017），世界（0.089），以及综合（0.019）。由于所有偏度值都接近零，我们确认在分析中几乎不存在时间效应。图5显示了收集到的帖子评论的数量与时间的关系。

++为了确定整体偏度统计的时间变化，我们用++ ++20++ ++个不重叠的窗口计算活动平均值++ 。这是因为每个帖子都有一个单一的偏度统计，并有一个独特的时间戳，计算每个时间戳的平均值是没有意义的。在++图++ ++6++ 中，黑点表示按时间划分的帖子的偏度值，蓝线表示活动平均值。++如图所示，偏度随时间的变化很小。++

然而，如++图++ ++7++ 所示，偏度值与评论数呈对数关系（蓝线表示平均值）。因此，++本研究认为偏度值是一个因变量，评论数是一个自变量++ 。

++由于变量之间的关系接近于对数形式，对自变量进行对数变换，采用普通最小二乘回归。但由于回归模型残差不满足正态假设，故采用稳健回归++ 。表2和图8(蓝线为拟合回归模型)显示了稳健回归分析的结果。

从回归模型的系数来看，随着评论数量的增加，++美国++ 话题的评论偏度增加最多(0.328)，其次是观点(0.321)、世界(0.272)、商业(0.253)、纽约地区(0.177)、艺术(0.108)、体育(0.105)和烹饪(−0.108)。这意味着，随着用户关注(即评论数量)的增加，美国帖子的多数观点地位高度加强，而烹饪帖子的多数观点地位减弱。

5.3 chow检验

++为了确定回归模型系数的动态特性，我们按照评论数量的中位数将数据分为两个子集，并对分割后的数据集进行++ ++Chow++ ++检验++ 。图9显示了对所有主题的回归模型进行Chow检验的结果（红色竖线是在0.05水平上显著的结构断点）。详细来说，除了烹饪之外，各主题模型中存在的结构断裂点的P值都低于0.001。烹饪中的结构断点在0.05水平上不显著（p值=0.087）。除烹饪外，其他话题包括艺术、商业、纽约地区、观点、体育、美国、世界和综合（所有话题的总和），评论行为的影响从早期到后期都有明显变化。

6.讨论

++本研究探讨了一个合适的理论视角来解释网络环境中的多数观点建构++ 。关于本研究的主要主题，提出了两个研究问题。
n ++RQ1. Facebook++ ++上的多数观点是如何根据帖子的主题产生的++ ++?++ ++多数人的观点是否可以被视为 "从众效应"的结果++ ++?++

++这项研究观察到偏度值、评论数量之间的对数关系，并且根据帖子主题的不同，有不同程度的增加++ 。具体而言，虽然烹饪呈现对数递减模式，但其他主题呈现对数递增模式。通过 Chow 测试，检查了 Facebook 帖子讨论过程中出现的结构性断点。这些发现意味着大多数观点普遍出现，但它们的模式可能因主题而异。如果从众效应是解释多数观点构建的合适机制，我们预计多数观点将普遍出现。本研究中的观察显示，无论主题如何，都会出现从众效应，并作为OSN中多数观点构建的潜在机制。这些结果也与现有的研究结果一致，即用户的注意力往往只偏向于某些内容，并且用户观点的主导地位加速了对数模式的多数观点构建。
这些结果与之前的观点动态研究提出不同类型的模型的原因是一致的。尽管不同的模型在在线环境中假设了不同的上下文，但它们通常声称大多数观点以不同的方式出现。在本研究中，虽然烹饪主题呈对数递减模式，但偏度值并非为负。这意味着关于烹饪的帖子中的多数观点是在早期构建的，但随着评论数量的增加，他们作为多数观点的力量减弱了。然而，由于这种趋势在统计上没有得到支持（Chow 检验的 p=0.087），我们只能说烹饪帖子中的大多数观点与其他主题帖子具有不同的过程。其他主题显示了从早期到后期的偏度值的对数增加模式和显着的结构断点。这意味着观点、世界、商业、纽约地区、艺术和体育帖子的多数观点是在早期构建的，并且随着评论数量的增加，它们的力量会增强。所有主题都揭示了从早期到后期的结构断点。也就是说，随着阶段从前期到后期，多数观点强度的增幅发生了显着变化。

对这种现象的一种解释是，更多的评论会以对数方式增加用户遇到他们同意或不同意的
评论的可能性。如果帖子的内容与用户对某个议程（如政治、观点、社会）的认同有关，更多的评论会让用户更容易遇到满意的评论，他们可以通过点击评论来表达自己的观点。但是，如果帖子的内容与产品的有用性或知识技能（例如日常生活、时尚和烹饪）有关，更多的评论可能会对多数观点构建产生不同的影响。++在有用性的背景下，从众效应可能会以负面的方式发生，因为用户越来越多地感知到异构评论之间的差异++ 。然而，由于Facebook不提供评分系统，用户不能对帖子发表低观点，而只能通过支持其他次要观点来表达他们的不同。在这项研究中，烹饪的系数值为负，而其他主题的系数值为正。考虑到Godes和Silva（2012）的报告，我们可以这样解释：++随着评论数量的增加，从众效应在有用性背景下（即点击小评论上的赞按钮）起负面作用，但在认同性背景下（即点击大评论上的赞按钮）起正面作用++ 。
n ++RQ2.++ ++是时间还是评论的数量与多数人的观点构建过程更相关++ ++?++ ++这一发现对理解++ ++OSN++ ++上的用户观点有什么启示？++

++本研究还观察到，评论的数量是影响多数观点构建的一个因素。++ 这表明评论的数量起到了一种社会结构的作用，使得多数观点得以出现。此外，++时间不是多数观点构建的重要因素++ ，但对帖子的多数观点主要受用户对帖子的显式关注（评论数量）的影响。也就是说，无论何时，只要帖子有一定数量的评论，就可以认为该帖子具有多数观点。偏度的对数增加表明观点偏度在早期迅速增加，但在后期缓慢增加。这意味着主要评论在早期阶段得到了支持（许多用户在主要评论上点"赞"，少数用户在其他评论上点"赞"；偏度增加未被抵消），但随着评论数量增加，次要评论开始得到支持（相似数量用户点击了主要评论和其他评论上的"赞"；偏度增加在很大程度上被抵消）。通过Chow测试，我们还提出了在早期和后期可以观察到的这些结构变化。研究结果与 Katz等人(1992)一致，表明少数人并不总是因为害怕孤立而保持沉默。随着时间推移，其中一些变得活跃起来。
对于这种差异，提出了两个可能原因。++首先，物理和在线环境中的时间概念可能不同++ 。Katz等人（1992）和Matthes（2014）观察了物理环境中的用户行为和感知，而本研究调查了在线环境中的用户行为。在物理环境中，物理时间是识别某个问题被讨论多久的重要因素。然而，在网络环境中，"赞"和评论的数量决定了一个话题被讨论了多长时间。++其次，正如我们在研究问题部分提出的，这种差异表明++ ++OSN++ ++中的用户表达是通过从众效应发挥作用的++ 。与时间相比，"从众效应"与受众的注意力关系更为密切。当更多的用户对一个帖子给予关注时，就会引起更多的认同。然而，一个相反的效应，即势利眼效应，也会随着关注量的增加而发挥作用。偏度和评论数之间的关系显示了从众效应和势利眼效应是如何在OSN中起作用的。多数观点是由于从众效应而出现的，但很快，少数观点就会受到势利效应的支持。这一解释可以得到以前一些研究的支持（从众效应可以是势利眼效应的前兆）。
++与其他研究的潮流效应证据类似，本研究的结果表明，由于高估，大多数人对帖子的观点可能会被误解++ 。用户观点的偏度是由评论的数量而不是内容的语义重要性决定的。也就是说，获得高数量"赞"的评论可能并不意味着很多用户同意该评论，这种可能性会导致假新闻或错误谣言等重大问题。那些认为获得高数量"赞"的评论是对某一主题的多数观点的人，会将该评论视为公众观点，而这种看法会被其他用户接受，直到他们意识到该评论实际上不是多数观点。避免这个问题的一个解决方案是比较不同环境中的用户观点。如果用户在其他环境中对同一话题表达了相当不同的观点，我们应该推迟将评论解释为对该话题的多数观点。

科研学习|论文解读——了解在线环境中的多数观点形成过程：Facebook的探索性方法(IPM, 2018)

论文标题

摘要

1.引言

2.研究背景

2.1 用户观点分析

2.2 从众效应

2.3 社会支持

3.研究问题

4.研究方法

4.1 数据收集

4.2 偏度统计分析

4.3 chow检验

5.结果

5.1 主题分类

5.2 可视化绘图

5.3 chow检验

6.讨论

7.结论