QCA中质蕴项选择问题

一、关于质蕴项的基础知识

(一)什么是质蕴项?

(1)质蕴项定义

逻辑余项是指缺少经验实例的构型,可以被纳入布尔最小化。------QCA设计原理与应用:超越定性与定记研究的新方法

(2)质蕴项实例(参考[2])

借用Schneider和Wagemann(2012)的示例,考虑一个由3个原始条件构成的真值表(图3),其中有4个真值表行能够导致成功的结果,用布尔表达式可表达为

A~BC+~AB~C+AB ~C+ABC→Success

Row1-Row4所代表的表达式被称为原始表达式(primitive expressions)。原始表达式通过逻辑最小化(logical minimization)程序,可进一步简约计算。

逻辑最小化的规则是:如果两个与结果相关的原始行只在一个条件上不同,那么这个条件可以被认为是逻辑上冗余的,可以省略,使得两行合并成一个更简单的表达式。

例如,在上述示例中,①和④的差别在于B条件的存在与否,那么将这两行进行合并即可省略B,得到新的表达式AC,即A~BC+ABC=AC。

同理,对其余行可进行类似操作,可以得到三个简化表达式:AC+B~C+AB(图4)。这里要注意的是,逻辑最小化规则允许同一行进行多次计算,即③可以与②合并,亦可与④合并,得到简化表达式B~C和AB。从而得到一个新的解项:

AC+B~C+AB→Success

这三个简化的表达式即质蕴含项(prime implicants)。它们在逻辑上包含所有的原始表达式,并且不能用常规的最小化过程来进一步最小化。因此,质蕴含项被定义为逻辑最小化过程中通过配对比较原始组合的最终产物。例如,A~BC+ABC=AC,AC就是原始表达式A~BC和ABC的质蕴含项。

(二)质蕴项公式最小化准则

在必要性条件分析中,质蕴项最小化的准则包括以下几种:

  1. 质蕴项最小化准则(Minimum Essential Condition Criterion,MEC):该准则通过最小化质蕴式中的质蕴项数目来选择最小的质蕴集合作为必要条件。即寻找能够解释目标变量变化的最小条件集。

  2. 质蕴项率最小化准则(Minimum Essential Condition Rate Criterion,MECR):该准则考虑了质蕴项的权重,并通过最小化质蕴式中的质蕴项与它们的权重的乘积之和,选择尽可能少的质蕴项。

  3. 质蕴项覆盖最大化准则(Maximum Coverage Condition Criterion,MCC):该准则通过最大化质蕴式中被覆盖的样本数量来选择质蕴集合。即选择能够涵盖尽可能多样本的条件集。

  4. 质蕴项覆盖率最大化准则(Maximum Coverage Condition Rate Criterion,MCCR):该准则考虑了质蕴项的权重,通过最大化质蕴式中被覆盖的样本权重之和来选择质蕴集合。

  5. 质蕴项熵最小化准则(Minimum Essential Condition Entropy Criterion,MECE):该准则通过最小化质蕴式中的质蕴项熵来选择最小的质蕴集合作为必要条件。质蕴项熵反映了质蕴项的不确定性和信息量。

  6. 质蕴项置信度最大化准则(Maximum Confidence Condition Criterion,MCCF):该准则通过最大化质蕴式中的质蕴项置信度来选择最小的质蕴集合。质蕴项置信度表示了条件与目标变量之间的相关性。

  7. 质蕴项支持度最大化准则(Maximum Support Condition Criterion,MSCC):该准则通过最大化质蕴式中的质蕴项支持度来选择最小的质蕴集合。质蕴项支持度表示了条件在样本中出现的频率。

这些准则的目标都是在保证条件集合能够满足目标变量的必要性的前提下,选择最小数量的质蕴项或能够覆盖尽可能多样本的质蕴项。具体使用哪种准则取决于具体的应用和分析需求,如质蕴项熵、置信度和支持度等,以选择最优的质蕴集合。根据具体的分析目标和数据特征,选择适合的准则进行质蕴项的最小化。

二、关于质蕴项的处理过程

(一)质蕴项选择应该如何操作?

总体思路:满足最小选择标准后(所有红色方格变灰),但是选择多少质蕴项要有依据。

在进行标准化分析时,当选择质蕴涵算法无法减少真值表时,出现绑定的质蕴涵窗口(Prime Applicant Window)(下图),研究者需要在这一步基于自身理论和实践知识选择应用的质蕴涵项,才能进行标准化分析并输出简约解和中间解。

在左侧选择合适的质蕴含项,满足最小选择标准后(所有红色方格变灰),窗口右下角的【OK】键才可选中(图2)。点【OK】键后,可进行正常的反事实分析并输出简约解和中间解。

该步骤的重点和难点是选择最小化数量的质蕴含项,若多选或全选(select all),便会输出额外的简约解,导致简约解的数量过多甚至多于中间解的情况。尽管可以事后进行筛选,但这一步的矩阵展示给研究者提供了较为便捷的选项。

(二)存在不合理的质蕴项应该如何处理?

(1)三次选择冗余质蕴含项的情况

在一些分析中,我们还有可能遇到需要连续选择三次逻辑余项的情况。我们使用随机数据集构建一个5条件的真值表(图13)。选择频数为1,原始一致性阈值为0.85,PRI截断值0.566。

选择标准化分析后,会第一次出现绑定的质蕴含项窗口。

在点击OK后,软件会再次跳出一个选择窗口。

在点击OK后可以进行反事实分析,此后会出现第三次选择的窗口。

经过比较最后得出的三个解(图17),我们可以发现,第一次选择的B~C~DE和ABC~E出现在了复杂解中,第二次选择的AB~E出现在简约解中,第三次选择的AB~D~E和ABCD出现在了中间解中。因此,第一次选择影响的是复杂解 ,而第二次选择影响的是简约解,第三次选择影响的是中间解。

(2)"质蕴含"分析选项特别多,窗口特别大,显示不完整

解决方法:使用R package QCA 来操作,因为fsQCA这个软件有很多缺陷,参见QCA的最新算法https://journals.sagepub.com/doi/10.1177/16094069231182634

三、参考引用

[1]简约解的故事------QCA中冗余质蕴含项的选择问题- 知乎 (zhihu.com)

[2]Charles C. Ragin的《USER'S GUIDE TO Fuzzy-Set / Qualitative Comparative Analysis》

[3]Schneider C Q, Wagemann C. Set-theoretic methods for the social sciences: A guide to qualitative comparative analysis[M]. Cambridge University Press, 2012.

[4]"质蕴含"分析选项特别多,窗口特别大,显示不完整 (douban.com)