本篇推送來源:, C., & , C. (2012). Truth . In Set- for the : A Guide to ( for , pp. 23-41). : Press.
感謝參與本章翻譯工作的華中科技大學陶歡博士。
簡易閱讀指南
本章將從方法和技術層面講解一個QCA方法中的核心概念:真值表。QCA方法可以被理解為構建真值表的研究階段。真值表包含了研究人員收集的經驗信息。QCA包括對真值表的形式分析,即邏輯最小化,其目的是識別充分(和必要)條件。因此,無論使用清晰集或模糊集,真值表都是QCA方法中不可或缺的工具。這也意味著本書中所述的關于真值表及其分析的大部分內容都適用于csQCA和fsQCA。第3章在沒有使用真值表的情況下介紹了必要性和充分性分析。(譯者注1:第3章的內容主要涉及集合關系以及必要條件和充分條件的分析,暫未翻譯整理,可參考推送:定性比較分析(QCA)的集合關系:超集與子集、必要與充分、一致性與覆蓋度)
本章接下來將展示,真值表是測試集合關系的適合工具,主要是因為它們將關注焦點從經驗案例轉移至條件組合。這是一種完全不同且更有效的充分性分析方法。基于數據矩陣的充分性分析以自下而上的方式進行,首先關注簡單集合,然后再處理更復雜的集合。(譯者注2:自下而上的方式,通常是直接構建條件組合,然后檢查改組合與結果的超子集關系,從而判斷是否作為充分條件)
而基于真值表的充分性分析采取自上而下的方式,首先篩選所有邏輯上可能的條件組合,然后對所有通過充分性測試的組合進行邏輯最小化。值得注意的是,對于充分性而言,真值表方法是一種主導的方法,但對于必要性分析,自上而下的方法毫無意義,自下而上的方法顯然更可取。原因很簡單:對于兩個或多個條件的合取項,當且僅當其中涉及的所有條件本身都是必要時,才可能對Y是必要條件。(譯者注3:這里提到一個知識點,對于一個組合ABC,三者中任意一個條件對結果Y充分時,該組合便是Y的充分條件。相反,A、B、C三個條件必須都是Y的必要條件,ABC這一組合才是Y的必要條件。現有的QCA運用進展,很少測試組合條件的必要性,可能是未來的一個方向)
本章的內容結構包括:闡明什么是真值表(4.1)后,將展示如何根據案例的經驗信息構建真值表(4.2)。4.3節將解釋如何借助布爾代數分析真值表。本章是整本書的核心章節,因為真值表是QCA的必要技術。應仔細閱讀本章內容。本章還提供了真值表算法的重要信息,這是目前公認的QCA最低標準(將在第7章中介紹)。
4.1 什么是真值表?
真值表的概念起源于形式邏輯。像傳統的數據矩陣一樣,真值表的每列都表示不同的變量(QCA方法里稱集合)。不同的是,在標準數據矩陣中,每一行表示不同的案例(或觀察單位)。而在真值表中,每一行代表一個條件組合。由于每個單獨的條件可以以存在()或缺席()的形式出現,因此,真值表的總行數為2^k。公式2^k指的是邏輯上可能的組合,k表示所用的條件數量。因此,真值表行的數量隨著條件數量的增加呈指數增長。3個條件有8種組合,4個條件則有16種組合,5個條件有32種組合,10個條件將有1,024種邏輯上可能的組合。在社會現實與社會科學研究實踐中,并非所有潛在組合都能有實際案例。第6章將重點闡述有限多樣性的現象,并提供如何處理邏輯余項的策略(譯者注4:這兩個問題也可以參考推送:為什么QCA得出的三種解完全一致?理解邏輯余項的應用)。
為了正確介紹真值表的含義和分析,本章只講解沒有任何邏輯余項的真值表行。維恩圖是一種直觀地可視化2k種邏輯組合的方法。圖4.1展示了三個條件的維恩圖(A、B、C)。它們重疊形成8個不同的區域。維恩圖中的每個區域對應于真值表中的一行,每個區域都可以用布爾表達式進行描述。例如,圖中A、B和C重疊的區域是指包含A、B和C同時存在的情況的區域,可寫成A*B*C,或者簡寫為ABC。集合A的上部區域是條件A存在(A=1)而B和C不存在的區域(B=0,C=0),該區域表示集合A*~B*~C或簡寫為A~B~C。三個圓圈之外但處于矩形內的區域表示三個條件都不存在的情況,可以寫為~A*~B*~C或~A~B~C,以此類推。
4.2 如何從數據矩陣到真值表
4.2.1 清晰集
本節將以3.1.1.2節中的數據矩陣為例(表4.1),根據數據矩陣中的案例信息構建真值表(表4.2)。雖然大多數相關軟件包都能夠基于包含集合隸屬度的數據矩陣生成真值表,但有三個簡單步驟值得一提。首先,排出k個條件所組成的2^k個邏輯上可能的組合,將結果值列留空。
其次,將數據矩陣中的案例根據其各個條件的值分配到真值表行。每個案例只能屬于一個真值表行,但單個真值表行可以包含多個案例。在我們的例子中,阿根廷(ARG)和委內瑞拉(VEN)在所有3個條件的值相同——劇烈的動蕩(A)、有種族同質化的人口(B)和多元化的政黨制度(C),因此它們屬于同一真值表行A*B*C。秘魯(PER)和厄瓜多爾(ECU/EC)也是如此,它們都屬于行A*~B*~C(劇烈的動蕩,沒有種族同質化的人口,沒有多元化的政黨制度)。通過這種方式,所有案例可以分配至8個邏輯上可能的真值表行。
第三,對每個真值表行賦值。真值表行的結果值由相應行所分配案例的結果值決定。例如,哥倫比亞(COL)屬于行~A*~B*~C,結果為Y=1,且沒有其他案例屬于該行。因此,~A*~B*~C行的結果值為Y=1。同樣,阿根廷和委內瑞拉都沒有表現出穩定的民主,真值表A*B*C行的結果值為Y=0。以此類推,表4.1中的數據矩陣產生了表4.2中展示的真值表。真值表由2^3=8行組成。嚴格來說,列“Row”、“Cases”和“Y”不屬于真值表,但出于為了解釋說明而包含在內。理解“結果()”欄中包含的信息很重要。從案例的角度來看,值“1”表示具有這些特征的案例產生了結果。例如,從表4.2的第1行中發現,沒有發生劇烈動蕩(~A)、沒有種族同質化的人口(~B)以及沒有多元化政黨制度(~C)的案例將產生穩定的民主國家。如果我們將視角從案例轉向組合,我們可以說組合~A~B~C(第1行)將產生結果Y。真值表行與結果Y=1明確相關(Ragin & ,2004)。本質上,每個真值表行都是一個充分性陳述(Ragin,2008a)。
4.2.2 模糊集
將數據矩陣轉換為真值表的三個步驟同樣適用于模糊集。我們首先創建真值表,然后將每個案例分配給真值表行,最后確定每一行的結果值。真值表的創建是最簡單的步驟。與清晰集一樣,模糊集的真值表行數為2^k。這是因為模糊集認為處于定性錨點0.5以上的案例(更多處于集合內)與該錨點以下的案例(更多處于集合外)之間有質的差異。除將案例直觀地劃入屬性空間角(也稱為理想類型)之外,是否有一種標準化的方法來確定真值表行中案例的隸屬度呢?當然是有的。2^k個角中的每一個都對應于2k個邏輯上可能的AND條件組合之一,而且交集中案例的隸屬度由它們在單個條件中的最小隸屬度決定。因此,很容易計算案例對于所有邏輯上可能的條件組合(即屬性空間的角落)的隸屬度。表4.5包含表4.4中顯示的兩個案例的信息。
委內瑞拉(VEN)在理想類型ABC中的模糊集隸屬度為0.6。這是條件A(0.9)、B(0.7)和C(0.6)中的最小值。厄瓜多爾(ECU)在理想類型A~B~C中的隸屬度為0.7。雖然每個案例在所有行中都有部分隸屬關系,但只在某一行中的集合隸屬度超過定性錨點0.5。模糊集有一條一條黃金法則:無論由多少個模糊集進行組合,任何給定案例在且僅在2k個邏輯可能組合中的某一組合的隸屬度高于0.5。模糊集的這一重要數學屬性對于識別一個案例應該屬于哪個真值表行至關重要,也就是找到其集合隸屬度高于0.5的真值表行。(譯者注5:簡言之,模糊集中,每個條件以0.5作為分界點,小于0.5為0,大于0.5為1,即可構建真值表行。原文介紹了屬性空間( space)的概念來論述更詳細的原理,這里不再翻譯)這一規則也有例外,即案例屬于多種邏輯上可能的組合。當案例在一個或多個條件中的隸屬度恰好為0.5時,它對于任何真值表行的隸屬度都不會超過0.5。為了說明這一點,表4.6添加了第三個假設情況:案例HYP在條件C中的隸屬度為0.5。由于C和~C的值都為0.5,因此該案例在八種可能的案例組合中,沒有隸屬度可以達到大于0.5的理想類型。三個條件以及他們的補集中的最小值都沒有大于0.5的值。此外,有兩個理想類型的最小值正好是0.5。錨點0.5有時被稱為最大模糊點(Ragin,2000)。它表達了一個事實,即一個案例的經驗屬性無法確定該案例屬于某個集合還是其補集。這種模棱兩可的狀態使得該案例或其補集無法歸入2k個邏輯上可能的理想類型中的任何一個。
因此,將0.5的模糊集隸屬度分數分配給案例時要小心。這樣做不僅可以防止將這種情況無法歸入任何真值表行,而且表達了關于該案例的最弱概念陳述。(譯者注6:這樣就是推送經典方法論書籍系列——集合的概念與校準中,提到的校準避免0.5隸屬度的原理)
我們現在知道真值表有2k行,并且每個案例只屬于真值表的其中一行。還需要確定2k行中的每行的結果值。每個真值表行都是一個充分性陳述。這意味著如果該行每個案例的隸屬度都小于或等于它對于結果的隸屬度,則每個真值表行都應該被認為是結果的充分組合(參見3.1.2.1節)。
表4.7展示了10個假設案例在3個條件、8個真值表行和結果變量(穩定民主(Y))的模糊集隸屬度分數。我們評估每個案例在真值表行的隸屬度是否小于或等于其對于Y的隸屬度。如果是,則相應行是結果的子集,滿足充分條件的標準,因此得分為1(即該組合中所有案例的隸屬度X都小于等于Y)。但是,如果行中的一個或多個案例的隸屬度超過對于結果變量的隸屬度模糊集合的表示方法,則相應行不是Y的完美子集,得分為0(即該組合中有一個及以上案例的隸屬度大于 Y)。表4.7的最后一行顯示,三個組合——A~BC、~A~BC和~A~B~C——是Y的完美子集。因此,對于其他真值表行,如果一個或多個案例偏離了充分性的子集模式,那么這些行則不是Y的充分條件。
根據以上提及的步驟,我們可以將模糊集數據矩陣轉化為標準的清晰集真值表形式。對于每一行,我們知道哪些案例屬于它,以及它是否是結果的子集。由模糊集數據得出的真值表如表4.8所示。(譯者注7:理解這兩步很關鍵,是QCA真值表分析的重中之重。針對QCA學習的新手,建議手算一遍,把這10個案例的ABC和Y隸屬度記下后,推演后面的組合隸屬度,并確定真值表中的Y值。)
在繼續解釋如何使用形式邏輯工具分析真值表之前,有幾個要點值得一提。首先,無論使用清晰集還是模糊集,真值表都是QCA的核心。其次,當使用清晰集的真值表中表示模糊集時,模糊集中包含的更細粒度的信息至關重要,并且始終可用。換句話說,推演出表4.8中真值表的步驟不涉任何將模糊集轉換為清晰集的轉換。將案例分配給真值表行以及評估真值表行是否是結果變量的子集時,都將用到模糊集的分數。第三,在基于模糊集生成真值表時,結果列中的值(1或0)并不意味著該行中的各個案例對于結果變量Y的隸屬度為1或0。相反,結果變量列中的值表示該行是否可以被認為是結果的充分條件。這就是為什么在表4.8中我們將結果列標記為“Y的充分條件”。第四,在評估行和結果集之間的子集關系時,所有案例都應被考慮在內,而不僅僅是那些特定行的好實例(即隸屬度分數高于0.5的案例)。因此,0.5定性錨點對于將案例分配至行至關重要,但在評估兩個模糊集之間的子集關系時無關緊要。
4.3 分析真值表
真值表可以通過清晰集數據和模糊集數據創建。結果列指的是特定真值表行或條件組合是否是結果的充分條件。如果是,則結果列的值為1。因此,如果我們研究結果變量的充分條件,真值表提供了第一個答案:結果值為1的所有行是充分條件。然而,這個答案通常沒有什么信息量且難以處理,因為真值表中可能有很多這樣的行。我們希望得到一個更簡潔的答案。為此,在QCA中使用布爾代數的規則。Quine-算法可用于邏輯最小化。下面介紹Quine-算法中涉及的步驟。
4.3.1 匹配相似條件
本節將使用4.2.1節中的清晰集真值表作為案例進行講解。請注意,這樣的真值表也可能是將模糊集數據矩陣轉換為真值表的結果。因此,盡管我們現在講解的是從清晰集中得出的例子,但無論基礎數據是由清晰集還是模糊集組成,真值表分析都是相同的(譯者注8:因此清晰集條件和模糊集條件可以一起使用fsqca軟件分析)。
第一步是為所有與結果相關(Y=1)的真值表行(第1、2、3、4和6行)創建一個布爾表達式(也稱原始表達式, )。第1行可以寫為~A~B~C,第2行可以寫為~A~BC,以此類推。表4.9中包含的信息可以表示如下:~A~B~C+~A~BC+~AB~C+~ABC+A~BC→Y。
在創建真值表的過程中,這五個原始表達式都是Y的充分條件。這個公式是表達真值表中所包含充分條件的最復雜的方式。接下來將簡化這些表達。
邏輯最小化的第一原則指導:如果兩個真值表行都與結果相關聯,僅在一個條件下不同——該條件在一行中存在而另一行中缺失——那么這個條件可以被認為是邏輯冗余的條件,在真值表行的其余條件存在時,該條件與結果的發生不相關。這個邏輯上冗余的條件可以省略,且這兩行可以合并成一條更簡單的充分條件組合。例如,第1行(~A~B~C)和第2行(~A~BC)除了條件C以外其余條件是相同的:條件C在第1行中不存在而在第2行中存在。因此,這兩行可簡化為~A~B。換句話說,我們可以將表4.9中包含的信息寫成:~A~B+~AB~C+~ABC+A~BC→Y。
將邏輯最小化原則應用于原始表達式~AB~C(第3行)和~ABC(第4行)。它們僅在條件C的值有所不同,因此可以將兩行簡化為~AB。原表達式可簡化為:~A~B+~AB+A~BC→Y。
相同的邏輯最小化原則,即匹配一對僅在一個條件值不同的原始表達式,同樣適用于結果變量值相同的任何兩個組合。在示例中,組合~A~B和~AB僅在條件B的值不同,那么條件B可以去掉,兩個表達式可以簡化為~A。這意味著對于Y來說,條件~A都是充分條件,無論條件B或C如何取值。表達式可進一步簡化為:~A+A~BC→Y。
這個公式在邏輯上等同于最復雜的表達式和所有中間表達式。由于這是基于3.1.1.2節中案例相同的數據,我們注意到解項的差異。在3.1.1.2節中,相同的數據得出的解項為:~A+~BC→Y。
不同之處在于條件A與~BC的結合。當為表4.9中的信息找出最簡潔的解項時,是否需要包含條件A?答案是不需要。因為組合~BC包含原始表達式A~BC(第6行)和~A~BC(第2行),也就是說,~BC對于Y是充分條件,我們也可以說A~BC和~A~BC都是Y的充分條件。由于這兩個原始表達式僅在A的值上有所不同,因此可以刪除條件A。請注意,邏輯最小化過程中,允許在多個邏輯最小化中使用相同的原始表達式。在我們的示例中,第2行中的原始表達式~A~BC可以與第1行的原始表達式匹配(~A~B~C,從而得到~A~B),也可與第6行的原始表達式匹配(A~BC,從而得到~BC)。這意味著第2行的原始表達式包含多個質蘊涵項(prime )模糊集合的表示方法,我們將在第4.3.2節中更詳細地討論這個問題。目前,我們可認為解項是:~A+~BC→Y。(譯者注9:這里提到了質蘊含項選擇的問題,也是新手經常遇見但難以理解的問題,請參考推送:為什么簡約解這么多?——QCA中冗余質蘊含項的選擇問題(Use of prime ))。
這個公式是總結表4.9中包含的充分性信息的幾種方法之一。此處所提及的所有不同的解項,以及最小化過程的中間步驟,(a)在邏輯上是等價的;(b)表達真值表中的相同信息;(c)不相互矛盾,也不與真值表中包含的信息相矛盾;(d)是現有經驗信息的總結。
真值表中的數據有多種解是可接受且邏輯正確的,這也是QCA的一般特征。而選擇哪種解作為可用信息的實質性解讀,取決于特定研究問題,與公式邏輯并無關系。相比于“~A+~BC→Y”,我們可能更喜歡“~A+A~BC→Y”,主要原因如下。
例如,關于穩定民主國家出現的文獻(Y)提出了一個強有力的觀點,即民主不可能在暴力動蕩的情況下形成。而解項A~BC提供了實證證據,證明了這個觀點:如果與~BC結合,A確實可以成為Y的INUS條件。文中的案例與文獻中的假設觀點相反,穩定的民主政體可以在有暴力動亂的情況下出現——但只有當這些國家還同時擁有種族非同質的人口(~B)和多元化的政黨制度(C)時才能出現。雖然解項~A+~BC→Y是正確的,也包含此信息,但條件A的作用并不明顯。在該特定話題下,包含A~BC的解項,有助于將實證證據與之前存在的理論知識及期望聯系起來。(譯者注10:結合實踐知識來選擇質蘊含項)
與此相關的一個論點是,更復雜的解項將有助于解答那些無法解釋的情況。想象一下,關于民主穩定的文獻迄今未能解釋為什么某個國家(我們將稱之為X)是一個穩定的民主國家。我們假設X國可以用A~BC組合進行描述。通過選擇包含該組合解作為導致Y的充分條件,我們能夠以一種更簡捷的方式證明為什么X國能成為穩定的民主國家。(譯者注11:結合理論知識來選擇質蘊含項)
4.3.2邏輯冗余的質蘊涵項(同樣參考推送:為什么簡約解這么多?——QCA中冗余質蘊含項的選擇問題(Use of prime ))
4.3.3 與結果缺失分析的相關問題
集合關系是不對稱的(見3.3.3節)。這種不對稱的一個含義是,結果的出現和缺失需要單獨分析。前文提到的從數據矩陣到真值表的所有分析步驟以及邏輯最小化同樣適用于分析結果的缺失。繼續采用表4.2中的案例,現在將~Y(不穩定的民主制度國家的集合)作為感興趣的結果變量。從必要性分析開始,我們發現只要~Y存在,A也存在(另見3.2.1.2節):A←~Y。即經歷劇烈的動蕩是擁有不穩定的民主制度的必要條件。對于充分性分析,采用Quine-算法對~Y=1的所有行進行分析,并得到以下結果:A~C+AB→~Y。這可以通過析出條件A(第2.4.1節)重寫為:A(B+~C)→~Y。在經歷過劇烈動蕩的社會中,如果同時擁有種族同質的人口和/或沒有多元化的政黨制度,將產生不穩定的民主國家。產生結果~Y的解項與對產生Y的解項不同。
有三點值得說明。第一點是普遍性的,第二點和第三點源于我們選擇的案例的特殊性。
首先,如果一種現象的發生和不發生(缺失),例如民主的穩定性和不穩定是兩種性質不同的事件且需要單獨解釋,那么它通常需要用不同的理論和假設來解釋這些結果。也就是說,研究者可能需要選擇不同的條件構建一個全新的真值表(譯者注12:選擇一個不同的~Y變量,或使用不同的測量,或采用不同的校準),而不僅僅是在同一個真值表中將結果值從Y更改為~Y。這是由于概念不對稱性,即一個概念的否定通常包含一些性質不同的概念。例如,非民主國家的集合指的是軍政權、神權政體和一黨政權等等。同樣,例如,未婚人士的集合包括單身、寡婦等。簡而言之,不對稱性可能不僅需要使用不同的條件來分別解釋Y和~Y,它可能還需要采用不同的條件對性質不同的~Y進行解釋。
第二個注意事項:在必要性分析中,我們將條件A確定為必要條件。同時,對充分性的分析揭示了兩條路徑,且這兩條路徑都涉及條件A。因此,看起來,只要一個條件是所有充分路徑的一部分,那么這個條件就將是結果的必要條件。如果在所有充分路徑中都沒有出現條件,則不是必要條件。但是,這兩個結論在QCA的應用中都可能是錯誤的。只有對于某些特定的真值表如此分析,也即在真值表的2k個邏輯可能的條件組合中,每個組合的結果值都是1或0時,這兩個結論才成立。正如5.1、6.1和6.2節所展示的,在實際中社會科學數據非常復雜,幾乎不會出現這種情況。在QCA方法的應用中,真值表無法避免包含矛盾行或邏輯余項。當出現這些情況時,真值表的充分性分析可能無法正確揭示必要條件存在或不存在。在第9章中,我們詳細說明了錯誤必要條件出現和真實必要條件消失的具體情況。就目前而言,建議將必要性和充分性分析分開,而對于必要性和充分性的陳述僅基于分別對必要性和充分性的分析。
第三個注意事項與第二個類似。由于本文的例子很簡單,它產生了一個例外:在這個例子中,可以根據Y的公式推導出~Y的充分性解項,而無需進行單獨的分析。根據定律,我們可以將Y的充分性解項由~A+~B*C→Y轉換為A*(B+~C)→~Y。這與根據表4.2對結果~Y的實證分析得出的公式相同。然而,如前所述,在社會科學研究實踐中,這個步驟是有問題的。它僅在特定的真值表中才是對的,也即,當真值表沒有矛盾項(第5.1節)或邏輯余項(第6.1和6.2節)時。否則,應用定律產生的結果將導致一些真值表行要么被忽略,要么不成立,或兩者都有(第8章和第9.1節)。由于特定的真值表在實際生活中很少見,因此正確使用此處描述的步驟以及定律的場景非常有限。
由于所有這些原因,在實踐應用中(第11.1節),應始終對結果的發生和缺失進行單獨分析,并對必要性和充分性進行獨立分析,因為因果不對稱也指的是實際上可能需要分別使用不同的前因因素來解釋結果的發生和不同類型的缺失。
一目了然
Quine-算法在真值表中使用布爾表達式進行簡化。它首先列出所有充分性的條件組合。隨后,通過布爾代數規則對邏輯表達式進行簡化。檢查質蘊涵項通常能夠對不夠明顯的解項進行進一步簡化。在所有充分性解項中析出的INUS條件并不一定是結果發生的必要條件。因此,必須分別分析必要條件和充分條件。建議先進行必要條件分析,后進行充分條件分析。結果的缺失必須單獨分析。只有當組合中既沒有邏輯余項,也不存在矛盾的真值表行時,才能應用定律。請注意,給定真值表中包含的所有信息可以通過不同的解項來表示。邏輯最小化原則將確保這些信息在邏輯上是等價的,僅在復雜程度上有所不同。需要根據理論和實踐來決定對哪些解項進行解讀。
相關內容
預告 | QCA經典方法論書籍簡譯系列推送
經典方法論書籍系列——集合的概念與校準
經典方法論書籍系列——集合論的概念和操作