才華和顏值負相關(guān)?你聽說過伯克松悖論嗎
觀察一下國內(nèi)(國外也差不多)的文化娛樂事業(yè)的從業(yè)者,或許你直覺上會產(chǎn)生一個認知:外表越有吸引力的人,在演藝、歌唱上的才華似乎就越??;反之,越是才華橫溢的藝人,在顏值上就越普通。
對應(yīng)這種認知的是,大家把好看的藝人稱之為流量明星,相對的叫實力唱將或老戲骨;以示后者雖然外在普通或風華不再,但內(nèi)里有貨,不是徒有其表之輩。
這里不討論這是否是一種偏見,我們單純從統(tǒng)計學上說,如果這種認知是可被統(tǒng)計數(shù)據(jù)證實的,那是否可以推斷出顏值和才華是負相關(guān)的呢?除了極少數(shù)例外,絕大多數(shù)人僅能得其一?
在美國,確有人分析過明星的外表和才華之間的聯(lián)系,他們推斷出這兩個特征真是負相關(guān)的——有吸引力的人往往缺乏才華,而有才華的人往往缺乏吸引力。
但是,這具有欺騙性:既沒有魅力也沒有才華的人通常不會成為名人,而明星樣本并沒有代表這一大群人。明星往往具有一種特征,但(不出所料)很少同時具有這兩種特征。
這就是所謂的伯克森悖論的一個實例。
1946 年,美國醫(yī)生和統(tǒng)計學家約瑟夫·伯克森提出的一個問題。他發(fā)現(xiàn)醫(yī)院中糖尿病患者和膽囊炎患者中,患糖尿病的同時患膽囊炎的人,數(shù)目較少;而沒有糖尿病的人群中,患膽囊炎的人數(shù)比例較高。這似乎說明患有糖尿病可以降低病人罹患膽囊炎的風險,但是從醫(yī)學上,我們無法找到這種聯(lián)系。
他將自己的觀察寫成了論文《用四格表分析醫(yī)院數(shù)據(jù)的局限性》 ,發(fā)表在《生物學公報》上。就此,人們把該問題稱為伯克森悖論。
按照百科的解釋,悖論產(chǎn)生的最主要原因是:文章中統(tǒng)計的患者都是醫(yī)院的病人,從而忽略了那些沒有住院的人。
為了簡化起見,我們假設(shè)醫(yī)院只收治兩種疾?。禾悄虿『湍懩已?。然后畫一個平面直角坐標系:橫坐標表示病人糖尿病的嚴重程度,縱軸表示膽囊炎的嚴重程度,再把每一個人按照兩種疾病的輕重點在坐標系里。
如果我們對全體人群進行統(tǒng)計,就會發(fā)現(xiàn)糖尿病和膽囊炎并沒有相關(guān)性。
但是如果只對醫(yī)院中的患者進行統(tǒng)計,就會出問題。如果病人的糖尿病或者膽囊炎問題比較輕,病人就不需要住院,所以也不會被統(tǒng)計到。來到醫(yī)院的病人要么是糖尿病,要么是膽囊炎,要么二者兼有。所以,我們需要把圖像左下方代表輕癥的點都去掉,他們不在統(tǒng)計的范圍內(nèi),我們只會統(tǒng)計到這條線右上方的點。這回糖尿病和膽囊炎就表現(xiàn)出負相關(guān)了。不患有糖尿病的人,更有可能患有膽囊炎,而患有糖尿病的人,膽囊炎的比例就會下降了。
可見伯克森悖論是一種統(tǒng)計偏差,因為我們忽略了身體健康而沒有入院的人,只在醫(yī)院的病人中進行統(tǒng)計,這些病人一定患有這樣或者那樣的疾病。