- 相關(guān)推薦
朱家祥教授散文讀后感
朱家祥教授散文讀后感 這里的散文就是指非學(xué)術(shù)文章,或者是非技術(shù)性的分析。讀后感也不是什么長(zhǎng)篇大論,而是一點(diǎn)小體會(huì)。 1,· 對(duì)朱教授“簡(jiǎn)單的機(jī)率運(yùn)算”自己動(dòng)手算了一算。 A=要吸煙 B=肺癌 已知:P(A)=0.376 P(B)=2.2/10000 P(A|B)=0.7 求解:P(B|A), 解: P(B|A)=P(A|B)*P(B)/P(A)=0.7*2.2/10000/0.376=0.00041也即是說已知一人吸煙,在不考慮其它因素的條件下,那么他得肺癌的可能性為0.041%。注意這同70%的區(qū)別有多大。 2,· 想起原來(lái)看過的一則新聞,自己還就此寫過博客。新聞大概是講:某種非法網(wǎng)站與少年犯罪的問題。該節(jié)目的大致邏輯是:青少年因?yàn)闉g覽改種類型的非法網(wǎng)站,于是產(chǎn)生犯罪。因此,我們應(yīng)該關(guān)閉該類網(wǎng)站。關(guān)于犯罪與網(wǎng)站之間因果關(guān)系的證據(jù)在于記者采訪少管所,發(fā)現(xiàn)幾乎所有的少年犯都瀏覽過改種類型的網(wǎng)站。政府依法關(guān)閉這種類型的網(wǎng)站,我們當(dāng)然堅(jiān)決擁護(hù)。但是這則新聞報(bào)道卻有著與吸煙-致癌這一論述的相似問題。首先我們要注意,節(jié)目中提供的是哪一類概率。如果我們像吸煙-致癌一例中一樣,令A(yù)=瀏覽某種網(wǎng)站 B=犯罪的話,那么節(jié)目中只提供了P(A|B),也即我們已知一個(gè)人是少年犯,那么他瀏覽某種網(wǎng)站的概率。注意該報(bào)道中絲毫也沒有講到我們實(shí)際上真正關(guān)心的問題P(B|A)——已知一少年瀏覽過該類型網(wǎng)站,那么他犯罪的概率是多大。而我們自己也算不出,因?yàn)楦揪蜎]有提供P(A),也即所有少年中,究竟有多少人瀏覽過該類網(wǎng)站。第二,該報(bào)道 也存在非隨機(jī)取樣的問題。在WOOLDRIDGE計(jì)量經(jīng)濟(jì)學(xué)導(dǎo)論第17章中專門講到了取樣的問題。非隨機(jī)取樣,如果能滿足外生取樣的條件,那么估計(jì)量也可能是無(wú)偏的,或者是一致的。但是這里的選樣,只選取少年犯作為樣本,這里的選樣標(biāo)準(zhǔn)顯然和擾動(dòng)項(xiàng)相關(guān),這里的估計(jì)肯定是有偏的。第三,這里明顯的存在遺漏變量偏誤。我們只以瀏覽網(wǎng)站與否這一個(gè)解釋變量來(lái)解釋是否犯罪,這樣的回歸幾乎肯定存在遺漏變量偏誤。其實(shí),從WOOLDRIDGE的犯罪計(jì)量學(xué)的簡(jiǎn)單介紹中,我們都可以看到,犯罪率的解釋變量通常有,如定罪率、失業(yè)率等等。我們就少年犯罪可以想象到的還可能包括,輟學(xué)率等等。這些變量不控制,根本無(wú)法得出因果推斷。 3,· 立場(chǎng)與論證的區(qū)別。注意朱教授是贊成環(huán)保和戒煙的,但是反對(duì)他們的論證。這兩者之間并不矛盾。當(dāng)然,從這里或許我們也看到如何用所學(xué)知識(shí)去批判性的思維,拒絕媒體的洗腦。朱教授的這兩篇文章并不深?yuàn)W,但卻很有意義。 以下是朱教授的原文: 吸煙致癌? 如果這個(gè)敘述為真, 其中的因果關(guān)系不言可喻: 吸煙是因, 肺癌是果. 要檢定這個(gè)因果關(guān)系, 定義被解釋變量為Y=0 或 1 (Y=1, 代表有肺癌; Y=0, 無(wú)肺癌). 解釋變量為X1, X2,…其中X1是每日吸煙的數(shù)量(單位, 支/天). 想法很簡(jiǎn)單: 用橫剖面數(shù)據(jù)來(lái)估計(jì)二元回歸如Logit 或Probit, 然后檢定X1系數(shù)的顯著性. 如果顯著, 我們不但可以確認(rèn)此因果關(guān)系, 還可以計(jì)算, 例如, 每日吸煙量為10支的人(X1=10), 會(huì)比完全不吸煙的人(X1=0)提高了多少得肺癌的機(jī)率. 二個(gè)重點(diǎn): <!--[if !supportLists]-->(1) <!--[endif]-->如果除了X1之外的其他變量, X2, X3,…(其他可影響得肺癌的因子)沒有選好, X1系數(shù)的估計(jì)將產(chǎn)生偏誤(inconsistency), 于是顯著性檢驗(yàn)變得毫無(wú)意義, 因果關(guān)系將受到扭曲. <!--[if !supportLists]-->(2) <!--[endif]-->橫剖面數(shù)據(jù)必須要避免取樣的偏誤(sample selection bias). 樣本一定要包含有肺癌及無(wú)肺癌這二類的觀察值. 在這二個(gè)問題上, 哎…多少人犯了錯(cuò)誤!! 在官方與非官方討伐吸煙的聲明中, 我們看到的全是一面倒的言論. 血淋淋吸煙有害的數(shù)據(jù)根本就是統(tǒng)計(jì)的謊言. 但是一般人沒有統(tǒng)計(jì)知識(shí), 任由媒體操弄洗腦. 就算沒有統(tǒng)計(jì)知識(shí), 運(yùn)用常識(shí)推斷, 也不至于對(duì)媒體的報(bào)道, 毫不猶豫的照單全收. 我不是鼓吹吸煙無(wú)害, 只是感慨媒體的強(qiáng)大洗腦能力. 類似的問題, 二氧化碳導(dǎo)致溫室效應(yīng)的說法也是統(tǒng)計(jì)的謊言, 一般人也被洗腦洗的沒腦了. 別弄錯(cuò)了, 我也是贊成環(huán)保的. 但是始終沒看到合理的統(tǒng)計(jì)證據(jù). 這些把溫室效應(yīng)當(dāng)口號(hào)的人居然還可以預(yù)測(cè)200年后地球的氣溫會(huì)上升若干度!! 你相信有人可以預(yù)測(cè)如此遙遠(yuǎn)未來(lái)的事? 你相信只用二氧化碳排放量就可以預(yù)測(cè)200年后地球的氣溫??我是根本不相信的. 不然, 把預(yù)測(cè)模型端上來(lái)辯論呀! 把預(yù)測(cè)標(biāo)準(zhǔn)誤也公布嘛…我非常懷疑他們有預(yù)測(cè)的標(biāo)準(zhǔn)誤. 吸煙與肺癌的關(guān)聯(lián)(Association, or correlation)早在1940年代就觀察到不少死于肺癌的人, 他們的肺都是黑黑的. 再一追究, 發(fā)現(xiàn)這些人都有吸煙. 于是吸煙與肺癌的相關(guān)性就產(chǎn)生了. 但是從相關(guān)性到因果性, 基本統(tǒng)計(jì)學(xué)告訴我們, 這之間是有極大的距離. 例如, 假設(shè)數(shù)據(jù)又顯示, 死于肺癌的人大都居住在城市. 請(qǐng)問城市是否為肺癌的因?? 口才好的會(huì)說, 城市不是因, 城市的空氣污染才是因! 是嗎? 我也可以想象另一個(gè)原因, 住在城市的壓力大,生活步調(diào)比較緊張, 所以致癌. 說真的, 我可以有一大堆想當(dāng)然耳的原因. 這些都可以和肺癌有相關(guān)性, 但卻不一定有因果性. 請(qǐng)問: 一個(gè)住在城市的吸煙者死于肺癌, 究竟何者才是因? 你要如何解釋一個(gè)住在鄉(xiāng)下的吸煙者沒有肺癌? 這些關(guān)于因果性的問題, 僅靠相關(guān)性(不管它多么顯著)是無(wú)法回答的. 關(guān)鍵是: 如果要探討吸煙與肺癌的因果關(guān)系, 其他X2,X3,...的變量若沒控制好, 終究是徒勞無(wú)功的. 還有, 別忘了 “取樣的偏誤”, 只檢視死于肺癌的人的樣本能有說服力? 美國(guó)官方, US National Institute of Health的 National Cancer Institute (http://www.cancer.gov/cancertopics/factsheet/Tabacco/cancer)在首頁(yè)上就看的到: "Cigarette smoking causes 87% of lung cancer death." 這就是誤導(dǎo)的統(tǒng)計(jì)數(shù)字! 計(jì)算方法很簡(jiǎn)單.就從死于肺癌的人計(jì)算他們之中有吸煙的比例. 這種數(shù)據(jù)也拿出來(lái)忽弄人?? 我干脆也說空氣污染造成了100%肺癌死亡. 于是要活命的全搬去鄉(xiāng)下吧! 因果性是要有理論的. 可是,吸煙導(dǎo)致肺癌的過程仍然沒有醫(yī)學(xué)根據(jù)(有誰(shuí)知道更新的醫(yī)學(xué)發(fā)現(xiàn),還請(qǐng)告知). 據(jù)我所知, 沒有人能解釋吸煙是如何導(dǎo)致肺癌. 假設(shè), 有一種致癌因子X會(huì)因?yàn)槲鼰煻钴S, 請(qǐng)問, 肺癌的因是致癌因子X, 還是吸煙? 答案當(dāng)然是致癌因子X。可是當(dāng)致癌因子X沒發(fā)現(xiàn)之前,吸煙就會(huì)被誤認(rèn)為是因。醫(yī)學(xué)上若不把肺癌搞清楚, 僅用統(tǒng)計(jì)數(shù)據(jù)分析來(lái)支持吸煙會(huì)致癌是有很大的困難度的. 如果在 “所有” 吸煙人口中有87%的人得了肺癌, 不需要太多的統(tǒng)計(jì)分析, 我也會(huì)很認(rèn)真地去考慮因果關(guān)系存在. 但是就美國(guó)的數(shù)據(jù)來(lái)看,在所有吸煙人口中大約有6%的人得了肺癌. 另外有94%沒有耶!! 就從這個(gè)數(shù)據(jù)來(lái)看, 你認(rèn)為吸煙與肺癌因果關(guān)系有多強(qiáng)?? 在這6%的人,他們的飲食,居住環(huán)境,運(yùn)動(dòng)習(xí)慣. . .有多少異同?誰(shuí)可夠勇敢地立下結(jié)論說:他們?nèi)且驗(yàn)槲鼰煂?dǎo)致肺癌?同樣地, 縱然死于肺癌的人全住在城市, 我們也得看看“所有”的城市人口有多少比例是死于肺癌. 有思考的人都會(huì)明白這個(gè)簡(jiǎn)單的道理吧! 吸煙致癌的統(tǒng)計(jì)分析大致上比較了二種樣本: 吸煙人樣本和不吸煙人樣本(controlled sample). 事實(shí)上, controlled sample根本沒control好. 也就是說, X2,X3…等其他因子沒控制好. 這樣的比較分析, statistically unsound. 還請(qǐng)高人提供這方面有嚴(yán)謹(jǐn)?shù)慕y(tǒng)計(jì)分析的期刊論文參考. 其他有“取樣的偏誤”的分析, 根本不值一看. 用這二個(gè)重點(diǎn)(其他致癌因子的控制,與取樣的偏誤)來(lái)批判, 我還未看到可接受的統(tǒng)計(jì)分析. 我寫這些, 并沒有接受煙草公司的贊助. 我贊成戒煙(不是因?yàn)橹虏恢掳?而是吸煙會(huì)上癮), 也贊成環(huán)保(我討厭臟亂)。但是, 我看不慣媒體以及衛(wèi)道人士用粗造的統(tǒng)計(jì)數(shù)據(jù)來(lái)洗大家的腦. 算是職業(yè)病吧! 后記 -May 2nd 吸煙致不致癌? 我不知道. 因?yàn)槲抑皇菑慕y(tǒng)計(jì)學(xué)的角度來(lái)看這個(gè)問題, 只是 “一個(gè)” 角度而已. 僅由一個(gè)角度是不好斷言吸煙致不致癌的. 我很清楚以偏槪全的危險(xiǎn). 我想說的只是: 現(xiàn)有的統(tǒng)計(jì)證據(jù)不足以支撐吸煙致癌的主張. “不足以支撐” 和 “反對(duì)” 是有很大的距離的.我完全沒有誤導(dǎo)吸煙無(wú)害或鼓勵(lì)吸煙的意思. 有個(gè)評(píng)論說的不錯(cuò): “吸不吸煙是個(gè)人價(jià)值取向問題,媒體的輿論是為了引導(dǎo)健康的生活方式.” 或許我該說: 吸煙致癌是媒體善意的統(tǒng)計(jì)謊言吧. 然而, 媒體在其他很多問題上脫不了misinform的責(zé)任, 溫室效應(yīng)/全球暖化就是另一個(gè)例子. 從婚外情到肺癌 標(biāo)簽: 條件機(jī)率 根據(jù) “調(diào)查”, 有過婚外情的男人, 其中有70% 認(rèn)為自己的婚姻不幸福. 首先,基于這個(gè)統(tǒng)計(jì)數(shù)據(jù),你可以說婚姻不幸福導(dǎo)致了婚外情嗎? (如果你認(rèn)為 “可以”, 我覺得男人分明是居心不良地把婚外情的責(zé)任推卸了一半給女人, 因?yàn)榛橐龅木S持畢竟是二個(gè)人共同的事). 調(diào)查又說,每一萬(wàn)個(gè)中國(guó)男人中有2.2個(gè)坦誠(chéng)有過婚外情; 同時(shí), 有37.6% 的中國(guó)男人自認(rèn)婚姻并不幸福. 這些數(shù)據(jù) “可以” 說明什么?? (1) 如果我站在天安門廣場(chǎng), 隨意遇見一位陌生的男人, 我們可以估計(jì)他有婚外情的機(jī)率是 2.2/10000. (2) 如果我遇見一位臉上寫著婚姻不幸福的男人, 他有婚外情的機(jī)率是多少? 是70% 嗎? 絕對(duì)不是! 請(qǐng)注意: 有婚外情的男人估計(jì)是有70%的機(jī)率是個(gè)婚姻不幸福的男人. 但是, 婚姻不幸福的男人會(huì)有多少機(jī)率發(fā)生婚外情呢? 這完完全全是另外一個(gè)問題! 用統(tǒng)計(jì)術(shù)語(yǔ)來(lái)說, 若A=婚姻不幸福, B=發(fā)生婚外情, 條件機(jī)率 P(A|B)=0.7. 然而, 我們更關(guān)心另一個(gè)條件機(jī)率, P(B|A), 即是: 一位自認(rèn)婚姻不幸福男人, 他有婚外情的機(jī)率是多少? 這二個(gè)條件機(jī)率絕不相同, 無(wú)庸?fàn)幷? 簡(jiǎn)單的機(jī)率運(yùn)算得到: (1) 一位自認(rèn)婚姻不幸福的男人, 他有婚外情的機(jī)率是 4/10000. 請(qǐng)比較一下, 這和被誤解的70%的有多巨大的差異! (2) 一位自認(rèn)婚姻幸福中國(guó)男人, 他有婚外情的機(jī)率是 1.06/10000. (3)【朱家祥教授散文讀后感】相關(guān)文章:
祥字怎么讀04-23
劉秀祥人物事跡10-11
劉秀祥先進(jìn)事跡01-12
朱之歌作文08-11
朱湘的資料12-29
朱厚熜07-21
教授邀請(qǐng)函02-20
于丹教授人生格言04-05
給教授的感謝信12-24
2021劉秀祥人物事跡10-11