- 相關(guān)推薦
朱家祥教授散文讀后感
朱家祥教授散文讀后感 這里的散文就是指非學(xué)術(shù)文章,或者是非技術(shù)性的分析。讀后感也不是什么長篇大論,而是一點小體會。 1,· 對朱教授“簡單的機(jī)率運(yùn)算”自己動手算了一算。 A=要吸煙 B=肺癌 已知:P(A)=0.376 P(B)=2.2/10000 P(A|B)=0.7 求解:P(B|A), 解: P(B|A)=P(A|B)*P(B)/P(A)=0.7*2.2/10000/0.376=0.00041也即是說已知一人吸煙,在不考慮其它因素的條件下,那么他得肺癌的可能性為0.041%。注意這同70%的區(qū)別有多大。 2,· 想起原來看過的一則新聞,自己還就此寫過博客。新聞大概是講:某種非法網(wǎng)站與少年犯罪的問題。該節(jié)目的大致邏輯是:青少年因為瀏覽改種類型的非法網(wǎng)站,于是產(chǎn)生犯罪。因此,我們應(yīng)該關(guān)閉該類網(wǎng)站。關(guān)于犯罪與網(wǎng)站之間因果關(guān)系的證據(jù)在于記者采訪少管所,發(fā)現(xiàn)幾乎所有的少年犯都瀏覽過改種類型的網(wǎng)站。政府依法關(guān)閉這種類型的網(wǎng)站,我們當(dāng)然堅決擁護(hù)。但是這則新聞報道卻有著與吸煙-致癌這一論述的相似問題。首先我們要注意,節(jié)目中提供的是哪一類概率。如果我們像吸煙-致癌一例中一樣,令A(yù)=瀏覽某種網(wǎng)站 B=犯罪的話,那么節(jié)目中只提供了P(A|B),也即我們已知一個人是少年犯,那么他瀏覽某種網(wǎng)站的概率。注意該報道中絲毫也沒有講到我們實際上真正關(guān)心的問題P(B|A)——已知一少年瀏覽過該類型網(wǎng)站,那么他犯罪的概率是多大。而我們自己也算不出,因為根本就沒有提供P(A),也即所有少年中,究竟有多少人瀏覽過該類網(wǎng)站。第二,該報道 也存在非隨機(jī)取樣的問題。在WOOLDRIDGE計量經(jīng)濟(jì)學(xué)導(dǎo)論第17章中專門講到了取樣的問題。非隨機(jī)取樣,如果能滿足外生取樣的條件,那么估計量也可能是無偏的,或者是一致的。但是這里的選樣,只選取少年犯作為樣本,這里的選樣標(biāo)準(zhǔn)顯然和擾動項相關(guān),這里的估計肯定是有偏的。第三,這里明顯的存在遺漏變量偏誤。我們只以瀏覽網(wǎng)站與否這一個解釋變量來解釋是否犯罪,這樣的回歸幾乎肯定存在遺漏變量偏誤。其實,從WOOLDRIDGE的犯罪計量學(xué)的簡單介紹中,我們都可以看到,犯罪率的解釋變量通常有,如定罪率、失業(yè)率等等。我們就少年犯罪可以想象到的還可能包括,輟學(xué)率等等。這些變量不控制,根本無法得出因果推斷。 3,· 立場與論證的區(qū)別。注意朱教授是贊成環(huán)保和戒煙的,但是反對他們的論證。這兩者之間并不矛盾。當(dāng)然,從這里或許我們也看到如何用所學(xué)知識去批判性的思維,拒絕媒體的洗腦。朱教授的這兩篇文章并不深奧,但卻很有意義。 以下是朱教授的原文: 吸煙致癌? 如果這個敘述為真, 其中的因果關(guān)系不言可喻: 吸煙是因, 肺癌是果. 要檢定這個因果關(guān)系, 定義被解釋變量為Y=0 或 1 (Y=1, 代表有肺癌; Y=0, 無肺癌). 解釋變量為X1, X2,…其中X1是每日吸煙的數(shù)量(單位, 支/天). 想法很簡單: 用橫剖面數(shù)據(jù)來估計二元回歸如Logit 或Probit, 然后檢定X1系數(shù)的顯著性. 如果顯著, 我們不但可以確認(rèn)此因果關(guān)系, 還可以計算, 例如, 每日吸煙量為10支的人(X1=10), 會比完全不吸煙的人(X1=0)提高了多少得肺癌的機(jī)率. 二個重點: <!--[if !supportLists]-->(1) <!--[endif]-->如果除了X1之外的其他變量, X2, X3,…(其他可影響得肺癌的因子)沒有選好, X1系數(shù)的估計將產(chǎn)生偏誤(inconsistency), 于是顯著性檢驗變得毫無意義, 因果關(guān)系將受到扭曲. <!--[if !supportLists]-->(2) <!--[endif]-->橫剖面數(shù)據(jù)必須要避免取樣的偏誤(sample selection bias). 樣本一定要包含有肺癌及無肺癌這二類的觀察值. 在這二個問題上, 哎…多少人犯了錯誤!! 在官方與非官方討伐吸煙的聲明中, 我們看到的全是一面倒的言論. 血淋淋吸煙有害的數(shù)據(jù)根本就是統(tǒng)計的謊言. 但是一般人沒有統(tǒng)計知識, 任由媒體操弄洗腦. 就算沒有統(tǒng)計知識, 運(yùn)用常識推斷, 也不至于對媒體的報道, 毫不猶豫的照單全收. 我不是鼓吹吸煙無害, 只是感慨媒體的強(qiáng)大洗腦能力. 類似的問題, 二氧化碳導(dǎo)致溫室效應(yīng)的說法也是統(tǒng)計的謊言, 一般人也被洗腦洗的沒腦了. 別弄錯了, 我也是贊成環(huán)保的. 但是始終沒看到合理的統(tǒng)計證據(jù). 這些把溫室效應(yīng)當(dāng)口號的人居然還可以預(yù)測200年后地球的氣溫會上升若干度!! 你相信有人可以預(yù)測如此遙遠(yuǎn)未來的事? 你相信只用二氧化碳排放量就可以預(yù)測200年后地球的氣溫??我是根本不相信的. 不然, 把預(yù)測模型端上來辯論呀! 把預(yù)測標(biāo)準(zhǔn)誤也公布嘛…我非常懷疑他們有預(yù)測的標(biāo)準(zhǔn)誤. 吸煙與肺癌的關(guān)聯(lián)(Association, or correlation)早在1940年代就觀察到不少死于肺癌的人, 他們的肺都是黑黑的. 再一追究, 發(fā)現(xiàn)這些人都有吸煙. 于是吸煙與肺癌的相關(guān)性就產(chǎn)生了. 但是從相關(guān)性到因果性, 基本統(tǒng)計學(xué)告訴我們, 這之間是有極大的距離. 例如, 假設(shè)數(shù)據(jù)又顯示, 死于肺癌的人大都居住在城市. 請問城市是否為肺癌的因?? 口才好的會說, 城市不是因, 城市的空氣污染才是因! 是嗎? 我也可以想象另一個原因, 住在城市的壓力大,生活步調(diào)比較緊張, 所以致癌. 說真的, 我可以有一大堆想當(dāng)然耳的原因. 這些都可以和肺癌有相關(guān)性, 但卻不一定有因果性. 請問: 一個住在城市的吸煙者死于肺癌, 究竟何者才是因? 你要如何解釋一個住在鄉(xiāng)下的吸煙者沒有肺癌? 這些關(guān)于因果性的問題, 僅靠相關(guān)性(不管它多么顯著)是無法回答的. 關(guān)鍵是: 如果要探討吸煙與肺癌的因果關(guān)系, 其他X2,X3,...的變量若沒控制好, 終究是徒勞無功的. 還有, 別忘了 “取樣的偏誤”, 只檢視死于肺癌的人的樣本能有說服力? 美國官方, US National Institute of Health的 National Cancer Institute (http://www.cancer.gov/cancertopics/factsheet/Tabacco/cancer)在首頁上就看的到: "Cigarette smoking causes 87% of lung cancer death." 這就是誤導(dǎo)的統(tǒng)計數(shù)字! 計算方法很簡單.就從死于肺癌的人計算他們之中有吸煙的比例. 這種數(shù)據(jù)也拿出來忽弄人?? 我干脆也說空氣污染造成了100%肺癌死亡. 于是要活命的全搬去鄉(xiāng)下吧! 因果性是要有理論的. 可是,吸煙導(dǎo)致肺癌的過程仍然沒有醫(yī)學(xué)根據(jù)(有誰知道更新的醫(yī)學(xué)發(fā)現(xiàn),還請告知). 據(jù)我所知, 沒有人能解釋吸煙是如何導(dǎo)致肺癌. 假設(shè), 有一種致癌因子X會因為吸煙而更活躍, 請問, 肺癌的因是致癌因子X, 還是吸煙? 答案當(dāng)然是致癌因子X。可是當(dāng)致癌因子X沒發(fā)現(xiàn)之前,吸煙就會被誤認(rèn)為是因。醫(yī)學(xué)上若不把肺癌搞清楚, 僅用統(tǒng)計數(shù)據(jù)分析來支持吸煙會致癌是有很大的困難度的. 如果在 “所有” 吸煙人口中有87%的人得了肺癌, 不需要太多的統(tǒng)計分析, 我也會很認(rèn)真地去考慮因果關(guān)系存在. 但是就美國的數(shù)據(jù)來看,在所有吸煙人口中大約有6%的人得了肺癌. 另外有94%沒有耶!! 就從這個數(shù)據(jù)來看, 你認(rèn)為吸煙與肺癌因果關(guān)系有多強(qiáng)?? 在這6%的人,他們的飲食,居住環(huán)境,運(yùn)動習(xí)慣. . .有多少異同?誰可夠勇敢地立下結(jié)論說:他們?nèi)且驗槲鼰煂?dǎo)致肺癌?同樣地, 縱然死于肺癌的人全住在城市, 我們也得看看“所有”的城市人口有多少比例是死于肺癌. 有思考的人都會明白這個簡單的道理吧! 吸煙致癌的統(tǒng)計分析大致上比較了二種樣本: 吸煙人樣本和不吸煙人樣本(controlled sample). 事實上, controlled sample根本沒control好. 也就是說, X2,X3…等其他因子沒控制好. 這樣的比較分析, statistically unsound. 還請高人提供這方面有嚴(yán)謹(jǐn)?shù)慕y(tǒng)計分析的期刊論文參考. 其他有“取樣的偏誤”的分析, 根本不值一看. 用這二個重點(其他致癌因子的控制,與取樣的偏誤)來批判, 我還未看到可接受的統(tǒng)計分析. 我寫這些, 并沒有接受煙草公司的贊助. 我贊成戒煙(不是因為致不致癌,而是吸煙會上癮), 也贊成環(huán)保(我討厭臟亂)。但是, 我看不慣媒體以及衛(wèi)道人士用粗造的統(tǒng)計數(shù)據(jù)來洗大家的腦. 算是職業(yè)病吧! 后記 -May 2nd 吸煙致不致癌? 我不知道. 因為我只是從統(tǒng)計學(xué)的角度來看這個問題, 只是 “一個” 角度而已. 僅由一個角度是不好斷言吸煙致不致癌的. 我很清楚以偏槪全的危險. 我想說的只是: 現(xiàn)有的統(tǒng)計證據(jù)不足以支撐吸煙致癌的主張. “不足以支撐” 和 “反對” 是有很大的距離的.我完全沒有誤導(dǎo)吸煙無害或鼓勵吸煙的意思. 有個評論說的不錯: “吸不吸煙是個人價值取向問題,媒體的輿論是為了引導(dǎo)健康的生活方式.” 或許我該說: 吸煙致癌是媒體善意的統(tǒng)計謊言吧. 然而, 媒體在其他很多問題上脫不了misinform的責(zé)任, 溫室效應(yīng)/全球暖化就是另一個例子. 從婚外情到肺癌 標(biāo)簽: 條件機(jī)率 根據(jù) “調(diào)查”, 有過婚外情的男人, 其中有70% 認(rèn)為自己的婚姻不幸福. 首先,基于這個統(tǒng)計數(shù)據(jù),你可以說婚姻不幸福導(dǎo)致了婚外情嗎? (如果你認(rèn)為 “可以”, 我覺得男人分明是居心不良地把婚外情的責(zé)任推卸了一半給女人, 因為婚姻的維持畢竟是二個人共同的事). 調(diào)查又說,每一萬個中國男人中有2.2個坦誠有過婚外情; 同時, 有37.6% 的中國男人自認(rèn)婚姻并不幸福. 這些數(shù)據(jù) “可以” 說明什么?? (1) 如果我站在天安門廣場, 隨意遇見一位陌生的男人, 我們可以估計他有婚外情的機(jī)率是 2.2/10000. (2) 如果我遇見一位臉上寫著婚姻不幸福的男人, 他有婚外情的機(jī)率是多少? 是70% 嗎? 絕對不是! 請注意: 有婚外情的男人估計是有70%的機(jī)率是個婚姻不幸福的男人. 但是, 婚姻不幸福的男人會有多少機(jī)率發(fā)生婚外情呢? 這完完全全是另外一個問題! 用統(tǒng)計術(shù)語來說, 若A=婚姻不幸福, B=發(fā)生婚外情, 條件機(jī)率 P(A|B)=0.7. 然而, 我們更關(guān)心另一個條件機(jī)率, P(B|A), 即是: 一位自認(rèn)婚姻不幸福男人, 他有婚外情的機(jī)率是多少? 這二個條件機(jī)率絕不相同, 無庸?fàn)幷? 簡單的機(jī)率運(yùn)算得到: (1) 一位自認(rèn)婚姻不幸福的男人, 他有婚外情的機(jī)率是 4/10000. 請比較一下, 這和被誤解的70%的有多巨大的差異! (2) 一位自認(rèn)婚姻幸福中國男人, 他有婚外情的機(jī)率是 1.06/10000. (3)【朱家祥教授散文讀后感】相關(guān)文章:
祥字怎么讀04-23
劉秀祥人物事跡10-11
劉秀祥先進(jìn)事跡01-12
朱之歌作文08-11
朱湘的資料12-29
朱厚熜07-21
教授邀請函02-20
于丹教授人生格言04-05
給教授的感謝信12-24
2021劉秀祥人物事跡10-11