統計與尋解

統計反映了一定的事實規律,然而統計數據背後往往有很多不為人知的故事,我們應該如何根據統計數據做決策,是很值得思考的問題。

從一個故事談起吧:兩位鞋商到非洲某國開拓事業。根據統計報告,某國人民 95% 不穿鞋,只有 5% 穿鞋。甲鞋商心想:「某國人民根本不穿鞋,放棄吧!」,乙鞋商心想:「某國人民大多不穿鞋,正是開拓市場的機會!」於是甲搭機回國,乙則積極宣傳、設廠。幾年過去,甲沒有得到什麼,乙卻賺了一大筆錢。

Q1:很久以前,國人有 98% 是文盲,只有 2% 識字。有人說:「大多數人民不識字,所以國家政令應該透過口耳相傳的方式傳播」這策略是對的嗎?

我們現在都知道,事實上從古至今,政令都是透過詔書、榜文、告示等途徑傳播給知識份子,再由知識份子口耳相傳給不識字的人知道。這是因為文字具有許多優點,比如容易記錄、保存,不容易失真等特性。而大家也知道,識字的普及率是可以改變的,現代透過教育普及,文盲率已經降低到 2% 以下。我們使用文字,是因為她是好的、對的,而不是因為比較多人會用她。

Q2:罹患甲病的人,3 個月存活率 5%,罹患乙病的人,1 年存活率 20%。試問哪個病比較可怕?若要發展治療策略,應該把資源投注在何者?

乍看之下,甲病似乎比較可怕,比較難搞,而乙病似乎比較沒那麼可怕,沒那麼難搞。然而事實上,答案是「資訊不足,無法判斷」。

我們可以想像更極端的例子:甲病 7 天存活率 10%,乙病 1 年存活率 20%。大家有沒有想到什麼?甲病可能是一種急性傳染病,而且可以有效治療;乙病可能是惡性腫瘤之類,沒有好的治療方法。

畫成圖來看,甲病可能是這樣:7 天存活率 10%。

罹患傳染病甲的人有 90% 在七天內死亡,10% 會存活。

然而,幕後真相可能是這樣:大多數人沒有接受有效的治療。

罹患傳染病甲的人有 4% 接受抗生素 X 治療,96% 未治療。接受抗生素 X 治療的有 5% 會在七天內死亡,95% 會存活;未接受抗生素 X 治療的有 93% 會在七天內死亡,7% 會存活。

發現了這點,處理策略就變得很簡單:透過宣導、衛教、改善診斷技術等方式,讓更多罹患甲病的人接受治療。

罹患傳染病甲的人有 98% 接受抗生素 X 治療,2% 未治療。接受抗生素 X 治療的有 5% 會在七天內死亡,95% 會存活;未接受抗生素 X 治療的有 93% 會在七天內死亡,7% 會存活。

上圖的結果相當於:7 天存活率 93%。

罹患傳染病甲的人有 7% 在七天內死亡,93% 會存活。

相對地,乙病雖看似不那麼可怕,真相卻可能是:多數患乙病的人已接受了相當充分的治療,效果仍然不好:

罹患癌症乙的人有 80% 在一年內死亡,20% 會存活。
罹患癌症乙的人有 91% 接受治療,9% 未治療。接受治療的有 79% 會在一年內死亡,21% 會存活;未接受治療的有 90% 會在一年內死亡,10% 會存活。

因此,一個病「可怕」或「不可怕」,不只要看患者的總體預後,也要瞭解其他資訊,比如是否充分接受治療,治療效果好不好等等。

Q3:癌症丙有兩種治療策略,經統計X療法平均一年存活率為 30%,Y療法平均一年存活率為 18%。試問何種療法較有發展潛力?

如果沒有更多資訊,我們大多會認為X療法效果較好,較值得開發。然而,如果有其他重要資訊,結論就未必如此。

比如,真相可能是,X療法實行簡單,病人不需要複雜的練習與配合;然而配不配合影響並不大:

接受療法X的人有 90% 遵從醫囑,10% 未遵從醫囑。遵從醫囑的有 70% 會在一年內死亡,30% 會存活;未遵從醫囑的有 75% 會在一年內死亡,25% 會存活。加總來看,接受療法X的人有 70% 會在一年內死亡,30% 存活。

相對地,Y療法可能對病人有很嚴格的要求,比如飲食、作息等等,導致接受Y療法的大多數病人並沒有好好地遵從醫囑;然而配不配合對治療效果影響甚鉅:

接受療法Y的人有 10% 遵從醫囑,90% 未遵從醫囑。遵從醫囑的有 10% 會在一年內死亡,90% 會存活;未遵從醫囑的有 90% 會在一年內死亡,10% 會存活。加總來看,接受療法Y的人有 82% 會在一年內死亡,18% 存活。

此時我們會發現,治療癌症丙的最理想方式可能是:推廣Y療法,並透過各種策略激勵、鼓舞病人,提升配合程度。如此一來,治療成效可望大幅成長:

接受療法Y的人有 90% 遵從醫囑,10% 未遵從醫囑。遵從醫囑的有 10% 會在一年內死亡,90% 會存活;未遵從醫囑的有 90% 會在一年內死亡,10% 會存活。加總來看,接受療法Y的人有 18% 會在一年內死亡,82% 存活。

在這種情況下,較有潛力的可能是Y療法。

目前最好未必最有潛力。著眼於「平均效果」(如上述的一年存活率)的好壞,找平均效果最好的方法去研究、改良,有機會慢慢進步;著眼於尋找「最佳效果」(如上述「療法Y且遵從醫囑」的 90% 存活率),找出其適用條件,加以研究、改良,往往有機會取得更為卓越的成果。

這就像投資股票,最好的策略不是選目前股價最高的,不是選目前股價最低的,不是選最近在漲的,也不是選最近在跌的,而是要選未來看漲的。

延伸閱讀

  1. 根據最好的證據治療
  2. 憑什麼相信中藥有效
  3. 統計學的「子群體效應」

留言

這個網誌中的熱門文章

Windows 批次檔令人崩潰的特殊字元處理

中文與英文的比較

為什麼 Mercurial 沒有比 Git 更好