![]()
系列簡介
這是我們一系列原創技術貼,從易到難,每天學習一點。所有內容均為疾控數據分析、科研論文相關,或者說很多和現在的熱門監測預警相關,所以我們這個系列就叫“監測預警基礎”。
今天是第32節,綜合指數法按照步驟說起來難度并不大,但是中間幾步其實可采用的具體方式也比較多,我們不可能一篇全部講完。
所以,今天我們以北京市疾控中心2018年發表在中華流行病上的一篇文章為例,當然,不是說這篇文章用的所有方式和方法現在看起來都非常完美,但是也是一篇綜合指數法應用于流感的經典文章,我們以此來拆解綜合指數法的6步操作,在這個過程中我們也會指出除文章采用的方式外還有哪些方式方法。
![]()
本文僅對該文章進行學習,思考,目的是介紹綜合指數法的步驟和方法,如有侵權,歡迎留言指出,我們將及時刪文。
如有不當之處,歡迎留言討論。
北京市疾控中心用一套方法,把流感樣病例(ILI)、流感病毒核酸檢測陽性率、流感聚集性疫情起數這三個“各說各話”的指標,捏合成一個每周更新的綜合指數(I),并切出了五級流行強度。
![]()
北京案例最終只選了3 個指標,但覆蓋了三個完全不同的維度:
![]()
為什么選 3 個?不是越多越好,而是“剛好夠交叉驗證”。病例數告訴你“總量在漲”,陽性率告訴你“確實是流感在漲而不是普通感冒”,聚集性疫情告訴你“已經從散在傳播升級到成簇傳播”。三者組合,基本能過濾掉單一指標的隨機噪音。
選指標其實非常重要,為此我們昨天專門有一節內容闡述這個問題
其他可選指標:諾如預警常用“病原陽性率+聚集性疫情起數”;新冠時期可納入發熱門診量、污水監測 Ct 值等。核心原則:選2~4 個、維度獨立、每周可更新的指標。
![]()
綜合指數法選好指標之后的一步就是去量綱。
為什么?
因為三個指標單位完全不同(人次、%、起數),必須各自除以一個“標準值”,才能變成可相加的相對倍數。所以這一步的難點和重點就是這個標準值從何而來?
北京案例里,三個標準值是這樣確定的:
① 流感樣病例數標準值:12 000 例/周
先算出北京市近 4 個流行季(2013—2017)的流感樣病例預警基線值 11 527 例/周;
結合北京實際監測網絡覆蓋情況,最終把標準值定為12 000 例/周。
② 流感病毒核酸檢測陽性率標準值:20%
先找出近 4 個流行季每周陽性率的年度最大值,分別為 54.13%、69.25%、53.67%、41.89%;
以此計算得出21.89%作為流感流行期與非流行期的界值;(最大值均值的40%)
最終確定20%作為該指標的標準值。
③ 流感聚集性疫情標準值:2 起/周
先用陽性率 20% 這個界值,把歷史數據切成“流行期”和“非流行期”;
再算近 4 個流行季里,流行期的聚集性疫情周平均值(2.2 起/周);
最終取整為2 起/周。
你發現沒,北京的專家是怎么做的,其實就是“歷史數據+專家評估”來定標準值。除此之外,你還可以采用以下方法,這些方法的具體操作我們前面的內容都分享過。
MEM(移動流行區間法):用 5 年以上周數據自動算出流行閾值,最客觀,但僅限周數據;
Serfling 回歸:擬合一條帶季節波動的動態基線,每周標準值都不同,適合強季節性疾病;
CUSUM/專家經驗:前者靈敏探測早期異常,后者適合剛起步、數據不足的系統。
![]()
有了標準值,標化就很簡單。
北京案例用的是最直觀的標準值法:相對值 = 本周實際值 ÷ 標準值
比如某周:
ILI 實際 18 000 例 → 18 000 / 12 000 =1.5
陽性率實際 30% → 30% / 20% =1.5
聚集性疫情實際 4 起 → 4 / 2 =2.0
這3個倍數現在單位統一了,都是“相對于標準的幾分之幾”,可以直接加權,我們的最終指數也就要呼之欲出了。
當然,除此之外,還有其他標化方法,比如:
Min-Max 法:(X - Xmin) / (Xmax - Xmin),把數據壓到 0~1;
Z-Score 法:(X - μ) / σ,適合正態分布數據;
均值歸一化法:結合 Min-Max 和 Z-Score 的特點。
為什么疾控常用標準值法?
因為標化后的倍數天然帶有公共衛生意義:>1 就是“超標準了”,0.5 就是“只有標準的一半”,不需要二次翻譯。
![]()
這一步其實很關鍵,憑什么某個指標權重高,某個低?誰說了算?
北京案例的權重是專家評估法確定的,最終結果為:
![]()
注意:三個權重加起來必須等于 1。這里前兩個指標平分秋色,聚集性疫情作為“社會面升級信號”占 0.2,既不被忽視,也不喧賓奪主。
當然,還有其他權重確定方法,比如:
德爾菲法:背對背多輪專家打分,適合本地專家經驗豐富時;
層次分析法(AHP):兩兩比較指標重要性,通過一致性檢驗(CR<0.1)確保邏輯自洽;
熵權法:純數據驅動,指標波動越大權重越高,最客觀,但需要較長歷史數據。
我們的實務建議:不要直接抄北京這篇的 0.4/0.4/0.2。甲市和乙市的監測網絡、就診習慣不同,權重需要本地化。數據充足時,建議熵權法+專家評估組合使用,既客觀又貼合實際。
![]()
綜合指數的計算公式非常簡單:
I = Σ [ Wi × ( Xi / Mi ) ]
代入上面的例子:
I=0.4 ×1.5+0.4×1.5+0.2×2.0=1.6
這個1.6就是當周的流感綜合風險分值。
北京2013—2017年共209周的實際結果顯示:綜合指數I值范圍為0.27~3.94,中位數0.46,四分位距0.36~1.01,偏度為 2,呈右偏分布,即大多數時間風險較低,少數時間很高。
![]()
算出指數后,必須“切幾刀”,對應到不同防控響應。北京案例根據 209 周數據的分布特征(中位數、偏度、四分位距)結合專家評估,切出了五級:
![]()
注意:北京 209 周里,5 級(I>4)一次都沒出現,4 級也只出現了 8 周(3.83%)。
這說明閾值切得合理——既不會天天狼來了,也不會漏掉真正的高風險時段。
當然,現在很多人也用以下方法來切一切:
MEM 法:把綜合指數當成單一指標,用移動流行區間法直接算出流行閾值和中位/高強度/超高強度閾值;
百分位數法:用歷史綜合指數的中位數、75%、90%、95% 分位數作為切點;
專家研討法:結合本地防控資源和響應能力,對數據切分結果進行人工校準。
好的,到此為止,綜合指數法的操作步驟就是這么簡單。
北京這篇經典案例告訴我們:綜合指數法不是高科技,而是一套“選準指標→定好尺子→加權求和→分級響應”的標準化流程。它的威力不在于算法復雜,而在于把“門急診在喊、實驗室在報、學校在暴發”這三類聲音,翻譯成一句統一的、有刻度的、可行動的預警結論。
![]()
參考文獻和書籍:
[1]楊鵬, 王小莉. [M]傳染病預測預警技術及實踐案例分析.[M] 人民衛生出版社: 267-275.
[2] 張莉, 吳雙勝, 石偉先, 等. 綜合指數法建立北京市流感流行水平分級評價體系的研究[J]. 中華流行病學雜志, 2018, 39(8): 1096-1099. DOI: 10.3760/cma.j.issn.0254-6450.2018.08.016.
![]()
編輯:普通疾控人 | 審核:詩酒趁年華
文章來源 | 原創
說明 | 轉載只為分享,如有侵權聯系刪除
?版權聲明 | 部分信息和圖片來自公開網絡
轉載請注明
再次轉載請注明出處
![]()
科普健康 | 宣傳疾控
本號為多位疾控機構從業者運營
重點關注國內外健康事件
致力于疾控科普
在做好科普服務大眾的同時
做好疾控機構的宣傳
讓更多的人了解疾控,擁抱健康
歡迎加「小編」微信(cdcjkr126com)
本文具體說明
本文為原創內容,文章為個人理解所學,不涉及疫情信息及內部保密數據,發表的目的為自我總結及給有需求的人士學習使用。如有不妥之處,歡迎聯系小編修改、刪除。
更多精彩視頻,盡在“CDC疾控人”視頻號
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.