為規范和促進真實世界證據在藥品安全性評價中的應用,根據國家藥品監督管理局工作部署,評價中心組織制定了《真實世界數據支持藥品安全性主動監測的一般原則》(見附件)。按照《國家藥監局綜合司關于印發藥品技術指導原則發布程序的通知》(藥監綜藥管〔2020〕9號)要求,經國家藥品監督管理局審查同意,現予發布,自發布之日起施行。
附件
真實世界數據支持藥品安全性主動監測的一般原則
為促進真實世界數據在藥品安全性評價中的應用,指導藥品上市許可持有人(以下簡稱“持有人”)規范開展藥品安全性主動監測研究,制定本指導原則。
本指導原則中“藥品安全性主動監測”(以下簡稱“主動監測”)是指采取持續有組織的方式,主動收集一個或多個來源的數據,進而利用數據發現未知風險信號,評價新發現的風險信號,描述藥品的安全特征、評估藥品風險的過程。
本指導原則僅代表當前的觀點和認識,隨著藥品監管科學研究的不斷深入,本指導原則中的相關要求及內容也將不斷完善。
一、主要目的
主動監測常用于研究以下藥品安全性問題:(1)是否存在新的風險信號;(2)發現的風險信號是否構成新的安全風險;及/或(3)新的安全風險的特征及影響因素等。主要包括:
信號發現(信號檢測):利用主動監測數據,發現或識別藥品與某個或某類不良事件之間的新的潛在因果關系,或兩者之間已知關聯的新變化(如不良反應的頻率、持續時間、嚴重程度等改變)。
信號評價:利用主動監測數據及其他可獲得的數據資源對風險信號進行評價,綜合判斷信號是否已構成新的藥品安全風險。
風險評估:利用主動監測獲取的數據及其他相關信息對“新的藥品安全風險”開展綜合評估,描述其性質、頻率和嚴重程度,了解風險的特征和影響因素等。
二、數據來源及類型
基于上市藥品安全性評價目的、數據質量及可及性等因素,主動監測可收集不同來源、類型的真實世界數據。根據數據形成的原因,可分為研究特定安全性問題形成的數據、常規診療過程形成的數據、其他研究/管理目的形成的數據。
(一)研究特定安全性問題形成的數據
基于預先設定的研究目的,通過制定統一的變量定義標準和收集模式,獲取與特定藥品安全性問題相關的數據,獲取方法包括但不限于哨點監測、藥物/處方事件監測、登記等。
1. 哨點監測
指在固定地點(哨點)通過查閱醫療記錄或訪談醫生、患者等形式,從現場獲取更為完整、全面的藥品不良反應/事件數據的方法。哨點監測可以獲取自發報告方式難以得到的數據,如某些特殊疾病患者亞群的數據。此外,在特定醫療機構還可以收集藥物濫用等信息。
2. 藥物/處方事件監測
采用觀察性隊列研究方法,不干涉醫師的診療行為,根據處方數據確認每個患者,向處方醫生或患者發送隨訪調查表,并獲取患者用藥與結局信息,如人口統計學信息、適應癥、用藥持續時間、劑量、臨床事件、停藥原因等。其優點一是可在一定程度降低選擇性報告的影響,二是可識別其他方法難以識別的藥品不良反應,包括潛伏期較長的不良反應。其局限性是醫師或患者的應答率低、失訪率較高、收集的信息種類分散,可能導致重要信號不明確。
3. 登記
采用有組織的系統和觀察性研究方法,收集使用某種特定藥品(藥品登記)或患有特定疾病(疾病登記)人群的特定結局發生過程的數據。登記數據在評估罕見疾病人群、罕見病治療藥物或特殊人群風險信號時具有一定優勢。同時,通過與已有外部數據(處方數據庫、國家癌癥注冊數據、死亡登記等)鏈接,可豐富登記數據庫的暴露、協變量、效應修飾因子、結局信息。
(二)常規診療過程形成的數據
醫院電子病歷系統數據(Electronic Medical Record,EMR)、醫保數據、區域健康醫療數據等均為常規診療過程形成的數據,可用于支持主動監測。此類數據包括但不限于以下類型:
1. 醫院電子病歷系統數據
患者在醫療機構接受診療服務過程中所產生的記錄,包括患者人口學特征、診斷、醫囑、實驗室檢驗、影像學檢查等數據,通常以結構化及/或非結構化的形式呈現。
2. 醫保數據
各級醫保部門建立的醫保理賠數據庫,涵蓋參保人群基本信息、門診和住院疾病診斷、處方用藥、診療項目、結算等結構化字段的數據。
3. 區域健康醫療數據
整合利用某個區域內多來源真實世界數據,包括醫療機構、醫保及其他來源的公共衛生數據,有助于獲取該區域更多患者、更加全面的藥品不良事件信息,可彌補單一來源數據人群代表性相對不足等問題。
4. 居民電子健康檔案
居民接受醫療衛生服務過程中產生的電子化記錄,是以居民個人健康為核心、貫穿整個生命過程、涵蓋各種健康相關因素的系統化數字文檔記錄,包括個人基本信息、健康體檢記錄、醫院診療記錄、重點人群健康管理及其他衛生服務記錄等。
(三)其他研究/管理目的形成的數據
因其他研究/管理目的形成的真實世界數據,如包含藥品安全性評價所需的信息,也可用于主動監測,實現數據的分析利用。此類數據包括但不限于以下類型:
1. 死亡登記數據庫
政府或相關機構用于記錄公民死亡信息的數據庫,詳細記錄了與死亡事件相關的信息,包括死亡時間、地點、死因、年齡、性別等。
2.公共衛生監測數據庫
由政府部門或公共衛生機構建立關于人群健康狀況和公共衛生事件的數據庫系統,如慢性非傳染病監測、免疫接種不良事件監測等,通過連續、系統收集疾病或其他公共衛生事件信息,了解其分布和流行趨勢。
3. 其他數據
因其他目的開展研究形成的數據,例如因其他安全性問題而開展的藥品上市后研究、主動監測等形成的數據;以及可穿戴設備、移動APP/設備等途徑收集的健康數據等,若包含本次安全性評價所需的信息,也可作為主動監測的數據來源。
三、適用范圍
實施主動監測收集的真實世界數據及產出的真實世界證據,可用于發現未知風險信號,評價新發現的風險信號,描述藥品的安全特征、評估藥品風險等,以及用于支持修改藥品說明書、識別高風險人群、指導臨床合理用藥等多種決策。真實世界數據支持主動監測的主要適用范圍如下:
(一)發現可疑風險信號
通過對各種途徑收集得到的醫院電子病歷系統數據、醫保數據等真實世界數據,借助統計模型、人工智能等大數據挖掘技術開展信號檢測,可及時發現新的藥品安全風險。需重點關注的可疑信號主要涉及:
1. 新發現的非預期、嚴重不良事件或已知不良事件的嚴重程度明顯增加或頻率顯著升高等;
2. 新的藥物相互作用(包括:藥物-藥物、藥物-食物、藥物-醫療器械等);
3. 涉及新的潛在高風險人群等。
(二)評價新發現的風險信號、評估藥品風險
針對新發現的風險信號,獲取藥品上市后臨床使用形成的真實世界數據,可用于評價新發現的風險信號、評估藥品風險,具體包括:
1. 明確藥品與不良事件的因果關系,識別風險信號是否由目標藥品導致。
2. 量化潛在的或已識別的藥品風險。如計算潛在的或已識別的藥品不良事件發生率,描述其嚴重程度、持續時間、人群分布等特征。若為已確認的風險,還可與對照人群進行比較獲得相對危險度或率差。
3. 描述藥品風險特征、分析影響因素等。分析可能引起藥品風險、增加風險發生頻率或嚴重程度的危險因素,包括效應修飾因子。
4. 評估罕見及/或遲發的不良反應風險。通常上市前臨床研究納入的患者例數有限、隨訪時間較短,往往難以發現罕見及/或遲發的藥品不良反應。藥品上市后,不斷累積形成的大樣本真實世界數據具有納入人群廣泛、隨訪時間長的特點,可用于相關風險的評估。
(三)評估特殊人群用藥風險
由于倫理等問題,孕婦、兒童、老年人、肝或腎功能不全等人群一般不作為上市前臨床試驗的受試者,其用藥的安全性常缺乏上市前臨床研究數據/證據支持。實施主動監測收集特殊人群在臨床診療過程中產生的真實世界數據,可用于評估其臨床用藥風險。
(四)評估藥物相互作用風險
在臨床實踐中,常存在兩種或兩種以上藥物同時或序貫使用的情形。不同藥物之間可能存在藥效或毒性作用的協同、相加或拮抗,以及藥動學的相互作用,從而影響藥物治療效果或增加用藥風險。上市前臨床試驗對聯合用藥的研究較為有限,難以發現或評價潛在的藥物相互作用?;谥鲃颖O測收集真實世界數據,可用于對藥物與藥物的相互作用風險進行評價。同樣可用于評價藥物與食物、藥物與醫療器械等的相互作用風險。
(五)描述藥源性疾病流行情況
藥物性心、肝或腎等重要臟器損害以及藥物導致的嚴重血液系統損害、嚴重過敏反應等藥源性疾病,影響患者臨床用藥安全,甚至可能危及生命。實施主動監測可獲得更為全面、詳盡的不良事件數據,可用于描述其發病率、患病率、地域分布、時間趨勢等流行情況,為藥品安全監管和臨床安全用藥提供參考。
(六)對風險控制措施開展后效評估
針對已確認的安全風險,基于主動監測數據對采取藥品風險控制措施前后的不良反應發生率、嚴重程度等進行比較,為評估藥品風險控制措施的有效性提供依據。
四、實施流程
針對需研究的藥品安全性問題,首先應評估自發報告及其他已有數據及資料(文獻報道、上市前研究及已有上市后研究數據及結果)是否可以滿足要求;當已有數據及資料不足時,可開展主動監測進一步獲取真實世界數據。
主動監測的實施流程一般包括:明確研究目的;制定研究方案;確定適宜的真實世界數據來源和類型;獲取主動監測數據;開展數據治理/數據管理,構建研究數據集;基于研究方案進行統計分析,開展信號檢測、信號評價、風險評估,制訂風險管理措施等。
(一)明確研究目的
主動監測數據可用于發現未知風險信號,評價新發現的風險信號,描述藥品的安全特征、評估藥品風險等?;谥鲃颖O測數據開展藥物流行病學研究,可產出用于支撐監管決策的證據。
(二)制定研究方案
主動監測通常需要組建多學科交叉的研究團隊,涵蓋如臨床醫學、藥學、藥物流行病學及生物統計等領域專家。研究方案應重點明確研究變量定義和統計分析計劃?;诓煌难芯繂栴},所需的研究變量和關鍵數據要素不同。對于信號檢測,通常需要至少確定藥物暴露和不良結局相關信息;而信號評價、風險評估可采用傳統藥物流行病學方法,在研究方案中應明確擬使用的流行病學設計類型、研究關鍵變量(研究人群、目標藥品、對照、結局事件、關鍵協變量)及其對應的數據要素。
(三)確定數據來源/類型
針對研究方案中所確定的關鍵數據要素,開展數據適用性評估,確定擬采用的真實世界數據來源/類型(例如醫院電子病歷系統或醫保數據等)及獲取方式。
不同的數據源和數據類型的質量和所涵蓋的數據元素不同,應就具體研究問題對數據是否適用進行評估,根據評估結果選擇合適的數據源、數據類型。
數據的適用性評估主要包括數據可及性、相關性和可靠性等。一般而言,考慮到研究成本和可行性,優先評估已有數據(如醫院電子病歷系統數據、醫保數據或已有的患者登記數據等)對當前研究的適用性。若已有數據缺乏主動監測所需關鍵變量或質量未達到研究需求,可以考慮進行前瞻性數據收集,或適當調整研究設計。
(四)數據獲取與數據治理/管理
針對不同來源和類型的真實世界數據,數據獲取與數據治理/管理方式不同。
1. 研究特定安全性問題形成的數據
對于研究特定安全性問題形成的數據,此類數據通常需前瞻性收集,在收集過程中同步實施數據管理以保證數據質量。數據收集及管理內容一般包括:制作病例報告表明確擬收集的數據內容;制定標準化的數據收集手冊如變量定義、測量方式與時間、數據核查流程等;制作數據收集系統,確定合適的數據錄入方式;定期開展數據核查、疑問數據反饋等數據管理等。
2. 常規診療過程形成的數據
對于常規診療形成的診療數據,可以采用人工摘錄或電子化等方式,基于明確的數據提取方案獲取。數據提取方案應包含擬提取變量及其存儲模塊。針對提取到的數據,研究者應開展完整性和準確性核查。
常規診療過程形成的數據獲取可考慮兩種方式:一是針對具體的安全性問題從醫院電子病歷系統數據提取特定藥品醫囑處方記錄及特定診斷、臨床檢測異常值等相關數據,用于藥品安全性評價。二是不針對具體安全性問題,綜合考慮一類或多類安全性問題,將提取到的相關數據治理后構建研究型數據庫;后續針對具體安全性問題,構建數據集,二次篩選數據開展研究。
應注意,此類數據的產生并非基于研究問題,通常無法直接進行分析,還需經過數據治理將原數據轉化為適用于當前主動監測研究的數據庫或數據集。數據治理過程主要包括數據鏈接、數據標準化(制定變量字典)、數據結構化(文本信息結構化)規則以及數據處理(異常值、極端值、矛盾數據等)。開展數據治理時應注意個體隱私保護和數據安全,并遵循準確性、透明性、一致性和可重復性等原則。
3. 其他研究/管理目的形成的數據
此類數據來源較多,基于不同來源的研究/管理目的形成的數據,其數據獲取和治理/管理方式不同。通常死亡登記數據庫、公共衛生監測數據庫的獲取與治理可參照常規診療過程形成的數據;如采用其他研究目的形成的數據,則應根據當前研究目的重新進行信息提取以及必要的數據治理。
此外,如單一數據來源不能滿足安全性評價的需求,需從兩個或多個數據源獲取相關數據,經治理后用于主動監測。此時應注意多源數據間的是否可以有效鏈接并整合運用。其次,還應針對數據治理過程開展質量評價,包括但不限于是否有清晰明確、合理的數據清理規則及流程、變量字典的合理性、文本結構化結果驗證準確性等。數據治理過程的質量評價內容可參考已發布的相關指導原則。
(五)數據分析與利用
基于所構建的研究型數據集,遵循預先制定的統計分析計劃,開展統計分析。在數據分析過程中,如果違背了原有計劃,應說明原因并報告調整的內容,保障研究的清晰透明和可重復性。
實施主動監測收集的真實世界數據及產出的真實世界證據,可用于發現未知風險信號,評價新發現的風險信號,描述藥品的安全特征、評估藥品風險等,以及用于支持修改藥品說明書、識別高風險人群、指導臨床合理用藥等多種決策。具體可見本指導原則第三章“真實世界數據支持主動監測的適用范圍”。
五、其他考慮
(一)對數據的一般要求
實施主動監測時,應首先明確需獲取的真實世界數據要素并評估其適用性。
1. 數據要素
研究所需數據要素的確定,應基于具體的安全性問題,遵循必要和最小化原則。一般而言,可考慮以下方面:可疑藥品和其他藥品使用信息(劑量、給藥途徑、療程等),用藥人群和對照人群的人口學信息、不良事件信息、其他治療、合并疾病、檢驗檢查及生命體征等信息。涉及中藥的信號發現或評價,需考慮是否要納入中藥相關信息如:患者病證信息、中藥處方構成、劑型、用法用量、中醫臨床結局指標等。
在保證研究結果有效性和可靠性的情況下,根據研究問題和數據可及性,選擇性地收集必要信息,可避免資源的浪費,加快真實世界證據的產生。
2. 數據適用性評估
應考慮不同研究目的對數據的顆粒度、維度及質量等的要求,合理設定數據適用性評估的標準。信號評價、風險評估對數據的顆粒度、維度及質量等的要求通常高于信號檢測。數據適用性評估一般可考慮以下因素:
(1)人群代表性
數據庫應盡可能覆蓋實際臨床中的藥品使用人群。不同地區、醫院級別、診療模式、醫保政策、數據來源等因素均可能影響數據庫涵蓋患者人群的特征,從而影響主動監測結果的代表性。一般而言,醫療機構尤其是單一醫療機構的電子病歷系統數據僅覆蓋相應醫療機構就診患者,其代表性通常不及整合多個地區不同級別醫療機構的多中心數據庫或區域健康醫療數據。
(2)數據完整性
數據完整性是指評估數據庫是否涵蓋主動監測所需的關鍵信息及其缺失比例,如患者人口學信息、藥物暴露、不良事件、隨訪、重要混雜變量等。通常來說,醫療機構的電子病歷系統較詳盡地記錄了患者院內用藥的安全性相關信息,但缺乏院外用藥信息,且難以獲得患者隨訪數據,在評估遲發型不良事件時存在一定局限性。醫保數據庫較完整地記錄了參?;颊叩木歪t行為,同時也涵蓋患者院外自購報銷藥品信息,但通常缺乏用藥時間、用藥劑量以及患者癥狀、體征、檢驗檢查結果等詳細臨床信息。
(3)數據的準確性
真實世界數據特別是常規診療過程形成的數據,由于數據的產生并非基于研究目的,數據的準確性受醫生、患者、數據庫管理者等多方影響,包括原始數據是否準確、編碼映射關系是否對應且唯一、數據值域是否合理等。研究者應評估藥品暴露、不良事件等關鍵變量的準確性,例如計算藥品或疾病編碼的靈敏度、特異度等驗證指標。對中藥開展主動監測,應特別注意中醫方藥、病證及臨床診療術語定義和識別標準的準確性。
(4)是否能獲得可比對照人群
當評價不良反應與用藥因果關系時,能否從數據庫中獲得可比的對照人群也是重要因素。通常考慮使用與待評價藥品有相同適應癥的同類藥品、疾病病程相近的患者作為對照。例如,利用僅涵蓋待研究藥品用藥人群的醫院集中監測數據或專藥登記數據庫,可描述不良反應特征、計算藥品不良反應發生率,但因缺乏非用藥人群或對照藥品使用人群信息,無法計算相對風險,難以探索用藥與不良事件的因果關系。
(5)不良事件數和數據庫覆蓋時長
當結局為罕見事件時,應評估是否能從數據庫中獲得足夠數量的結局事件,以達到研究結果的預期精度;當評價長期用藥或潛伏期較長的藥品不良反應時,還應考慮數據庫覆蓋時長是否足以觀察到不良事件的發生,以確保藥品與潛在不良反應的關聯合理性。
此外,通過鏈接多源真實世界數據或開展必要前瞻性隨訪進一步收集數據,可改善數據的適用性。多來源的數據進行相互補充和驗證,可提高研究結果的證據強度。
(二)用于信號檢測的考慮
信號檢測的核心是從大量用藥信息中識別出潛在可疑不良反應風險信號。常見信號檢測方法主要有比例失衡法、處方序列對稱分析方法(Prescription Sequence Symmetry Analysis,PSSA),序貫統計檢驗方法(Sequential Probability Ratio Test,SPRT),有監督的機器學習方法和樹狀掃描統計量(Tree-Based Scan Statistic,TreeScan)等。
比例失衡法可分為頻數法、貝葉斯法,常用的頻數法包括:比例報告比法(Proportional Reporting Ratio,PRR)、報告比值比法(Reporting Odds Ratio,ROR)、綜合標準法等;常用的貝葉斯方法包括:世界衛生組織烏普薩拉監測中心(WHO-UMC)應用的信息成分法(Information Component,IC),以及美國FDA采用的多項伽馬泊松分布縮減法(Muti-Item Gamma Poisson Shrinker,MGPS)等。
在信號檢測過程中,藥品-事件的關聯性可能受到混雜因素干擾,可考慮采用回歸模型、傾向性評分(Propensity Score,PS)匹配、疾病風險評分(Disease Risk Score,DRS)等方法進行混雜控制。針對罕見不良反應信號,通??紤]獲取更大樣本量的主動監測數據,以及用人工智能技術和更敏感的分析方法。
(三)用于信號評價/風險評估的考慮
信號評價的目的是確認用藥與不良事件發生的因果關系。風險評估的主要目的是識別、定性或定量描述藥品安全風險,分析藥品安全性特征,以及評估風險控制措施實施效果。
1. 流行病學設計
基于主動監測數據開展信號評價/風險評估,可采用觀察性流行病學研究設計,包括隊列研究、病例對照研究及其衍生設計類型等。
設計類型的選擇取決于具體的研究問題。研究設計階段應合理選擇并定義研究人群、暴露、對照、不良事件與混雜等研究關鍵變量,從設計階段盡量控制潛在的偏倚與混雜,包括但不限于:①優選新發病例或新用藥者設計,可有效控制選擇性偏倚、非死亡時間偏倚;②選擇可比對照,盡量選擇與待評價藥品相同適應癥、病情程度相近的陽性對照,以減少適應癥偏倚;③定義研究設計相關時間點,如研究對象基線評估時間窗,藥物相關的暴露期、誘導期、洗脫期,隨訪起止時間等。建議研究者繪制研究時間軸,全面、直觀地展示研究設計細節;④考慮并明確定義隨訪期可能出現的用藥狀態變化,包括換藥、停藥、加載等;誘導期、洗脫期,隨訪起止時間等。建議研究者繪制研究時間軸,全面、直觀地展示研究設計細節。
2. 統計分析
研究者應基于研究目的、數據適用性評估結果、研究設計類型等,提前制定統計分析計劃(Statistical Analysis Plan,SAP),不應根據納入數據的情況改變統計分析計劃。統計分析計劃應包括但不限于:樣本量計算、分析數據集定義、干預/暴露與對照定義、已知和未知偏倚混雜的識別與控制、結局變量定義、缺失數據處理方法、主分析模型、假設檢驗水平、檢驗效能、亞組分析、敏感性分析、定量偏倚分析等內容。
統計分析過程,應重點考慮如何有效地控制和評價偏倚對結果的影響,從而準確評估藥品風險信號。常用的統計模型包括但不限于Logistic回歸、Poisson回歸、傾向性評分方法、疾病風險評分、工具變量等。不同的統計分析模型適用條件不同,優勢和局限性存在差異。應基于擬回答的研究問題和數據特征,選擇合適模型處理潛在偏倚?;谡鎸嵤澜鐢祿闹鲃颖O測,由于患者病情變化和依從性等問題,常存在多藥聯用和用藥變化(例如換藥、停藥、加載等)等復雜用藥模式,特別在中西醫結合治療場景中,中西藥聯合使用,且用藥方案動態調整。此時統計模型選擇應考慮如何處理多藥聯用和用藥變化引入的高維時間依賴性混雜。另外,還應注意諸如選擇性偏倚、缺失數據、殘余混雜等其他觀察性研究的常見偏倚。一般而言,除主分析外,應考慮采用定量偏倚分析、敏感性分析等方式評估潛在偏倚對結果的影響,探討結果的穩健性。對于罕見不良反應的評價,還需特別關注結局事件數量對模型結果估計的預期精度的影響。
3. 其他需考慮的因素
信號檢測得到的信號,僅說明用藥與不良事件之間的因果關系具有潛在的可能性,尚不能明確風險真實存在。
基于主動監測數據開展信號評價,需結合信號的合理性、報告的可信度、不良事件的嚴重程度與臨床預后等因素,以及其他相關數據及資料。
基于主動監測數據開展風險評估,需綜合考慮證據質量,并充分結合現有其他相關證據,評估風險的嚴重性、發生頻率、可預測性、可預防性和可逆性;其他同類藥品的可獲得性、可替代性、支持關聯性的其他證據(生物學合理性、關聯一致性、劑量反應關系等)等。
附:詞匯表
附
詞匯表
1. 真實世界數據(Real-World Data, RWD):來自真實醫療環境,反映實際診療過程中患者健康狀況和醫療服務過程的數據。
2. 真實世界證據(Real-World Evidence, RWE):利用真實世界數據開展真實世界研究得到的用于臨床和醫療決策的結果。
3. 常規診療形成的健康醫療數據:基于臨床或管理目的收集的健康醫療數據,包括醫院電子病歷數據、醫療保險數據等。
4. 統計分析計劃(Statistical Analysis Plan,SAP):對臨床研究的統計學考慮及擬對數據進行統計分析的清晰描述。
5. 混雜(Confounding):指某一因素與結局事件和暴露均有關,但不是暴露與結局因果鏈上的中間變量。若混雜在組間分布不均衡,可能會歪曲(縮小或擴大)暴露與結局間的真實聯系。
6. 傾向性評分(Propensity Score):是指一種針對多個協變量進行調整來處理觀察性研究中組間協變量不均衡的降維分析策略。
7. 工具變量(Instrumental Variable):與內生解釋性變量高度相關,但與隨機誤差項無關,對結局變量的影響只能通過影響處理因素實現的變量,可控制已知和未知的混雜因素。