從京郊中西醫結合醫院返回後,顧然和蘇靜馬不停蹄地趕往第二站——京南一家以慢病管理聞名的三甲醫院,這裡擁有國内領先的慢性病随訪數據庫,尤其是心血管領域的長期追蹤數據,被行業内稱為“真實世界數據寶庫”。
醫院的副院長韓雪峰親自接待了他們。
“我們之前也聽過你們HIT-D的名字,體質量化這條路,敢走的人不多,你們算是有膽量的。”韓院長笑着說。
“不敢當,我們隻是想看看,從不同角度走過去,會不會有新的發現。”顧然态度始終謙遜。
韓院長領着他們參觀了醫院專設的慢病管理中心,幾萬名慢病患者的電子健康檔案,完整記錄着從首診、住院、長期随訪到動态健康幹預的全過程。
“我們願意開放部分匿名數據給你們做研究,”韓院長走到檔案庫前,語氣鄭重,“但你們也要保證,我們醫院的患者利益和數據安全是第一優先。”
“這是底線,我們完全理解。”顧然與蘇靜幾乎異口同聲。
合作協議簽訂後,顧然團隊很快收到第一批脫敏數據包。
然而,真正投入數據整理時,蘇靜發現了一個嚴重問題——中西醫的描述體系仍然存在巨大鴻溝。
西醫記錄的是具體指标:血壓、血糖、血脂、肝腎功能等,标準化程度高;
中醫記錄的是體質描述:虛、實、寒、熱、氣滞、血瘀,描述偏主觀,醫生風格差異大;
HIT-D體質量化系統需要的,是結構化的生理信号數據,如HRV曲線、睡眠周期、舌象圖像等。
“這些數據的‘語言’根本不一樣,AI再強,也沒法直接識别。”李思源皺眉。
“那就搭橋,”顧然目光沉穩,“我們來建一套‘中西醫數據映射模型’,讓AI先學會翻譯。”
為了攻克這個“數據語言轉換”難題,顧然請來了中醫數據标準化研究專家——梁遠清。
梁遠清站在實驗室大屏幕前,看着兩套完全不同的數據格式,微微點頭:“這其實是我們早就遇到的難題,但你們現在有AI和多源數據,或許真的能補上這一課。”
他提議,以秦老的脈象記錄為标準模闆,逐步把和衡堂的病例語言逐步結構化,并與合作醫院的中醫記錄做比對,從中歸納出可供機器識别的标準描述詞庫。
“我們不直接讓AI解讀中醫描述,”梁遠清強調,“而是讓AI在标準詞庫基礎上,結合生理數據找規律,這樣既保留中醫經驗,也符合現代醫學的數據邏輯。”
新的數據映射流程上線後,HIT-D系統也進行了全方位升級:
生理信号與體質描述的映射模型逐步完善;
患者自述症狀、生活事件、情緒變化等非結構化信息被逐步量化;