技術(shù)
導(dǎo)讀:一家醫(yī)院,數(shù)十種軟件系統(tǒng),“數(shù)據(jù)孤島”問題怎么破?異構(gòu)數(shù)據(jù)采集技術(shù)的出現(xiàn),幫助醫(yī)療大數(shù)據(jù)搭上了“快速列車”,同時(shí)也碰了廠商的“蛋糕”。技術(shù)壁壘高,為何商業(yè)上不給力?是哪里出了問題?
中國(guó)擁有非常龐大的醫(yī)療數(shù)據(jù),它們來自十多億中國(guó)人,跨越數(shù)十年的沉淀。正因如此,以數(shù)據(jù)驅(qū)動(dòng)的人工智能技術(shù),被廣泛應(yīng)用于醫(yī)療服務(wù)、醫(yī)藥研發(fā)、醫(yī)學(xué)研究等各個(gè)環(huán)節(jié),國(guó)內(nèi)創(chuàng)業(yè)熱情高漲,IBM、飛利浦、微軟、強(qiáng)生等醫(yī)療領(lǐng)域的科技巨擘也紛紛在中國(guó)建立研發(fā)中心。
然而,中國(guó)醫(yī)療數(shù)據(jù)存在兩大問題:
第一,非結(jié)構(gòu)化的醫(yī)療文本數(shù)據(jù),無法直接用于機(jī)器處理和分析。今天中國(guó)的部分地區(qū),病歷的電子化程度甚至還沒有達(dá)到100%。
第二,HIS、LIS、PACS、RIS…國(guó)內(nèi)一家醫(yī)院的軟件系統(tǒng),少則幾個(gè),多則幾十個(gè)。這些系統(tǒng)出產(chǎn)的廠商,全國(guó)有不下3000家,各自為營(yíng),導(dǎo)致系統(tǒng)間數(shù)據(jù)無法互聯(lián)共享,造成嚴(yán)重的醫(yī)療“數(shù)據(jù)孤島”現(xiàn)象。
這兩大問題中,第一個(gè)問題的技術(shù)解決難度相對(duì)要小。目前出現(xiàn)的解決辦法有二:一種是運(yùn)用自然語言處理技術(shù),可以將非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù),國(guó)內(nèi)不少企業(yè)在這一領(lǐng)域耕耘,包括森億智能、零氪科技、思派、依圖醫(yī)療、大數(shù)醫(yī)達(dá)等等。另一種解決辦法,是以IBM Watson為代表的認(rèn)知計(jì)算技術(shù)路線,能夠直接對(duì)非結(jié)構(gòu)化的醫(yī)學(xué)文本進(jìn)行理解和推理。

第二個(gè)問題,即“數(shù)據(jù)孤島”問題的解決則難度較大。如果要將各系統(tǒng)臨床數(shù)據(jù)進(jìn)行整合,傳統(tǒng)的辦法只有在征得醫(yī)院的同意下,挨個(gè)聯(lián)絡(luò)供應(yīng)商請(qǐng)求提供數(shù)據(jù)接口,需要極大的人力、資金與時(shí)間投入。
而近兩年來,這一問題正在逐步被解決,其解決辦法的核心就是:異構(gòu)數(shù)據(jù)采集。
從這家新三板企業(yè)講起
從公開資料看,博為軟件可能是第一個(gè)吃螃蟹的企業(yè)。這家2016年在新三板掛牌的長(zhǎng)沙企業(yè),最先研發(fā)出“101異構(gòu)數(shù)據(jù)采集技術(shù)”,能夠在各軟件廠家不提供接口的情況下,實(shí)時(shí)精準(zhǔn)地抓取各軟件的數(shù)據(jù),存儲(chǔ)指定數(shù)據(jù)庫中。如此,醫(yī)生可以從數(shù)據(jù)庫中獲取各個(gè)系統(tǒng)的數(shù)據(jù),達(dá)到與數(shù)據(jù)接口一樣效果。此外,該技術(shù)還能夠?qū)崿F(xiàn)歷史數(shù)據(jù)的遷移,即自動(dòng)采集舊系統(tǒng)中的完整數(shù)據(jù),按照配置邏輯自動(dòng)寫入新系統(tǒng),保證系統(tǒng)數(shù)據(jù)完整性。每個(gè)小時(shí)可以處理上萬條數(shù)據(jù),并且可多臺(tái)機(jī)器同時(shí)運(yùn)行,處理速度快,節(jié)約人工成本。
除博為軟件外,國(guó)內(nèi)具備這一技術(shù)能力的企業(yè)僅有寥寥數(shù)家,其中包括依圖醫(yī)療、上海翼依、北京數(shù)見科技、普元技術(shù)等。
技術(shù)壁壘的巨人,商業(yè)變現(xiàn)的矮子?
異構(gòu)數(shù)據(jù)采集的技術(shù)研發(fā)壁壘較高,但商業(yè)上的表現(xiàn)卻并不理想。以博為軟件為例,2015年至今雖營(yíng)業(yè)收入增長(zhǎng)了4倍,但年?duì)I收數(shù)據(jù)還未破千萬元大關(guān)——2017年全年數(shù)據(jù)有望完成這一突破。從凈利潤(rùn)來看,自博為軟件2016年掛牌新三板以來,始終未達(dá)到盈虧平衡,2017年上半年凈利潤(rùn)為-6.43萬,創(chuàng)造歷史新低。
去年,博為軟件董事長(zhǎng)梁威曾經(jīng)對(duì)外披露,截止2017年10月,博為軟件已累積了200家醫(yī)院的臨床數(shù)據(jù),100多萬的病人數(shù)據(jù)。從產(chǎn)品落地醫(yī)院的數(shù)量來看,可知生意難做,恐怕多數(shù)是與醫(yī)院開展試用合作,抑或是議價(jià)能力差,客單價(jià)低得讓人心累。

醫(yī)院是封閉的環(huán)境,醫(yī)療是封閉的圈子。具備異構(gòu)數(shù)據(jù)采集的企業(yè),多數(shù)是軟件服務(wù)類企業(yè),并非專注于醫(yī)療垂直領(lǐng)域,這就意味著產(chǎn)品向醫(yī)院推廣過程中,會(huì)遇到新舊供應(yīng)商和渠道的碰撞和摩擦。那么,深耕醫(yī)療大數(shù)據(jù)的企業(yè),或許會(huì)多一分優(yōu)勢(shì)?事實(shí)上,對(duì)于軟件服務(wù)類企業(yè),其服務(wù)的客戶類型具有多元化特征,以博為軟件為例,其客戶涵蓋了政府、醫(yī)院、互聯(lián)網(wǎng)企業(yè)、保險(xiǎn)企業(yè)等等。相比之下,醫(yī)療反而是門檻最高的領(lǐng)域。
其次,就異構(gòu)數(shù)據(jù)采集技術(shù)本身而言,勢(shì)必遭到軟件廠商的掣肘。過去若想將數(shù)據(jù)從軟件中導(dǎo)出,需要向廠商交付一定的費(fèi)用才可以提供接口。而這項(xiàng)新技術(shù)的出現(xiàn),無疑是動(dòng)了廠商們的“蛋糕”,阻力在所難免。