導讀:一家醫(yī)院,數(shù)十種軟件系統(tǒng),“數(shù)據(jù)孤島”問題怎么破?異構數(shù)據(jù)采集技術的出現(xiàn),幫助醫(yī)療大數(shù)據(jù)搭上了“快速列車”,同時也碰了廠商的“蛋糕”。技術壁壘高,為何商業(yè)上不給力?是哪里出了問題?
中國擁有非常龐大的醫(yī)療數(shù)據(jù),它們來自十多億中國人,跨越數(shù)十年的沉淀。正因如此,以數(shù)據(jù)驅(qū)動的人工智能技術,被廣泛應用于醫(yī)療服務、醫(yī)藥研發(fā)、醫(yī)學研究等各個環(huán)節(jié),國內(nèi)創(chuàng)業(yè)熱情高漲,IBM、飛利浦、微軟、強生等醫(yī)療領域的科技巨擘也紛紛在中國建立研發(fā)中心。
然而,中國醫(yī)療數(shù)據(jù)存在兩大問題:
第一,非結構化的醫(yī)療文本數(shù)據(jù),無法直接用于機器處理和分析。今天中國的部分地區(qū),病歷的電子化程度甚至還沒有達到100%。
第二,HIS、LIS、PACS、RIS…國內(nèi)一家醫(yī)院的軟件系統(tǒng),少則幾個,多則幾十個。這些系統(tǒng)出產(chǎn)的廠商,全國有不下3000家,各自為營,導致系統(tǒng)間數(shù)據(jù)無法互聯(lián)共享,造成嚴重的醫(yī)療“數(shù)據(jù)孤島”現(xiàn)象。
這兩大問題中,第一個問題的技術解決難度相對要小。目前出現(xiàn)的解決辦法有二:一種是運用自然語言處理技術,可以將非結構化數(shù)據(jù)轉(zhuǎn)化為結構化數(shù)據(jù),國內(nèi)不少企業(yè)在這一領域耕耘,包括森億智能、零氪科技、思派、依圖醫(yī)療、大數(shù)醫(yī)達等等。另一種解決辦法,是以IBM Watson為代表的認知計算技術路線,能夠直接對非結構化的醫(yī)學文本進行理解和推理。
第二個問題,即“數(shù)據(jù)孤島”問題的解決則難度較大。如果要將各系統(tǒng)臨床數(shù)據(jù)進行整合,傳統(tǒng)的辦法只有在征得醫(yī)院的同意下,挨個聯(lián)絡供應商請求提供數(shù)據(jù)接口,需要極大的人力、資金與時間投入。
而近兩年來,這一問題正在逐步被解決,其解決辦法的核心就是:異構數(shù)據(jù)采集。
從這家新三板企業(yè)講起
從公開資料看,博為軟件可能是第一個吃螃蟹的企業(yè)。這家2016年在新三板掛牌的長沙企業(yè),最先研發(fā)出“101異構數(shù)據(jù)采集技術”,能夠在各軟件廠家不提供接口的情況下,實時精準地抓取各軟件的數(shù)據(jù),存儲指定數(shù)據(jù)庫中。如此,醫(yī)生可以從數(shù)據(jù)庫中獲取各個系統(tǒng)的數(shù)據(jù),達到與數(shù)據(jù)接口一樣效果。此外,該技術還能夠?qū)崿F(xiàn)歷史數(shù)據(jù)的遷移,即自動采集舊系統(tǒng)中的完整數(shù)據(jù),按照配置邏輯自動寫入新系統(tǒng),保證系統(tǒng)數(shù)據(jù)完整性。每個小時可以處理上萬條數(shù)據(jù),并且可多臺機器同時運行,處理速度快,節(jié)約人工成本。
除博為軟件外,國內(nèi)具備這一技術能力的企業(yè)僅有寥寥數(shù)家,其中包括依圖醫(yī)療、上海翼依、北京數(shù)見科技、普元技術等。
技術壁壘的巨人,商業(yè)變現(xiàn)的矮子?
異構數(shù)據(jù)采集的技術研發(fā)壁壘較高,但商業(yè)上的表現(xiàn)卻并不理想。以博為軟件為例,2015年至今雖營業(yè)收入增長了4倍,但年營收數(shù)據(jù)還未破千萬元大關——2017年全年數(shù)據(jù)有望完成這一突破。從凈利潤來看,自博為軟件2016年掛牌新三板以來,始終未達到盈虧平衡,2017年上半年凈利潤為-6.43萬,創(chuàng)造歷史新低。
去年,博為軟件董事長梁威曾經(jīng)對外披露,截止2017年10月,博為軟件已累積了200家醫(yī)院的臨床數(shù)據(jù),100多萬的病人數(shù)據(jù)。從產(chǎn)品落地醫(yī)院的數(shù)量來看,可知生意難做,恐怕多數(shù)是與醫(yī)院開展試用合作,抑或是議價能力差,客單價低得讓人心累。
醫(yī)院是封閉的環(huán)境,醫(yī)療是封閉的圈子。具備異構數(shù)據(jù)采集的企業(yè),多數(shù)是軟件服務類企業(yè),并非專注于醫(yī)療垂直領域,這就意味著產(chǎn)品向醫(yī)院推廣過程中,會遇到新舊供應商和渠道的碰撞和摩擦。那么,深耕醫(yī)療大數(shù)據(jù)的企業(yè),或許會多一分優(yōu)勢?事實上,對于軟件服務類企業(yè),其服務的客戶類型具有多元化特征,以博為軟件為例,其客戶涵蓋了政府、醫(yī)院、互聯(lián)網(wǎng)企業(yè)、保險企業(yè)等等。相比之下,醫(yī)療反而是門檻最高的領域。
其次,就異構數(shù)據(jù)采集技術本身而言,勢必遭到軟件廠商的掣肘。過去若想將數(shù)據(jù)從軟件中導出,需要向廠商交付一定的費用才可以提供接口。而這項新技術的出現(xiàn),無疑是動了廠商們的“蛋糕”,阻力在所難免。