价值|价值千亿的医疗大数据+AI市场,谁是低调的王者?

千禧年以来,医院的信息化建设如火如荼。历经20载以业务流程电子化为核心的HIS系统为起点,陆续驶过以规范临床行为为核心的CIS系统、以医疗服务延伸为核心的移动互联网等“业务流程数字化”时代,正在向以大数据为核心依托的智能应用“医疗大数据+AI”的新时代迈进。
时代的交替意味着需求的焕新。在“业务流程数字化”的时代,医疗数字化行业的主流业务被数家老牌数字化厂商所占据,在进入“医疗大数据+AI”后,医院临床、科研、管理的需求被进一步细化,医院管理效能与学科能力提升成为医院高质量发展的重中之重,而这些不是传统的医疗数字化产品可以满足的。
随着原本分散的医疗数字化市场经由技术再次被重构,一批医疗IT创业公司借机涌现出来。他们尝试从医院数据的标准化、数据后结构化出发,解决院内变革时期遗留的数据孤岛问题,同时有效利用数据化及人工智能技术,将医疗大数据的内涵价值一层一层剥离出来。
于是,“医疗大数据”成为近几年初创企业和转型企业最热门的标签,不论是在一级市场、二级市场还是医疗行业各类会议中,开始出现医疗大数据服务商、供应商,也开始出现医疗数据治理、智能医疗等概念。可是医疗大数据的建设与服务都是非常“难而重”的事情,是需要数年积累才可构建相对高的壁垒,那么在这其中,谁是低调的王者?
从“死磕”医疗数据整合和提升数据质量做起成立于2013年的柯林布瑞“ClinBrain”,从成立第一天起就选择了一条“异常艰难”,后来被证明为“绝对正确”的道路。公司联合创始人秦晓宏早在2002年就在国内知名企业从事HIS、EMR的软件开发和产品设计工作,并负责交付了多家大型三甲医院的业务系统,对医院的“数据孤岛”现象有着深刻的认识和理解。从公司创立开始,要“死磕”的第一个问题便是如何不需要HIS、EMR等第三方业务厂商做接口,就可以把一家医院数十个厂家数百套系统的数据整合到统一的数据平台上来。
“起初的那3、5年,对于不同厂商的业务系统数据库的数据模型的识别,因为各家业务系统的字段命名差异巨大,有用中文简评、有用英文、甚至有中英文结合命名的,厂商不配合,也拿不到数据字典,只能完全靠人硬磕,一个字段一个字段、一个流程一个流程的磕。这么多年来,就这么一点点积累形成经验知识,到现在我们可以自动识别超过500家以上业务厂商的不同版本的数据模型。”秦晓宏说起过去的艰辛历程,历历在目,犹如就发生在昨天。
然而,数据整合汇聚仅仅是医疗大数据建设的第一步,接下来更艰难的事情摆在面前,那就数据质量的问题。
首先,由于此前国内医疗数字化的标准甚少,各家业务厂商在构建业务系统过程中,完全按企业自行定义的标准来开发软件系统,甚至如“性别”这类数据都没有引用国标来定义。其次,院内各业务系统只保证自己的系统流程能跑通即可,并不关心数据质量的情况,导致出现各种数据质量问题,诸如主从表对应不上、数据逻辑关系不对、数据不一致等问题;最后,医生在写病历文书及各类检查报告时也没有遵从标准,大量的医生按习惯书写的非结构化的医疗文书,导致科研、质控没法高质量开展。
在这个大数据治理过程中,柯林布瑞构建了庞大的医疗行业标准库和医学术语库,对不标准的数据进行标准化映射处理、对非结构化进行后结构化处理、对脏数据进行清洗处理等,经过8年多积累,公司锤炼了构建高质量医院数据平台的能力,在行业内树立了良好的口碑。
“柯林布瑞构建的大数据平台,数据维度最全,仅临床领域数据维度就超过10000项;比较下来,数据质量也确实很好,不管是支撑医院运营管理、绩效评价、临床科研都可以提供全面的、准确的、高质量的数据支撑!”华西医院信息科的架构师郑涛老师如此说到。