原创IT经理世界12-11 06:07

摘要: 中国的医疗行业里,医院的数据一直是处于孤岛状态,互联网时代来临后,数据的价值显现,技术开始了对传统行业的改造和赋能,这个浪潮,正冲向传统的医疗行业。


心如佛、眼如鹰、胆如虎、技如仙。

 

一个医生做到“四如”,是张国桢教授对自己团队的要求。看诊经验丰富的他有“东方神眼”之称,但有一场比赛,参赛选手的“眼如鹰”却让他都深感到佩服。大屏幕上,患者肺部的CT片出现了几个圆圈,标注结节的位置,这原本都需要资深医生来诊断,却被机器迅速地找到了。打入决赛的队伍选手在讲台进行演讲,谈的却不是医学,而是不同的算法,是最近大热的AI。

 

2017阿里巴巴云栖大会上,以肺部结节的智能诊断为主题的天池医疗AI大赛,别开生面的将前沿的技术和传统的医学联系到一起。大赛有三个主办方,其中两个是我们耳熟能详的,一个是大赛云计算平台的提供者阿里云,另一个则是算力的提供者英特尔。而最后一个主办方,则是一家创业公司,从事医疗大数据的零氪科技(LinkDoc) 。



零氪CEO张天泽出身医生世家,但他最早却是从事IT行业,曾先后供职腾讯、阿里巴巴(雅虎-中国)公司 ,2009年开始创业。最初他做的是医疗行业的传媒业务,后来才开展数据业务,用他自己的话说“数据业务是被传媒业务养着”。

 

在采访中,他将这几年称作“补课的时间”,在这个过程中学习医院、医生、政府还有医药企业的思考方式。在2014年底,他开始创立了医疗大数据公司零氪。在《IT经理世界》之前的文章中曾经介绍过这家公司,将医疗数据的结构化,并搭建相应的存储、分析平台。(点击查看:给繁忙的临床医生一个“云上科研团队”)


的确,中国的医疗行业里,医院的数据一直是处于孤岛状态,互联网时代来临后,数据的价值显现,技术开始了对传统行业的改造和赋能,这个浪潮,正冲向传统的医疗行业。

 

在天池医疗AI大赛中,零氪提供了两千份影像数据集,这个数据规模在以往是难以做到的。零氪首席架构师王晓哲告诉记者,这两千份数据全部经过安全脱敏处理和专家标注,并且是三份标注进行互相核查选出来的合并以后的结果,是世界级最大规模的肺部薄层CT的数据集。

 

AI在行业落地时,数据的作用是毋庸置疑的,同样的算法,不同量级的数据量将导向不同的结果。在翻译领域,即使用同样的算法,谷歌AI的结果也明显更好,就是因为有更大的数据量。而在医疗行业,数据由于涉及隐私难以获得。为准备这次比赛的医疗数据,零氪原本邀请了24家知名的医院参与合作,其中20家接受了邀请,但最终真正参与的只有16家。

 

另一方面,则是全球参赛者的热情参与。据阿里云统计,这次大赛共吸引了20多个国家,2887支队伍共3953名选手参与。零氪CTO罗立刚告诉记者,这次大赛的主题选用肺部结节的智能诊断,很大的一个原因就是人工智能深度神经网络的技术,近三年在图像识别的领域进步很快,而肺部结节的识别正好就是要用图像算法来解决的问题,算法的应用更直接。

 

技术已经在敲门,数据却没准备好,这该怎么办

 

零氪给的回答在两年前,张天泽期望自己的创业能做到这几件事:帮助患者看对病,用好药,付得起钱。而想做到这几点,要用新的资源去满足传统需求,越是基础、产业链上游的资源希望就越大。目前,零氪已经结构化的肿瘤患者病历数据足有200万份,覆盖了900多科室,500多医院,且几乎都为排名靠前的三甲医院(全国三甲医院总数约2200);胸外科是零氪最早切入的领域,已经切入到了整个细分领域,有了许多新的发现。据了解,过去两年,在数据上,零氪投入了差不多十个亿。

 

在9月份,零氪组织了全国10家医院的专家,把接近4万例肺癌患者的数据合并到一起,现场跑数据跑出了十几个课题。过去许多有意义的科研想法,在大的数据集和可视化、智能化的Hubble人工智能科研决策平台上,真正得到了研究实践。其中有一个关于淋巴结跳跃转移的科研想法,据现场专家称,一旦研究成果出现,论文可能会影响国际肺癌病理分期。

 

先行者,这是零氪在做的事情。但目前距离谈成就还为时尚早,200万肿瘤患者的数据,虽然已经被整理好,但所有权依旧在各自的医院,而使用权,像十个医院坐到一起开研讨会,用合并的数据,就涉及相互间签署协议的问题。不过时间是站在零氪这边的,医疗数据的统一化,对整个医疗体系而言是利大于弊,行业基础设施的进步,将促进行业整体效率的提升,国家也在这个方向进行引导,这将是未来的趋势。

 


王晓哲告诉记者,AI想要在医疗领域落地和发挥作用,大规模统一标准的数据集是必不可少的,数据是一切的基础。零氪参加这场大赛的另一个目的,也是为了鼓励业界将数据标准化和公开化,让跨产业、医疗圈外的人进入到这个圈子里。而统一标准的制定,还需要未长期的磨合。比如影像设备,目前由于厂家、产品型号等存在差异,影像数据就是天然不统一的。而在存在统一的数据后,AI的进一步落地的道路依旧任重而道远。

 

以肿瘤病的影像AI为例,张天泽将其分为三个阶段:


第一阶段,AI可以检出病灶(5-10毫米),这一阶段需要大量统一标准和质控的医生标注的影像病例;


第二阶段,AI可以鉴别病灶良恶性及病灶分型分期,这一阶段需要大量的含有准确病理结果并标注精准的影像病例支撑;


第三阶段,AI提供肿瘤病人治疗方案优化推荐及预后评估,这一阶段不仅需要大量的含有病理结果及精准标注的影像资料,同时还需要病人的治疗、手术、用药、随访等连贯的病例数据作为支撑,且不断进行更新。

 

目前零氪有近1000名员工,其中约100人是研发人员,剩下的员工多为临床或医药的背景。在数据集成和结构化上,零氪已经维持了相对稳定的状态,并可以提供自身研发的SaaS和PaaS服务,而基础的IaaS层,采用了混合模式,一部分在阿里云,一部 分在天津的自建数据中心。“这一方面是为了降低存储成本,另一方面,医疗数据比较敏感,需要放在本地。”王晓哲说。在AI上,零氪的医疗AI产品也已经在部分科室开始尝试应用。

 

当谈到成本如此巨大,什么时候可以收益的时候,张天泽表示,目前还不适合谈收益,基础设施的投入将是一个长期的过程。医疗行业的产业链相对封闭,AI变现的渠道实际有限,张天泽介绍,目前业界将盈利的落脚点基本集中在医药企业和保险公司身上,这是产业链中需要数据服务,又真正愿意支付的参与者。张天泽将医疗大数据和公司盈利的关系比作修高速公路,“修路本身不赚钱,但修好了路,就可以去赚钱了”。



作者 | 李昊原

微信编辑 | 张盼盼

审稿编辑 | 茉莉