当下,移动医疗从 2015 年下旬开始经历的那一场突然而又漫长的寒冬,已基本无人谈起。
“那是 2015 年吧,移动医疗就已经死了一批了,有些融完 A 轮就不行了。后来慢慢的,相比移动医疗,大家就开始更多地用“数字医疗”这个词了。”这是一位从 2014 年就开始深入调查分析医疗创业项目的分析师给到我们的碎片式回忆。
实际上,早在 2016 年 10 月,动脉网根据深入调查而出具的一份名为《互联网医疗生存报告:38 家企业为什么死去?》的医疗创业项目倒闭白名单,曾轰动一时。
其中,技术含量不高导致的创业同质化,对医疗工作流程特殊性的错误理解,监管层面的约束,对市场的忽视,以及过高的估值与资本介入,都是那时候医疗创业者用血与泪换来的教训。
2016 年中旬左右,几乎像是一场足球比赛上下场的转换,AI+医疗强势崛起。这个难得让 BAT 与资本们共同找到兴奋点的医疗新赛道,在过去不到 2 年的时间里,孕育出超过 100 家以医疗为重点的 AI 创业公司。
如果再快进到 2017 年,你会发现在过去的 9 个月中,国内外以医疗为重点的 AI 创业公司获得融资的频率几乎可以媲美曾红极一时的“共享充电宝”。其中,“医疗影像自动化诊断”算是一个近期各家“齐头并入”的热门应用场景。
当然,与曾经同质化严重的移动医疗相比,极高的 AI 门槛加上极高的医疗门槛,让进入 AI 医疗界的一众创始人们一开始就似乎有了“睥睨天下”的资本。
业内人士,算法专家,海归博士……与其他 AI 创业公司并无太多差异,技术与研发当仁不让成为公司宣传的核心;而资本方也难得进入“高僧打坐”模式,只是“期待”,闭口不谈商业模式与盈利要求。
那么,一个如此早期的领域,只有拼技术就够了?移动医疗曾经经历的那一场暴风雪,是否也有相似的教训值得当下借鉴?
VoxelCloud(体素科技),算是最近一头扎入这个领域的 AI 创业公司中比较露锋芒的一个。2016年才成立,就在2017年5月获得红杉领投的千万级融资;仅隔3个月,又在今天得到腾讯的超亿元人民币 A+轮投资。很显然,这个数额与融资频率应该会让当下一众同类型的创业公司十分眼红。
当然,尽管腾讯有自己医疗布局的考虑在内(刚刚推出一款医疗影像产品“觅影”),但对于选投 VoxelCloud 的理由,腾讯与红杉的“口径”较为一致:
“他们之前就有了明确的产品,以后还会有更多创新性应用”。
VoxelCloud 的创始人丁晓伟很爽快地接受了我们的专访,而且并不避讳一些敏感问题。不过,自始至终,对于 AI 医疗,他的态度是谦卑且谨慎的,甚至承认“现在的技术和硬件并不天然满足医疗应用级产品的研发,需要通过大量另辟蹊径实现”。
“我们有技术,有很强的人,但是我们也必须考虑商业模式,也需要正确面对那些市面上的 AI 医疗诊断系统曾经犯过的错误。”
只谈学术,不谈应用,这不靠谱
“借助先进的人工智能技术,系统在短时间内处理海量数据,并对病人做出愈加准确的诊断。”这是 IBM 旗下的 AI 诊疗系统 Watson 曾做出的承诺。
然而,在 IBM 将 Watson 推向全世界的 6 年里,这个 AI 医疗领域最负盛名的产品,却遭到了无数医生的质疑与媒体的嘲讽。
可靠的技术,高质量的数据,医生的配合。事实上,这些在研发人员中最为看重的几个因素,一旦“合体”落实到临床实验中,就会遇见各种各样的麻烦。这就像一个仅有完整的身体与四肢,却没有关节与润滑剂的机器人,只能是一个无法动弹的残次品。
譬如,在实际工作中,Watson 合作医院的医生们真的会主动用它来处理病患信息吗?医生输入数据过程中是否会遇到各种问题?给出的诊断结果是否会参考不同国别、人种的差异?
作为加州大学洛杉矶分校的计算机视觉博士,VoxelCloud 的创始人丁晓伟并没有否认研发与应用之间横亘着巨大的鸿沟。那些在实验室中熠熠闪光,让人十分兴奋的技术与样品,其实很容易“见光死”。
这也是他为何通常在产品研发过程中,选择与医生们一待就是 6 个月的原因:
“我虽然学的是计算机视觉这一学科,但是我家人都是医生,我基本从小就长在中国的医院里。哪个科室做什么,到底怎样运转,我都见过。我觉得,做医疗产品必须走到医院里,去观察医生的每一步到底是怎么做的。
譬如我们在研发无创肺癌筛查诊断系统的时候,就跟医生长时间一起工作,大概要相处半年吧,天天在一起讨论。这不是说我们一定要掌握哪一种病症,而是要去了解这个病的知识难点,看看医生处理的时候会有哪些问题。然后我们再独立去分析一个病种的时候,再去考虑怎么与深度学习技术融合。
另外在临床实验过程中,对某一项任务的安全编制,医生的需求是什么,这里面的容错空间有多大,做成什么样子是最能为他们解决问题的,这些都是非常细节的问题。
你不走进医院,你绝对不知道有哪些很棘手的问题。
但是,即便与医院进行长时间无缝隙合作,也不能保证机器给出的治疗方案给出的一定是精准的,或者是被医生认同的解决方案。这就像欧洲一些曾对 Watson 系统多有抱怨的医生透露,Watson 给出的建议带有针对美国患者与美国医院治疗方案的倾向。
对于这个疑问,丁晓伟首先提出了一个大部分人对人工智能医疗应用的理解误区:机器诊断报告一定需要与某个医生的主观印象高度匹配。
他认为,与医生主观印象做比对是一种错误的认知,机器诊断结果,应该在有条件的情况下,去对比该疾病的金标准检查结果(Gold Standard)。
“早期疾病的筛查在绝大多数状况下,不确定性是不可避免的。而且医生也知道,在初步筛查结果下得到的只是初步意见,不能作为金标准来下定论。我们能够保证的,是基于数据信息量,让病症在某一阶段的诊断准确率无限接近金标准。
当然,如果出现某一特殊病症没有现有的金标准可以参考,也同时为了保证诊断结果的客观性,我们会请权威医疗专家,把他们分成 4~5 组,分别独立去做一批数据诊断,对数据做质控标记。
这就相当于,把我们的系统作为第 6 组医生,它与每一组医生的差异率要维持在这几组医生之间差异率之内。
实际上,一些市场中现有计算机辅助诊断系统出现的问题,在某种程度上也被丁晓伟认为是 AI 医疗产品之间存在的目标性差异。
譬如,有些公司可能只做图像诊断,给出一个辅助性的诊断结果,而有些产品是既给出诊断结果,也会改进医生的工作流程,把医生写报告、做随访的时间也给一同安排了。“大概我们的产品在人性化方面会要求的更高一些”,丁晓伟说得比较委婉。
“你看市面上的大部分的诊断应用,可能都是机械地去做特定疾病检测与判断。这起到的是查缺补漏的作用,因为我们显然不可能完全相信算法。
但我想让自己的系统多一点特性,就是能给予医生一种信任感,让人不会觉得那么生硬。你看,就像完成一个机械动作,人与机器都能完成,但是过程与感觉是不一样的。
作为医生,除了给出一个诊断,他还具备『处理不确定性的能力』。他知道哪些是不确定的,会去找上级医生寻求帮助,会去寻求更进一步的但代价更大的医学检查。
举个例子,某一种病的治疗方案如果没有特别有说服力的信息量,医生的选择总是通过各种各样的方式去验证,譬如不断地去随访,或者寻求外部援助。而这些机制机器都是通通忽略的,妄图在一次检查中给出最好的答案。”
换句话说,在他的认知中,一件成功的医疗诊断产品,不仅会“学习海量的数据”,还要对诊断过程有一个深度理解。把医生写报告,向上级寻求帮助,二次审核等梯级任务都学到手,具备像人类一样的“处理不确定性的能力”。
某种程度上,这个设想与 Google Deepmind 团队一边做糖网病筛查诊断系统,一边研发医务支持与任务管理系统的“两手抓”计划有共通之处。
“所以,我们想优化的是整个看病流程,而非仅仅提高一个诊断结果的准确率。这不是一个单纯拼技术水平高低的问题,而是谁能在现实诊疗过程中更有风险控制的能力。”
但是,无论通过什么手段来保证诊断的准确率与提升医生的满意度,丁晓伟也承认一定需要考虑地域之间的差异。这也是 VoxelCloud 在美国与中国分别设立研发中心,与美中两国医疗机构同时进行项目试验的根本原因:
“我们的研发中心是洛杉矶,跟梅奥医学中心,UCLA 医学中心的关系也非常好,项目都是一起合作的。在国内,虽然合作医院需要取得授权才可以透露名字,但已经有 100 多家了,都是北京和上海的三甲医院。
这样做的理由,不只是因为病患的数据会有地域差异。国内外的诊疗流程也很不一样,两者都是相辅相成的,而且两地的研发结果也能做到互补,我们必须同时考虑到。
VoxelCloud与交大洽谈医疗影像合作
数据是否是核心竞争力?
好算法虽然是价值千金,但是好数据却更是“千金难买”。
风投机构 8VC 的 CEO Joe Lonsdale 曾在今年在斯坦福举行的 Light Forum 会议上称:“做医疗诊断一开始遇到的挑战就在于搜集与创建数据”。
而美国癌症中心 MD Anderson 的一位负责人也认为,只有在拥有上万患者数据的前提下,才能初步找到针对性治疗模式:
“从各种患者数据中找到不同的特征很关键,这对针对性治疗与精确用药非常有帮助。但是如果不能扩大现有数据集,上述愿景是无法实现的。你可能只有 1 万个肺癌患者数据,但其实这个数字并没有很大。”
此外,一位专注于医疗创业项目的分析师告诉机器之能:“现在 AI 医疗初创项目之间的竞争核心,就在于谁能拿到更多的数据。”
很简单,医疗数据之于医疗诊断的重要性,就像道路测试之于无人驾驶汽车。你只有不断地让汽车去实地训练,不断地收集与“咀嚼”道路数据,才能绘制出更高精的地图,逼近更高的安全数值。
同理,人体的复杂性更是不必多说。这也是为何 IBM 的数据工程师与医生们耗费了六年之久,才仅仅让 Watson 学习了 7 种癌症;而科技巨头与这个领域内所有创业公司也只能从单一的或者两三种疾病入手来进行摸索学习。
丁晓伟也认同这个观点。他认为,目前这个市场,大多数公司都在做肺癌、糖网病的 AI 医疗诊断,一方面是因为这些病种发病率非常高,影响范围非常广,且难以攻克,所以研究价值非常大。
而另一方面,其实是因为这些病的数据比较容易能拿到,包括网络等很多途径都是能搜集到很多案例的。
“这些可能是起点与上手都相对其他病症来说更容易一些(不是说本身容易)的项目,所以大家都从这几个病种入手。”
目前大多数AI医疗公司研究最多的4种病症:肺癌、糖网病、冠心病、肝病
根据知名医疗媒体 mobihealthnews 的一份调查,在医疗领域,数据的收集形式其实很丰富,包含临床实验、医生报告、医学图像、传感器和生物样本等多种获取途径。
然而,如何获取优质数据,特别是“干净”的患者数据,对于所有该领域的公司来说,是更为至关重要的。
“不管是研究项目、还是产品项目,模型的能力是不可能超出收集数据的质量。目前对于癌症来讲,可能最有效的做法就是取得病人的手术活检,或者穿透活检的病例结果,然后把这个结果作为金标准用于目前的训练。
但问题在于,在一家医院里,有活检病人的数量是远少于没有活检病人数量的。”丁晓伟这样解释高质量数据的重要性。
换句话说,要保证有持续的高质量数据的输入,公司只能尽可能多得通过与医院及其他医疗机构的合作来获得。因此,如何“拿下”医院的合作项目,也是鉴别 AI 医疗创业公司生存能力的一个重要衡量标准。
虽然丁晓伟并没有过多透露 VoxelCloud 与国外包括美国 NIH(美国国立卫生研究院)、梅奥医学中心等顶尖医疗机构的合作条约内容。但很显然,其导师 Demetri Terzopoulos 在全球医疗界的赫赫声望,为 VoxelCloud 铺开了一张巨大的关系网:
“我们算是师徒创业吧,我的博士生导师 Demetri 是英国皇家科学院院士和加拿大科学院院士,在业界的地位非常高。
当然,IEEE Fellow、ACM Fellow 等头衔,奥斯卡技术成就奖,德国亥姆霍兹奖等一大堆奖项就不用说了,其实他被肯定的最重要的一点,是对医疗应用层的贡献。譬如他参与研发的图像分割算法,就被广泛应用于医疗成像技术中。”
这种略显豪华的技术背景优势,是否能够让开发者在面对成百上千万的数据时,更能对它们进行游刃有余地处理? 根据丁晓伟给出的一份案例显示,他们正在基于一份包含 250 多万病例的数据集上做出眼底各种疾病分析模型,诊断结果已经能够达到专业医生水平的准确率。
然而,他们需要面对的挑战依旧很大。
MIT(麻省理工科技评论)曾在批评包括 Watson 在内的诸多医疗诊断系统“不作为”时,把矛头指向“数据处理的难度”而非“数据的量级”,这同样也是所有 AI 医疗公司都有的短板:
“很多时候,诊断结果不够好并不是公司本身的原因,而是由于数据的复杂性与相对不可用性。因此,这需要 AI 系统基于数据调整参数,以达到最佳拟合效果。对于相对容易的任务,比如检测恶性肿瘤 X 射线,效果可能很好;但在很多关系复杂的病况下,就很难实现。”
而加州大学伯克利分校公共卫生学院的生物统计学教授 Maya Peterson 也持有同样的观点,她在今年 7 月的一次医疗会议上指出:
“人体的数据真的太过复杂,而我们还没有完全理解他们之间的联系。在探索更加复杂的病症中,机器学习在某种程度上野心过大,这也不是一件好事。”
这不是一个当下能谈盈利的市场
对于 AI 医疗创业公司来说,还有另一个很严酷的事实:数据的量级是与其价格成正比的。与此同时,还有优质算法与优秀技术团队的高昂成本。
换句话说,在进入这个市场前,所有人都应该意识到这是一个“资本无底洞”。
2015 年 8 月,IBM 耗费 10 亿美元收购了医学成像及临床系统供应商 Merge Healthcare,垂涎的就是后者手中积累的海量数据。
2016 年 2 月,IBM 又甩出 26 亿美元欲拿下医疗保健数据与分析服务提供商 Truven Health Analytics,为的就是后者掌握的 8500 家客户与 3 亿病患数据。
这两个举动也被 MIT 看作是“IBM Watson 即便再被世人讨厌,也仍然有其竞争优势”的关键证据。
而另一个残酷的反面案例是,作为 Watson 的第一批合作伙伴,曾希望借助 Watson AI 诊疗技术来构建独立肿瘤专家建议系统的安德森癌症中心 MD Anderson,在耗尽 6000 万美元后,宣告项目失败。
此外,与庞大投入相对应的,是商业模式仍然在寻找,盈利更是不可能谈起的早期探索状态。
丁晓伟向机器之能透露,VoxelCloud 目前已经推出了成熟的产品,但在当下所有签订的合同中,与公立医院的项目肯定是非盈利的合作形式,而私立机构用他们的系统则是要收钱的。
“现在大家都处于早期,研发与搜集更多的数据是最重要的事情。虽然我们已经有了不少成熟的产品线,但是这个领域真的太新了,我们必须怀着谨慎和敬畏的心,持续往前去推进。
公司在不同的发展阶段,肯定会有不同的商业模式,但是作为一个从业者,我认为现在的主要矛盾不是赚钱,而是把赚钱的前一步走好,先把这个事做成了再说。
说实话,现在 AI 医疗领域的技术需要很多非常规的技术变通才能达到应用级的要求。”
而从肯定不愿意做亏本买卖的投资人角度来看,这些“秃鹫”目前能做的,也是给予这个领域的创业者一些更多的时间,让自己再多盘旋几圈。
今年 8 月,VoxelCloud 本轮的投资方腾讯,曾推出了自家的医疗影像产品“觅影”,当时在发布会上,公司的互联网+医疗部门负责人常佳就曾针对腾讯的医疗布局表示:
“我们认为 AI 在所有领域的应用还处于早期阶段,长远看才会有更大的空间。因此,现阶段我们还不考虑商业化的事情。”
而丁晓伟也向机器之能透露,其上一轮领投方红杉资本对 VoxelCloud 并没有盈利方面的短期要求。
“红杉本来就是长线投资方,他们非常看重这个领域。而且在我看来,投资人会比较看你已经有了什么,只谈潜力是不够的。我们有了比较成熟的应用和产品,而且部分产品线已经拿到了美国 FDA(食品及药物管理局)与欧洲 CE 的许可;而国内 CFDA 也快要拿到了。”
但是,对于永远最看重回报的投资方来说,这类公司无论如何都是要最终接受市场考验的。华创资本的前沿科技项目投资负责人公元则告诉机器之能:
“如果技术门槛非常高,早期虽然是不用考虑太多盈利模式(要先把壁垒建立起来)。但最终肯定是要接受市场和盈利的考验,只能说看资本市场能接受的长短度而已。”
而更加无法忽视的现状是,除了商业模式与盈利问题,挡在 AI 医疗创业公司面前的还有监管障碍、Kaiyun官方网站app登录 短缺以及那些来行业内外的“不信任的声音”。
根据《中国科技报》的一份报道,中国科学院院士、上海交通大学 Bio-X 中心主任贺林在解读国务院在今年 8 月发布的《新一代人工智能发展规划》时曾直击当前国内 AI+医疗项目的监管痛点:
“目前,国内还没有一款医疗领域的人工智能产品得到国内 FDA 的批准,相关收费也没有进入医保目录,人工智能对于国内医疗行业来说仍然是新兴事物,需要与现有医疗模式一起经历“磨合期”。”
而另一方面,丁晓伟自己则把“招聘问题”与”外界质疑”列为当下 VoxelCloud 最大的两个难题。其中,他认为“Kaiyun官方网站app登录 短缺”是包括他在内的当下所有同类公司都需要面对的挑战:
“我们团队有 40 多个人,虽然大家基本都是来自梅奥医学中心,加州大学洛杉矶分校与卡内基梅隆大学,亚利桑那州立大学等高校的专家,但是我们觉得人手还远远不够,因为顾及到数据的复杂程度与医疗研发的严谨度,我们需要耗费大量心力去做研发。对于创业公司来说,速度也很重要,因此我们平时基本连轴转。
现在大家都会想尽一切办法去抢人,因此我们基本不会放过任何学校的计算机及医疗专业的高材生。”
实际上,这不是丁晓伟一家 AI 医疗创业公司的心声,而是整个 AI 产业圈焦灼的人事状态。然而,在这个Kaiyun官方网站app登录 身价虽然水涨船高,但同时却被越来越多的人提出“泡沫说”的创业领域,是否值得我们“将所有身家都压在上面”?
此外,虽然设立了高门槛,但同样有“盈利无着”“烧钱过快”等问题的 AI 医疗是否会重蹈两年前移动医疗的覆辙?
这就像一位不愿透露姓名,但曾经历移动医疗寒冬,并调查过几十个死掉的移动医疗项目的行业资深人士对机器之能发出的一番感叹:
“包括移动医疗在内的数字医疗曾死过一大批,但这不就是创业的正常现象吗?现在人工
智能医疗创业如此火爆,咱们不说炒作嫌疑,我觉得主要背景是人力资源短缺与医疗成本高企。人工智能在医疗里,包括影像,顶多是辅助。
另外,之所以投资人都不注重商业盈利问题,是因为他们注重也没办法盈利。”
然而,无论各方如何给出自己的判断,当初医疗创业寒冬留给所有 AI 医疗从业者的教训,其实都可以汇成一句话:
“不要做出过分的承诺,不要相信关于你自己过于天花乱坠的报道,怀着对医学与 AI 技术的敬畏之心,匍匐前进。”