华大智造:智无疆、AI同行
华大智造COO,深圳华大生命科学研究院副院长蒋慧博士,为我们解读了基因测序技术如何帮助解决精准医疗等关系国计民生的实际问题,以及借助AI、5G、云计算等数字技术创新,给医疗行业带来的改变。

文/许胜蓝、薛桦
华大智造COO,深圳华大生命科学研究院副院长蒋慧博士,为我们解读了基因测序技术如何帮助解决精准医疗等关系国计民生的实际问题,以及借助AI、5G、云计算等数字技术创新,给医疗行业带来的改变。
一个人一生罹患的疾病中,有很大一部分是由基因决定。对大部分人来讲,基因像是一本“天书”。要解密这部“天书”,需要依赖基因测序技术。深圳华大智造科技有限公司(以下简称“华大智造”)是华大集团下属子公司,秉承“基因科技造福人类”的理念,致力于基因科技的创新,专注于研发生命科学与医疗健康领域的仪器设备,提供实时、全景、全生命周期的全套数字化设备。
让基因组测序不再“高冷”
人体大部分特征包括罹患特定疾病的可能性,都是由基因组决定的,如果知道了我们基因组的特点或者基因上存在的缺陷,也就能知道我们一部分的体态特征以及患特定疾病的几率。基因测序及相应数据的分析,可以帮助研究某种疾病与特定基因形态的对应关系,进而可以早期发现并一定程度上干预这种疾病。
即使某些与基因相关的疾病已出现,基因测序也可以帮助找到对应突变的基因,进而准确地进行靶向治疗,这正是精准医疗的研究方向之一。蒋慧表示:“2011年,美国医学界首次提出了‘精准医疗’的概念。精准医疗的重点不在‘医疗’,而在‘精准’。通过基因测序技术预测未来可能会患有哪些疾病,从而更好地预防;一旦患上了某种疾病,可以进行早期诊断;诊断后用药的靶向性也更强,病人将得到最合适的治疗和药物的使用,实现最佳剂量和最小副作用,以及最精准的用药时间。疾病的护理和愈后效果也能得到准确的评估和指导。”
2015年1月,当时的美国总统奥巴马在国情咨文中提出“精准医疗计划”后,一时间“精准医疗”成为全球热门话题,精准医疗建设以迅雷不及掩耳之势蔓延,中国也不例外。在2016年,中国把精准医疗列入“十三五”国家科技创新规划。这成为基因技术快速发展的契机,其重点在疾病队列研究、疾病的分子分型和分期、个体化治疗、大数据的收集和挖掘等方面。2017年10月,在第十二届国际基因组学大会(The 12th Annual Meeting of the International Conference on Genomics, ICG-12)上,华大智造发布了两款新的高通量测序仪MGISEQ-2000与MGISEQ-200,同时,华大基因发布基因组解码计划GDP(Genome Decode Program),并发布了百万中国人基因数据库(CMDB, Chinese Millionome Database)。

蒋慧分享道:“有了这些测序‘神器’和科研成果的加持,新一代基因测序技术带来了成本上的革命,相信在不久的将来,平均一天就能完成24个肿瘤样本的快速检测。三年内,基因组测序将进入百元人民币时代,人人都有望拥有自己的全基因组数据。24小时精准医疗(All in one day)不再遥远——基因数据的获取、分析、解读在一天内完成。”
成本大幅度降低后,普通人将能够享受到基因组测序的福祉。蒋慧介绍道:“中国的出生缺陷比例较高,在5.6%左右。为了减少和预防出生缺陷的发生,从怀孕前到生产后的整个过程,人们都可以进行不同的基因检测,这对减少和预防出生缺陷有重要的作用。高通量测序仪可以进行胚胎检测和妊娠后的新生儿检测。未来,无论是科学研究还是临床医学,甚至在农林牧副渔业等领域,基因组测序都有无限的想象空间,将推动医疗和科研领域高通量测序系统的全面普及。”
AI加持
随着人工智能与基因测序紧密结合,基因测序行业必然迎来更大的发展空间。事实上,已经有不少互联网巨头跨界进入基因市场。如Google首先联合DNAnexus打造巨大的开放式免费基因数据库。亚马逊数据云的公共信息平台上也有类似的数据库共享。未来关于基因数据的分析也会不断涌现出更多算法。
根据预测,到2020年全球基因测序市场规模将达到138亿美元,年复合增长率为18.7%。华大智造不断探索基因测序技术与AI技术相结合的成功实践,实现了健康大数据的深度挖掘和应用。蒋慧举例说:“AI技术通过对脱敏基因数据进行深入分析,可以开发出更精确的疾病、表型预测模型,构建出更精细的人群遗传结构,并有望找到新的药物靶点。无创产前基因检测本来用于唐氏综合征等胎儿染色体疾病的筛查,并不是为癌症检测设计,但得益于华大的大数据与AI技术,通过对百万样本及肿瘤基因特征进行分析,使得识别无创基因检测数据中的肿瘤信号成为可能。基于无创产前基因检测数据被早期发现的孕期肿瘤案例已逾40例,几十个家庭因为疾病的早期发现而受益。”
截至2017年底,华大基因生育产品临床检测累计服务近500万人,已完成超过280万例无创产前基因检测,检出率和特异性均大于99%,检出了3.8万余例染色体异常胎儿;超过153万名新生儿或孕妇接受了耳聋基因筛查的检测服务,帮助约8万携带者防聋控聋。
除了在基因测序领域的应用,蒋慧指出AI技术在医疗行业的其他应用也潜力巨大。“我国人口占世界人口总数的22%,但医疗资源仅占世界的2%。据统计,我国医疗机构80%集中在城镇,农村和偏远地区。资源严重不足,大部分高新技术、设备和优秀医护人才都集中在大城市和大医院,不能满足所有群众基本的卫生服务需求,也导致了大医院内医疗资源紧张。医疗健康的需求端急剧上升和供给端的严重不足,驱使人工智能等技术与医疗健康行业的结合。”

“在客观数据的收集和分析上,人工智能的速度和能力远超人类,特别是医学影像识别领域,因为医学影像数据相对标准化,非常便于机器识别和深度学习。智能辅助诊断系统可将医生的看片时间平均减少4.25个小时,准确度提高到90%以上。这样一来,不仅医生有更多时间提高业务水平,还能够把医生‘还给’患者,让医生有更多的时间为患者提供其它诊疗。此外,人工智能技术整合基因和影像等跨组学数据,能更全面地分析疾病在不同发展阶段的内在关联性。”
5G、云计算带来更多可能
2018年初,华大智造交付的远程超声诊断系统MGIUS-R3在深圳罗湖医院(集团)开始试用。这种远程超声诊断系统,扩展了超声设备的应用场景,在偏远或极端环境、社康中心等地方都能发挥重要作用,突破传统超声诊疗方式的局限,克服时空障碍,有助于改善医疗资源分布不均衡的现状,同时将基因数据与影像数据进行整合,使全民平等地享受优质的精准医疗服务。
一直以来,远程超声检测、远程手术等远程实时操控类应用受制于带宽和时延的苛刻要求。例如,医生手部动作、图像传输、力量反馈必须达到高度同步,这在现有网络条件下难以实现。为了解决这一难题,华为Wireless X Labs与华大智造联手探索,使用4.5G/5G网络技术为远程超声机器人提供信号和数据的连接,帮助医生远程操控病人端的超声探头,进行诊断。
4.5G/5G网络具备大带宽特性,能够为现场音视频和B超图像的实时传输提供数十兆的传输带宽。另一方面,4.5G/5G网络也拥有低时延特性,病人体表的力量反馈信号在短短几毫秒内就可以传递到医生的触觉设备。此外,利用4.5G/5G网络,超声影像还能传输到云端完成实时分析,多层次辅助医生诊断。蒋慧表示,“在4.5G/5G网络助力下的远程超声诊断系统,让高灵敏度力反馈系统得以应用,能在直径为850mm的空间内进行扫查,全面满足了心脏、颈部、胸部及腹部等全身应用的检测需求;高清的视频语音系统让专家和病人沟通畅通无阻;远程调节超声图像的参数,无时延,实现实时快速诊断,提高诊疗效率。”
基因测序正在从个体走向大规模群体,从科研走向广泛的商用,伴随而来的计算分析模式也逐步从本地、离线,走向云端、在线,数据产生的量越来越大。蒋慧说,“基因测序的成本在降低,数据产出的速度越来越快,纯粹依靠我们自己的能力建设大型的数据中心,已经跟不上海量数据产出的速度。我们每个月产出300TB数据,到目前已经有22个PB的数据,怎么处理这种爆炸性的数据增长?”
“同时,我们的国家基因库要与合作方实现数据共享,而云计算很好地满足了这些需求。通过长期的测试和使用华为OceanStor 9000云存储系统,我们的存储性能提高了25%-30%,给用户交付报告的时间从原来的15天缩短到7天。OceanStor 9000统一的文件系统和分层的存储管理,对华大的数据生命周期管理也有很大的帮助,可应对华大无创产前基因检测业务的需求。在信息技术与生物技术融合的年代,我们希望与华为联手,发掘更多让基因科技造福人类的机会。”