正当时......

学术咨询服务
当前位置:职称论文发表咨询网医学职称论文》生物医学大数据的现状与展望

生物医学大数据的现状与展望

来源:职称论文发表咨询网作者:田编辑时间:2021-04-13 08:45
扫码咨询

  摘要生物医学是一门新兴的前沿交叉学科,它综合了医学、生命科学和生物学的理论和方法而发展起来.近年来随着先进仪器装备与信息技术等越来越广泛和深入的整合到生物技术中来,生物医学研究中越来越频繁的涉及到大数据存储和分析等信息技术.大数据时代的来临对生物医学研究产生了重大影响.其中,一个重要发展趋势就是由假设驱动向数据驱动的转变.数十年来分子生物学水平上的实验目的是获得结论或者是提出一种新的假设,而现在基于海量生物医学大数据,可以对海量数据的研究来探索其中的规律,直接提出假设或得出可靠的结论.随着先进的生物分析技术的不断推出和更新,生物医学数据迅速积累.基于此类大数据一些以往不能解决的问题将有望解决,同时相关生物医学研究的新问题也层出不穷.生物医学相关的大数据技术和相关应用主要包括:基于高通量测序的个性化基因组、转录组和蛋白组研究,单细胞水平基因型和表型研究,人类健康相关微生物群落研究,生物医学图像研究等.相关生物医学大数据分析任务均具有着数据密集和计算密集的双密集性特点.要充分地利用这些大数据解决一系列生物医学问题,迫切需要高通量、高效率、高准确性的生物信息存储和分析策略.本文总结和回顾生物医学大数据的生成、管理和分析相关的一系列问题,其中重点讨论人体微生物群落、单细胞表型和基因型、生物医学图像等新近出现的生物医学大数据形式,以及相关数据分析和应用前景等.基于目前生物医学大数据的现状我们可以发现,生物医学大数据的研究正处于蓄势待发状态:适应于生物医学大数据的软硬件平台、大数据存储、大数据分析挖掘等方法等还不成熟,制约着生物大数据的研究.然而一旦相关研究获得突破并有所优化和应用,将会全方位地支撑生物医学大数据的深入解构;进而有助于对医学现象的趋势分析和预测,服务于相关的遗传疾病研究、公共卫生监控、医疗与医药开发等广泛生物医学应用.

  关键词生物医学大数据微生物群落单细胞医学图像数据挖掘

生物医学大数据的现状与展望

  生物医学是应用生物医学信息、医学影像技术、基因芯片、纳米技术、新材料等技术的学术研究和创新交叉领域.随着以“社会-心理-生物”为代表的大医学模式的提出和系统生物学的发展,形成了现代系统生物医学[1,2].面向生物医学的系统生物学研究是与21世纪生物技术技术和大数据技术密切相关的领域,是关系到提高医疗诊断水平和人类健康的重要研究领域.

  更新了一篇医学相关的论文,如中兽医医药杂志是国家级刊物吗,您可以点击并前往查看。

  1生物医学大数据研究的特点

  1.1大数据的重要性

  高通量的研究思路和相关数据生产方式的飞跃是大数据产生的主要因素.大数据经历着从概念到小范围技术实践,最终到广泛接受并成为一个新兴研究方向的历程.2008年9月,Nature杂志率先出版了由Howe等人[4]所发论文组成的“大数据专刊”,表明大数据的影响已触及自然科学、社会科学和工程学的各个领域.2009年10月,TheFourthParadigm:DataIntensiveScientificDiscovery[5]一书的出版,显示出与大数据关系密切的数据密集型科学发现范式已被确立和广泛认可.2011年2月,Science杂志推出Overpeck等人[6]所发表文章组成的“数据处理专刊”.2012年5月,联合国发布大数据政务白皮书BigDataforDevelopment:Challenges&Opportunities[7],体现了大数据领域的研究计划在国家战略层面的重要性.2014年Science杂志推出“Bigbiologicalimpactsfrombigdata”[8]等一系列评论,也明确无误地表明了生物学相关研究已进入大数据时代.

  1.2生物医学大数据的特点

  以高通量测序仪器、单细胞检测装备和实时动态图像系统为代表的新一代生物分析平台已经和正在为生物医学研究提供海量数据,而要充分利用蕴藏于海量数据中的深刻规律,大数据驱动的研究策略必不可少[9].大数据至少包含3层含义(3V)(图1):数据量大(volumeofdata),处理数据的速度快(velocityofprocessingthedata),数据源多变(variabilityofdatasources).这是那些依赖大数据进行分析和预测过程的重要特征[10].具体到生物医学大数据研究而言,大数据研究的3V特点体现如下:第一,生物医学数据量大.通常对于一个样本的人体基因组和转录组(多组织多时间点)测序数据量会分别超过100和30GB(基于3GB人类基因组和10~30倍测序深度).考虑到一次试验中通常会涉及到数百个甚至上万个人体样本,相关的数据量产出十分巨大.第二,研究对于处理结果准确性和处理速度均有较高要求.如个性化医疗[11],就具有较高的时效性要求,而单细胞测序及诊断等[12],对突变位点和功能模块的鉴别准确性要求较高.第三,相关源数据来源多变且具有较大的异质性.同时生物医学数据的分析和解释通常会利用到NCBI系列[13]等通用数据库以及UniProt(www.uniprot.org)等专业数据库.源数据和数据库的异质性,会导致数据缺失、数据矛盾等问题的普遍存在,成为相关大数据整合与分析的瓶颈.正是因为生物医学研究具有典型的3V特点,所以需要依靠大数据思维和数据分析策略对生物医学数据进行深入挖掘.

  2生物医学大数据的典型应用

  典型的生物医学数据包括癌症、个性化医疗等数据,其呈现形式包括功能基因组、单细胞、宏基因组(又称元基因组)数据等.所有这些数据存储于NCBI或EBI等大型通用数据库中.同时随着高通量测序技术的发展和应用以及生物技术与信息技术的融合,NCBI等大型通用数据库中生物医学数据类型和数据规模不断增大[15](图2).

  3生成海量大数据的先端生物技术

  生物医学大数据的研究依赖于高通量、高质量的数据生成线段生物技术和相关仪器.目前生物医学大数据的来源主要有3种:(1)DNA测序仪器;(2)高通量高精度质谱仪;(3)高通量高精度表观型分析仪器.详见图3.

  4生物医学大数据的分析

  生物医学大数据可以分为大数据存储和大数据分析两方面,其中大数据存储服务于大数据的深入分析.当今生物医学中的典型大数据包括各类基因组数据、宏基因组数据和单细胞数据以及生物医学图像数据等.

  参考文献

  1EngelGL.Theneedforanewmedicalmodel:Achallengeforbiomedicine.Science,1977,196:129–136

  2AntonyP,BallingR,VlassisN.Fromsystemsbiologytosystemsbiomedicine.CurrOpinBiotechnol,2012,23:604–608

  3CollinsFS,MansouraMK.Thehumangenomeproject.Cancer,2001,91:221–225

  4HoweD,CostanzoM,FeyP,etal.Bigdata:Thefutureofbiocuration.Nature,2008,455:47–50

  宁康①*,陈挺②③*


《生物医学大数据的现状与展望》
上一篇:可追溯食品市场消费需求研究———以可追溯猪肉为例
下一篇:医教协同理念下医学教学基地的建设与思考
更多>>

期刊目录