生物医学大数据处理的云计算解决方案
摘要:随着二代测序、质谱分析、医学影像等生物医学技术的发展和应用,生物医学数据呈现爆炸性增长趋势,其处理面临数据量大、计算强度大、维度高等问题。云计算在资源分配、数据存储、计算、共享等方面具有优势,能够帮助解决生物医学大数据处理的相关问题。深入分析了云计算在生物医学大数据处理方面的特点,归纳总结了常见的生物云计算解决方案,对生物云计算的发展和挑战进行了展望。有望建立能够整合多源生物医学数据的新型计算方法,以解决复杂的生物医学问题。
关键词:生物医学技术;二代测序;医学影像;大数据;云计算
1引言
近二十年来生命科学研究在生物医学技术的推动下得到了快速发展。特别是高通量测序技术(或称为二代测序、下一代测序)凭借其优良的测序性能和低廉价格(每5个月价格降一半[1])在领域内得到了广泛应用。二代测序同时衍生出了RNA-seq[2]、ex-ome-seq[3]、ChIP-seq[4]、DNA甲基化测序[5]、染色质交互分析[6]等针对特定生物分子或靶标的测序方法。另外,蛋白质质谱分析法被用于蛋白质组学研究[7],医学影像(如CT、核磁共振MRI)已成为医学研究及诊断的常用技术。在新型生物技术的协助下,大型生物/医学项目(如1000基因组[8]、ENCODE[9]、modEN-CODE[10]、CancerGenomeAtlas[11]、Humanmicrobi-ome[12]等)得以完成或正在稳步推进。然而,在利用相关技术进行研究的同时也产生了规模庞大的数据,其累积速度已超过了摩尔定律(Moore’sLaw)所标量的计算机发展速度,形成了“生物医学大数据”(bio-medicalbigdata)[1]。当前,生物医学大数据处理的相关问题已成为生命科学研究发展的重要挑战。
更新了一篇医学相关的论文,如医学中文核心期刊好投推荐,您可以点击并前往查看。
2生物医学大数据处理与云计算
由于生物医学研究问题的复杂性,对生物医学大数据的处理需要借助可靠的算法和高效的计算平台,而云计算恰能为生物医学大数据处理提供有力的平台支撑。
3生物云解决方案
3.1常见的生物云解决方案
当前常见的生物云解决方案如表1所示,主要涉及以下几方面如图1所示。
3.2生物云所涉及的云计算服务模
型商业化云计算主要向用户提供软件即服务(SaaS)、平台即服务(PaaS)和基础设施即服务(IaaS)这3种基本的云计算服务模型。同样地,商业化生物云在向生物云用户提供生物医学数据处理/软件开发的服务过程中也涉及这3种服务模型。
4生物云面临的挑战
尽管生物云已在领域内得到应用,但其在资源整合和有效利用方面仍然面临挑战。
4.1建立一致的生物云平台接口
现有的生物云主要包括商业化生物云、私有生物云及学术生物云这3种类别。其中每种生物云各有不同的机构予以实现,并面向各自的用户群。在数据存储方面,生物云之间存在着大量的冗余,且交互性不够好,这使得生物云的资源利用率达不到最优。因此,需要建立一致的生物云平台接口,以实现不同生物云之间的互联互访,使得生物云之间的资源能够充分共享,进而有助于生物医学大数据的处理。
4.2生物云的数据挖掘
生物云中存储了来源多样的生物医学数据,这些数据能够帮助科学家揭示丰富的生命奥秘。当前的挑战即在于如何进行生物数据挖掘,即筛选出合适的数据、建立模型,进而通过高效的计算方法获得生物医学信息。
5结论
与展望新一代生物医学技术的广泛应用使生物医学数据呈现爆炸性增长的趋势,生物医学研究由此进入大数据时代。相对于传统的生物医学数据处理环境,生物云在数据存储、计算处理、共享等方面具有优势,已经开始为生物医学大数据处理提供相关的解决方案,涉及序列比对、基因组装配及差异表达分析等生物信息处理的各个方面。未来有望建立能够整合多源生物医学数据的新型计算方法,以解决复杂的生物医学问题。
参考文献
[1]STEINLD.Thecaseforcloudcomputingingenomeinformatics[J].GenomeBiol,2010,11(5):207.
[2]MARIONIJC,MASONCE,MANESM,etal.RNA-seq:anassessmentoftechnicalreproducibilityandcomparisonwithgeneexpressionarrays[J].Ge-nomeresearch,2008,18(9):1509-1517.
[3]NGSB,BUCKINGHAMKJ,LEEC,etal.Exomesequencingidentifiesthecauseofamendeliandisorder[J].NatureGenetics,2009,42(1):30-35.
[4]JOHNSONDS,MORTAZAVIA,MYERSRM,etal.Genome-widemappingofinvivoprotein-DNAin-teractions[J].Science,2007,316(5830):1497-1502.
孙磊胡学龙张晓斌李云
《生物医学大数据处理的云计算解决方案》
- 职称论文刊发主体资格的
- 政法论文浅析工会法主体
- 化学在初中教学中的情感
- 中学教育论文思想政治方
- 法治论文投稿法治型市场
- 杂志社论文发表浅析推动
- 新疆教育报投稿浅析学生
- 分男女招生录取的合宪性
最新优质论文
- 教师类职称论文一般多少
- 新闻专业有哪些职称
- 论文发表三步曲
- 职称晋级论文检索才认可
- 职称评定需要发表什么样
- 医学领域cscd期刊怎么查找
- 浙江师范大学学报编辑部
- 如何提供职称论文的知网
论文发表问题热点
- 简述机械工程师基础考试
- 电力系统职称核心期刊怎
- 硕士从助工晋升中级职称
- 《教育探索》核心级教育
- 博士生毕业论文答辩技巧
- 毕业及职称论文发表需要
- 工程管理专业论文摘要准
- 发表职称论文如何鉴别期