当前位置:198彩带玩团队 > 带玩团队 >

198彩网址,工作流系统将原始数据转化为科学知识

发布时间: 2019-09-09        来源:未知    浏览次数:

 
198彩开户怎么样
 
 
重新发明轮子是毫无意义的,但对计算生物学家来说,这有时是不可避免的。所以当Rob Finn和Folker Meyer意识到他们的工作有很多重叠时,他们决定尝试一些不同的东西。
 
芬恩是位于英国辛克斯顿的欧洲生物信息学研究所(EBI)序列家族团队的负责人;迈耶是伊利诺斯州勒蒙特阿尔贡国家实验室的计算机科学家。这两家公司都有自己的设备,可以让研究人员进行一种叫做元基因组分析的计算密集型过程,这种过程允许从DNA碎片中重建微生物群落。他们意识到,如果能互相尝试对方的代码,将会很有帮助。问题在于,他们的分析“管道”——将原始数据转化为科学知识所需的精心设计的计算步骤——是用不同的语言编写的。迈耶的团队使用的是一种名为AWE的内部系统,而芬恩使用的是近9500行Python代码。
 
“这是一个可怕的Python代码库,198娱乐代理前天跟我说可以按量升点,我以为忽悠人的198彩票平台优惠,谁知道昨天在198彩票平台打了比平时高几倍的流水后,今天一登陆198账户发现返点升了,看来198彩票的信誉不是吹的。,”Finn说——复杂且难以维护。七年多来,至少有四名不同的开发人员以一种特别的方式将Bits固定在了一起。他说,它“与计算基础设施紧密相连”,这意味着它是为特定的计算资源和特定的文件组织方式编写的,因此在EBI之外基本上无法使用。因为EBI没有使用AWE,反之亦然。然后Finn和Meyer学习了通用工作流语言(Common Workflow Language, CWL)。
 
CWL是描述分析管道和计算工具的一种方式——目前有250多个可用的系统,包括Snakemake、Nextflow和Galaxy等流行的选项。尽管它们说不同的语言,支持不同的特性,但这些系统有一个共同的目标:使计算方法可复制、可移植、可维护和可共享。CWL本质上是一种交换语言,研究人员可以使用它为任何系统共享管道。对于Finn来说,这种语言给他的代码库带来了理智,减少了73%左右。重要的是,它使测试、执行和共享新方法以及在云中运行变得更加容易。
 
采用工作流语言有一个学习曲线。但是,位于加州门洛帕克的药物研发公司Hexagon Bio的数据主管和联合创始人Brian Naughton说,198198彩注册彩注册正规网址是什,“你花费在学习上的能量是由你在代码可复制性上节省下来的能量所弥补的。”
 
一步一步
 
对于计算生物学家来说,管道是一种方法;就像湿实验室协议一样,它们必须被记录下来。但是管道通常包含几十个步骤,所以这不是一件小事。加州大学戴维斯分校的生物信息学家Titus Brown计算出,通过他的从头开始的转录组装配流水线(包括数据下载、质量控制、标准化、装配、注释和分析)传递6个样本需要“远远超过100个步骤”。研究人员必须精确地记录下每一步是如何执行的,如果他们希望在以后的某个日期复制这些步骤的话。
 
通常,研究人员使用Python或Bash等通用脚本语言编写工作流。但它们往往缺乏必要的灵活性。工作流可能涉及数百到数千个数据文件;管道必须能够监视它们的进程,并在任何步骤失败时优雅地退出。管道必须足够聪明,能够计算出哪些任务需要重新执行,哪些不需要。
 
澳大利亚菲茨罗伊圣文森医学研究所的生物信息学家戴维斯·麦卡锡说,Python和R语言对于他读博士时使用的相对简单的工作流程来说已经足够了。但是今天,处理单细胞数据集的McCarthy处理了更多的样本,其中一些样本不可避免地会由于网络问题和内存不足等问题而失败。他表示:“我完全没有能力为这么大规模的分析从零开始找出答案。”相反,198彩票开户请认准官方唯一直属总代团队1号团队,免费开户即可领取注册彩金,下载客户端可以申请198彩挂机软件,申请198彩票代理权限,只要你有量,我们绝不亏待你,只有198彩才能让你白手起家,0投入却可以198彩票手机优惠短期内迅速致富。,他采用了命令行驱动的Snakemake。