跳到主要内容

生物工程师为功能基因组数据创建第一个在线搜索引擎

由:

  • 丹尼尔·凯恩

媒体联络:

发布日期

由:

  • 丹尼尔·凯恩

分享:

文章内容

加州大学圣地亚哥分校的生物工程师们创建了他们认为是第一个功能基因组数据的在线搜索引擎。这项工作来自盛中生物工程实验室在加州大学圣地亚哥分校的研究结果刚刚被《核酸研究》杂志在线发表。这个新的搜索引擎,叫做GeNemo,供公众免费使用:genemo.org

GeNemo解决了一个紧迫的挑战:有效地从在线数据库中搜索功能基因组数据。(GeNemo这个名字是基因(gene)中的“Ge”和电影《海底总动员》(Finding Nemo)中的尼莫(Nemo)的组合。)

在功能基因组数据中捕获的生物体基因组的功能与健康和疾病直接相关。功能基因组数据记录了生物体基因组每一部分的不同活动。新的搜索系统可能会引导研究人员发现基因组中与特定器官和组织的正常生理或疾病相关的特定部分的功能方面。

图片:截图来自GeNemo在线搜索引擎。

截图来自GeNemo在线搜索引擎的功能基因组数据。

GeNemo根据在线功能基因组数据集查询用户输入的数据,包括ENCODE和小鼠ENCODE数据集的整个集合。与基于文本的搜索引擎不同,GeNemo的搜索是基于功能基因组区域的模式匹配。

新工具不再只是“通过文本搜索”,而是允许研究人员在功能数据内部进行搜索。寻找与新转录因子相似的结合模式只是一个例子。

“如果你把功能基因组数据文件看作视频文件,那么‘文本搜索’就像通过标题中的关键字或视频文件的描述进行搜索。‘内部数据搜索’就像通过视频本身的模式匹配来搜索一个视频片段。”

“功能基因组分析正在以具有挑战性的数据类型产生大量数据。我们开发了一种在线工具,使用户能够输入任何完整或部分功能基因组数据集,例如,像bigWig这样的绑定强度文件,或峰值文件,”该论文的联合第一作者、加州大学圣地亚哥分校生物工程科学家曹孝义解释说。“GeNemo从任何在线ENCODE数据集中报告任何基因组区域,范围从100个碱基到10万个碱基,这些数据集具有类似的功能模式,如绑定、修改和可访问性。”

功能基因组分析数据机会

利用DNA测序,如高通量读出,功能基因组分析可以查询转录因子结合(ChIP-seq),表观遗传修饰(ChIP-seq),调控区(DNase-seq, FAIRE-seq)和其他功能结果的全基因组分布。结果通常存储为全基因组强度(WIG/bigWig文件)或功能基因组区域(peak/BED文件)。这些数据类型给大数据科学带来了新的挑战。

据研究人员称,这是第一个用于在线执行功能基因组数据搜索的软件。

“我很高兴看到来自世界各地的不同研究团队如何使用这一强大的新工具来更好地利用每天产生的大量功能基因组数据,”钟说。

分享:

类别导航与社会链接
Baidu