新网创想网站建设,新征程启航

为企业提供网站建设、域名注册、服务器等服务

怎样进行motif分析

这篇文章跟大家分析一下“怎样进行motif分析”。内容详细易懂,对“怎样进行motif分析”感兴趣的朋友可以跟着小编的思路慢慢深入来阅读一下,希望阅读后能够对大家有所帮助。下面跟着小编一起深入学习“怎样进行motif分析”的知识吧。

公司主营业务:网站建设、网站制作、移动网站开发等业务。帮助企业客户真正实现互联网宣传,提高企业的竞争能力。成都创新互联公司是一支青春激扬、勤奋敬业、活力青春激扬、勤奋敬业、活力澎湃、和谐高效的团队。公司秉承以“开放、自由、严谨、自律”为核心的企业文化,感谢他们对我们的高要求,感谢他们从不同领域给我们带来的挑战,让我们激情的团队有机会用头脑与智慧不断的给客户带来惊喜。成都创新互联公司推出管城免费做网站回馈大家。

在chip_seq数据分析中,motif分析是一项重要的分析内容。通过motif分析,我们可以对转录因子结合位点的序列模式有进一步的了解,那么什么是motif呢?

蛋白质中功能的基本单元是domain,是一种特殊的三维结构,不同结构的domain与其他分子特异性结合从而发挥功能。与此类似,转录因子在于DNA序列结合时,其结合位点的序列也由于一定的特异性,不同转录因子结合的DNA序列的模式是不同的。为了更好的描述结合位点序列的模式,科学家们提出了motif的概念。

motif表示特定碱基序列的模式,这种教科书式的名词解释不够直观难以理解,下面通过一个示例来看下

怎样进行motif分析

上图表示的是一个转录因子在多个基因上的结合位点的序列,在采用motif描述上面这段信息时,具体用到以下几个元素

1.  碱基频率分布

上述示例中结合位点的序列长度为12bp, 每个位置4种碱基的频数统计如下

怎样进行motif分析

2.  consensus sequences

用一段序列来描述所有序列的碱基组成,称之为一致性序列,采用IUPAC标准的碱基表示法,不同字母对应的碱基如下所示

怎样进行motif分析

上述例子中的一致性序列如下

怎样进行motif分析

3. sequence logo

为了更加直观的描述motif, 结合所有序列中的碱基分布情况和一致性序列的特征,提出了sequence logo的表示方法,
上述例子中的碱基分布频数绘图如下

怎样进行motif分析

类似每个位置上碱基分布频数的堆积柱状图,而sequence logo则采用以下公式来计算位置碱基的高度

怎样进行motif分析

上述公式中的最大值为2,对应所有序列中该位置都是同一个碱基,比如示例中的第5个位置全部都是T碱基。通过这种表示方法,可以突出碱基的分布情况,示意如下

怎样进行motif分析

可以非常明显的看到,在第5,8,9三个位置上都只出现了T碱基。其他位置都是几种碱基混合出现,总的高度都比这里这些位置低很多。值得一提的是,之前我们说单一碱基最大值为2,而上图中单一碱基的位置比2小了一点,这是因为在原始公式的基础上进行了微调,详细情况如下

怎样进行motif分析
怎样进行motif分析
怎样进行motif分析

在原始公式的基础上减去了一个e值,在e值的计算公式中,对于DNA序列,s的值为4,n代表的是motif的长度,上述示例中就是12。减去e值后,最大值相比2自然会小一点。

有很多的软件可以进行motif分析,比如meme-chip, homer等。

关于怎样进行motif分析就分享到这里啦,希望上述内容能够让大家有所提升。如果想要学习更多知识,请大家多多留意小编的更新。谢谢大家关注一下创新互联网站!


分享文章:怎样进行motif分析
标题网址:http://wjwzjz.com/article/ijsije.html
在线咨询
服务热线
服务热线:028-86922220
TOP