从事生物信息学方面的研究利用了有生产力的CS方面的技术来研究生物领域的内容。
当研究基因和蛋白质时,常常涉及到专有名词——序列比对。
何为序列比对呢?
蛋白质和基因相关性分析可以通过基因比对来完成,当完成对多个物种的基因组测序后,一个重要的工作是找到特定物种内和物种之间的蛋白质或核酸在进化中的相关性。
蛋白质序列比对和DNA的有何差异,如何选择呢?
蛋白质比对通常比DNA包含更丰富的信息:
1.由于DNA的遗传密码的简并性,尤其是密码子的第三个位点的变化,不会改变其所编码的氨基酸。
2.很多氨基酸有类似的生物物理性质——如赖精组、谷氨酸和天冬氨酸的相似的酸碱性。对于蛋白质比对,可以设计打分系统来确定相关氨基酸之间的相似度和相关关系。、
同源序列为生物进化中的核心概念:如果两个基因或者蛋白质由一个共同的祖先进化而来,那么这两个基因或蛋白质是同源的。
从这个角度看,比对蛋白质序列可以发现同源序列,而比对蛋白对应的DNA序列无法做到。
但是,在一些情况下,比对核苷酸序列更合适:
如在确定给定DNA序列和DNA数据库中序列的一致性时;在搜索多态性时;在分析所克隆的DNA序列的一致性时;在比较调控区域时等,核苷酸的比较就显得比较重要。
但是,通过BLAST搜索等,DNA和蛋白质的转换是很方便的,因此二者之间可以比较方便地关联起来。
欢迎关注无神一起学习AI以及生信方面较为核心的知识。
觉得有用的话请给个点赞收藏加关注哦!