基因序列是什么


基因序列是什么

文章插图
基因序列就是使用一串字母表示的真实的或者假设的携带基因信息的DNA分子的一级结构 。
【基因序列是什么】基因序列中的字母只有四种 , 即A、C、G、T , 分别代表组成DNA的四种核苷酸——腺嘌呤 , 胞嘧啶 , 鸟嘌呤 , 胸腺嘧啶 , 任意长度大于4的一串核苷酸被称做一个序列 , 每个字母代表一种碱基 , 两个碱基形成一个碱基对 , 碱基对的配对规律是固定的 , 即A-T , C-G 。
生物信息学的研究重点主要体现在基因组学和蛋白质学两方面,具体地说就是从核酸和蛋白质序列出发, 分析序列中表达结构和功能的生物信息。生物信息学的基本任务是对各种生物分析序列进行分析, 也就是研究新的计算机方法, 从大量的序列信息中获取基因结构、功能和进化等知识 。而在序列分析中, 将未知序列同已知序列进行相似性比较是一种强有力的研究手段,从序列的片段测定, 拼接, 基因的表达分析, 到RNA和蛋白质的结构功能预测 。物种亲缘树的构建都需要进行生物分子序列的相似性比较 。生物信息学中的序列比对算法的研究具有非常重要的理论意义和实践意义 。
基因组中由寡核苷酸串联,重复排列的DNA序列,构成数量可变的串联重复序列,其中,微卫星DNA又称为短串联重复片列 , 是一种可遗传的不稳定的且具有高度多态性的短核苷酸重复序列,具有种类多,分布广,高度多态性等特点,这种多态性标志已广泛用于遗传病及亲子鉴定等.
短序列比对中 , 一般常用的算法主要有三个:
(1) 空位种子片段索引法 , 首先将读段切分 , 并选取其中一段或几段作为种子建立搜索索引 , 再通过查找索引、延展匹配来实现读段定位 , 通过轮换种子考虑允许出现错配)的各种可能的位置组合;
无论在发育期还是在成人体内 , 既有大量的新细胞产生 , 也有大量的旧细胞死亡 , 这是生物体的一种自然现象 。为了维持机体组织中适宜的细胞数量 , 在细胞分裂和细胞死亡之间需要一种精确的动态平衡 。由于这种生成与死亡的有序流程 , 在胚胎和成人期便维持着人体组织的适宜细胞数量 。而这种精密地控制细胞的消亡过程就称为程序性细胞死亡 。正常的生命需要细胞分裂以产生新细胞 , 并且也要有细胞的死亡 , 由此人体和生物的器官才得以维持平衡 。