油茶EST-SSR种间比较分析毕业论文

 2021-04-12 11:04

摘 要

本研究通过分析山茶属物种的微卫星分布特点,为油茶SSR标记开发提供生物信息学基础。通过对油茶基因组、转录组及短柱茶、浙江红山茶转录组序列进行分析比较,我们获得以下结论:

(1)、油茶基因组、转录组及短柱茶、浙江红山茶转录组以及NCBI数据库中现有的茶叶的EST序列,得到的结果均表现为二核苷酸最为常见,其次为三核苷酸重复类型,六核苷酸居第三位,同时,数据显示3种油茶转录组序列中,三核苷酸重复基元所占总数的比例均高于油茶基因组的。此外,四种序列的二核苷酸重复基元类型中均以(AG/GA/CT/TC)n类型为最多,而(AC/CA/GT/TG)n相对稀少,采用相同方法检索茶叶的结果与其相似。

(2)、利用Escan软件对油茶3物种转录组中微卫星在Unigene上的分布进行归类,结果显示微卫星重复基元在总的分布比例上,3'UTRgt;CDSgt;5'UTR,总的来说UTR区域的微卫星含量要大大高于CDS区域;此外,对Unigene上的不同类型重复基元进行统计的结果显示,UTR区域的二核苷酸重复基元数量占比例最高,而CDS区域内三核苷酸重复基元的比例远远高于UTR区域。

关键词:油茶,微卫星,丰度,重复基元,分布

Abstract

In this study, we analyzed the distribution characteristics of microsatellite in Camellia species. This job provides a foundation for developing SSR markers.By comparing the genome of C.oleifera,and the transcriptomes of C.oleifera, C.chekiangoleosa Hu and C.brevistyla,following conclusions are obtained:

(1)Dinueleotide repeat is the dominant motif and then is trinueleotide repeat among the EST-SSR loci in the genome and transcriptome sequences as well as the Camellia EST sequences in GenBank. In all the transcriptomes, the percentage of Trinucleotide repeat is higher than that in the C.oleifera genome sequences.Besides, for Dinueleotide repeat, AG/GA/CT/TC are the most abundant motif and AC/CA/GT/TG are much more less.

(2)Via the Estcan software, we classified the distribution of transcriptome microsatellite in Unigene .The results showed that the proportion of the microsatellite repeat motifs is 3'UTRgt;CDSgt;5'UTR. In general, the content of microsatellite in UTR is more than in CDS. According to the statistical result of repeat motifs in Unigene, dinucleotide repeat motif is most abundant in UTR. However, the amount of Trinucleotide repeat motif in CDS is significant more than that in UTR.

Key words: C. oleifera,microsatellite,abundance,repeat motif,distribution

目录

1文献综述 - 3 -

1.1微卫星概述 - 3 -

1.2 微卫星信息挖掘 - 3 -

1.2.1 常用的微卫星挖掘工具 - 3 -

1.2.2 微卫星重复基元的频率和分布 - 5 -

1.2.3 微卫星重复基元的长度和丰度 - 6 -

1.3从基因序列中挖掘微卫星的研究进展 - 7 -

1.4 SSR标记开发的研究进展 - 8 -

1.5 本论文研究的目的 - 9 -

2材料与方法 - 9 -

2.1油茶三物种转录组序列及基因组来源 - 9 -

2.2微卫星重复序列的挖掘与统计 - 9 -

3结果与分析 - 11 -

3.1油茶454序列微卫星分布的基本特征 - 11 -

3.2三种油茶转录组序列的长度变异分析 - 14 -

3.3三种油茶转录组序列的长度分布分析 - 15 -

3.4油茶三物种转录组微卫星的编码区域分布分析 18

4讨论 19

4.1微卫星重复基元类型、分布特点及频率 20

4.2微卫星的功能及在基因组的分布区域 21

5.参考文献 - 22 -

1文献综述

1.1微卫星概述

简单序列重复(SSR,Simple Sequence Repeat),也称为微卫星DNA(microsatellite DNA),或者也可称为短串联重复(short tandem repeat,STR),是一类由1-6个碱基组成的基序串联重复而成的DNA序列。真核生物中,微卫星广泛分布在整个基因组的不同位置,大约每隔10-50kb就存在一个微卫星位点。因其微卫星中重复单位的数目存在高度变异,这些变异表现为微卫星数目的整倍性变异或重复单位序列中的序列有可能不完全相同,因而造成多个位点的多态性。微卫星两侧序列的保守性使其可作为特异扩增该位点的引物的设计模板,为PCR扩增检测该位点的多态性信息提供了理论依据。在最近的几十年中,微卫星已经成为最流行的遗传标记资源,SSR标记作为一种有效的分子标记已被广泛应用于遗传多样性分析、遗传图谱的构建、目标基因的标定、指纹图的绘制等许多研究领域,被称为第二代分子标记技术,且有逐渐取代RFLP标记的趋势。

SSR标记按照开发序列的来源,通常将SSR标记分为两大类,基因组SSR和EST-SSR。其具有以下一些优点:(1)微卫星以孟德尔方式遗传,呈共显性,故可鉴别杂合子和纯合子;(2)一般检测到的是一个单一多等位基因位点,提供的信息量高;(3)数量丰富,覆盖整个基因组,揭示的多态性高;(4)所需DNA量少,对模板质量要求不高;用微卫星标记进行基因定位的结果可直接用于作物分子育种。(5)操作简便快速、稳定可靠且费用低廉;(6)每个位点由设计的引物顺序决定,便于不同的实验室相互交流合作开发引物。由于上述原因,SSR标记的缺点也显而易见:它必须针对每个物种染色体上的微卫星,开发特定的引物。故而,开发SSR标记的前提是要知道重复序列两侧的DNA序列,所以在DNA序列中找寻微卫星,并在其两侧翼序列设计引物就成为SSR分析的关键所在。

1.2 微卫星信息挖掘

1.2.1 常用的微卫星挖掘工具

人们最初通过规律性匹配的方法和BLASTN工具来查找公开的EST和基因组序列(FASTA和BLAST2格式)上的SSRs。随后,一些perl语言编写的脚本,搜索模块和程序被开发出来以用于寻找序列文件中的SSRs。因为许多植物物种的基因组序列有限,所以EST数据库被开始用于开发SSRs,在一些公开的软件中(表1),MISA凭借在EST的质量控制和EST-SSR设计引物方面拥有许多有用的功能而被一些实验室运用在研究中。另一种SSR搜索软件叫Sputnik,它能够允许使用者指定SSR的不完善程度,而且他输出的数据能和Primer3关联。

随着GenBank、DDBJ和EMBL等公共数据库的出现提供了大量的DNA序列数据,通过对大量EST数据进行SSR分析,可以估测SSR分子标记出现的频率和分布特征,因此开发出了许多相关的软件(表1)。如GRAMENE网站提供的用perl脚本编写的SSRIT.Pl(Temnykh S,2001)和华盛顿大学Abajian博士用C语言开发的Sputnik(Dieringer D, 2003)软件等。这些程序都是为了找出SSR标记的重复类型和位置,但不能满足对SSR分子标记进行设计引物等更深入研究的需要,也不能用于统计分析大量EST数据中的SSR分子标记。为了满足从EST数据中进行大规模SSR标记开发的需求,又有很多学者进一步开发出了其它可在本地计算机上使用的软件,如用java语言开发的SSRFinder以及应用perl脚本写成的软件MISA(Thiel T,Michalek W,2003),但由于其均为基于命令行的软件,缺少友好的界面,而限制了其使用(孙佳莹等,2008;孙佳莹等,2006)。

您需要先支付 80元 才能查看全部内容!立即支付

课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找,优先添加企业微信。