毛轩睿, 刘玉萍, 苏 旭,2,3,4*, 富 贵, 陈金元, 郑长远, 刘 涛,吕 婷, 张 雨, 胡夏宇, 杨 萍
(1. 青海师范大学生命科学学院, 青海 西宁 810008; 2. 青海师范大学高原科学与可持续发展研究院, 青海 西宁 810016;3. 青海师范大学青海省青藏高原药用动植物资源重点实验室, 青海 西宁 810008; 4. 青海师范大学青藏高原地表过程与生态保育教育部重点实验室, 青海 西宁 810008; 5. 青海师范大学地理科学学院, 青海 西宁 810008)
沙鞭(Psammochloavillosa)是禾本科(Poaceae)、沙鞭属(Psammochloa)的一种具长根状茎的多年生草本植物,主要分布在我国陕西、内蒙古、青海、甘肃、宁夏等地,通常生于海拔900~2 900 m的沙地和荒漠中[1-2]。沙鞭是一种良好的固沙植物,具有较强的耐旱、耐寒、耐碱、抗风沙和抗病能力[3]。此外,沙鞭富含高品质蛋白质,因而是畜牧业上重要的优良牧草[4]。目前,国内外学者对沙鞭的研究主要集中于形态特征[5-8]、生理特性[9-10]、细胞性状[11]、生态适应性[12-14]、遗传多样性[15]及种质资源收集[16]等领域。譬如,董鸣等[5]通过对根茎禾草沙鞭与赖草切断根茎生长状态的比较,发现沙鞭的克隆特性使其在干旱贫瘠环境中具有更强的生存能力;吕婷等[7]对沙鞭50个代表种群叶表皮微形态特征的观察,发现沙鞭种群叶表皮气孔密度随环境干旱程度增加而增加,认为这种结构有利于减少体内水分散失,是对荒漠环境的一种微观形态学解剖特征性适应;黄振英等[10]对沙鞭不同深度沙层中种子萌发情况和幼苗出土特性的研究,发现种子萌发率和幼苗出土率均随种子被埋深度增加而降低;王亚男等[11]通过对内蒙古高原6个沙鞭居群染色体核型的分析,发现染色体数目均为2n=2x=46,具正中部着丝粒、中部着丝粒、亚中部着丝粒和亚端部着丝粒染色体,核型类型为1A,2A,1B和2B型,核型对称性较高,进化程度较为原始;贺学礼等[13]通过探讨丛枝菌根(Arbuscularmycorrhiza,AM)真菌时间和空间分布及侵入群落间隔空地前后对沙鞭AM真菌的影响,发现沙鞭与AM真菌可形成良好的共生关系,沙鞭的克隆生长对土壤AM真菌的活动和时空分布有显著影响,AM真菌孢子密度和结构定殖率在沙鞭侵入群落间隔空地前后发生显著变化;吕婷[15-16]综合利用表型性状和DNA分子标记分析了沙鞭的遗传多样性及群体遗传结构,发现其表型多样性丰富,居群间遗传变异大于居群内,且居群间遗传分化显著。然而,目前尚未见关于沙鞭三代全长转录组简单重复序列(SSR)位点特征的研究报道。
简单重复序列(Simple sequence repeat,SSR)又称微卫星序列(microsatellite),是研究动植物基因遗传多样性的一种重要分子标记[17]。真核生物基因组中,SSR常由2~6个重复、均匀分布的核苷酸片段串联组成,具有操作简便、共显性遗性、多态性高、重复性好等优点[18]。近年来,SSR分子标记在植物系统进化[19]、遗传多样性[20-21]、群体遗传结构[21]及动态进化历史[22]等领域应用广泛。譬如,尹航等[19]从短芒大麦(Hordeumbrevisubulatum)214 676条Unigene序列中检测到24 877个SSR位点,成功设计20 802对引物,认为短芒大麦转录组SSR开发有较大可能性,为将来SSR分子标记开发、种质资源评价和辅助育种等提供了参考;李正玲等[20]利用SSR分子标记分析了河南省白麦、红和尚头、三月黄、白和尚头等15组相同名称地方小麦(Triticumaestivum)品种组间和组内的遗传多样性,发现小麦地方品种具有丰富的遗传多样性,相同名称地方小麦品种间有同名同质和同名异质存在;徐金青等[21]通过对青稞(Hordeumvulgare)转录组SSR位点特征的分析,发现其含有的SSR位点序列与生物基础代谢密切相关;王恒波等[22]利用MISA软件挖掘了甘蔗(Sacchrumspp.)的SSR位点,并分析了分布特征和多态性,发现甘蔗SSR位点单核苷酸重复基元中A/T占比最高,认为禾本科植物基因组富含A/T基元。据此,本研究采用MISA软件对沙鞭三代转录组全长序列SSR位点进行搜索,并分析其组成类型和分布特征,阐明沙鞭转录组中SSR位点特征,旨在为今后沙鞭SSR引物开发、遗传多样性分析和新基因挖掘等提供理论参考。
1 材料与方法1.1 试验材料
2018年,赴甘肃省武威市民勤县(103.65° N,39.17° E,海拔1 250 m)采集生长良好的沙鞭新鲜健康叶片,迅速用锡箔纸包裹后液氮中速冻,用于RNA提取和测序。凭证标本存放于中国科学院西北高原生物研究所青藏高原生物标本馆(HNWP)。
1.2 实验方法
1.2.1总RNA提取、建库及数据评估 采用改良的CTAB法[23-24]提取样品总RNA,经纯度和浓度检测合格后等物质的量混合,采用PacBio Sequel测序平台进行全长转录组测序、文库构建和数据评估。原始数据下机后利用SMRTlink软件获得Subreads序列,对其校正后产生环形一致性序列即CCS;根据CCS是否含有3′和5′引物及PloyA特征,将其划分为全长序列(FL,Full length)和非全长序列(NFL,Non-full length),并分类找出全长非嵌合序列(FLNC,Full-length non-chimeric);采用同种类型聚类法(ICE,Iterative isoform-clustering)将相似的FLNC序列聚成一簇,得到Cluster,每个Cluster获得一条一致性序列,结合非全长序列对其进行校对(Polishing),筛选得到高质量序列用于后续分析。
1.2.2转录组SSR微卫星序列搜索和筛选 使用MISA(Microsatellite identification tool)软件检测转录本Unigene序列中的SSR位点[25],获得单核苷酸(Mononucleotide)、二核苷酸(Dinucleotide)、三核苷酸(Trinucleotide)、四核苷酸(Tetranucleotide)、五核苷酸(Pentanucleotide)和六核苷酸重复(Hexanucleotide)及复合型SSR位点(Number of composite SSR loci)序列;对SSR位点检测以“单碱基重复10次及以上,二碱基重复6次及以上,三碱基、四碱基、五碱基和六碱基重复5次及以上”为筛选标准,当2个SSR间距离小于100 bp时组合成1个复合微卫星。
1.2.3转录组SSR引物设计 基于上述筛选的SSR位点信息,采用Primer3软件批量设计PCR扩增引物,并对引物进行筛选,即二碱基重复次数10次以上,三碱基、四碱基、五碱基、六碱基重复次数6次以上,GC含量40%~60%,退火温度(Tm)50~65℃,3′端最后5个碱基至少含一个G或C(不超过3个),引物长度17~28 bp(小于30 bp),上游和下游引物Tm差值≤5℃,预计扩增产物长度介于150~350 bp。
1.2.4含SSR位点Unigene序列的KOG和GO功能分类 运用BlastX软件将沙鞭转录组中含SSR位点的Unigenes序列比对到NR蛋白(Non-redundant protein database)和KOG数据库(Eukaryotic ortholog groups);采用Blast2GO软件和WEGO在线平台(https://wego.genomics.cn/)对NR注释到的Unigene序列进行注释信息分析和GO功能富集分类,并分析其功能分布特征。
2 结果与分析2.1 转录组中SSR分布和特征
通过对去冗余沙鞭转录组数据的统计,本研究共得到184 076条Unigenes,平均和总长度分别为2 461 bp和453 051 607 bp;运用MISA软件搜索到分布于56 824条Unigenes上的93 563个SSR重复序列,SSR发生频率(含SSR位点Unigene数占Unigene总数比例)为30.87%、出现频率(SSR位点数占Unigene总数比例)为50.83%;转录组的Unigene序列平均每4 842 bp出现一个SSR位点,有17 120个Unigenes包含1个以上SSR位点,复合型SSR位点有9 198个(表1),说明沙鞭转录组SSR位点信息分布广且丰富。
表1 沙鞭转录组SSR分布及特征Table 1 The distribution and characteristics of SSR loci in transcriptomes of Psammochloa villosa
2.2 转录组SSR重复类型
本研究结果表明,沙鞭转录组SSR重复类型较为丰富,单核苷酸至六核苷酸重复均有呈现,各重复类型数目差异较大,但以单核苷酸至三核苷酸重复为主,占总SSR位点的98.06%(表2)。其中,单核苷酸重复最多(50 027),占比53.47%,总长度为510 241 bp,平均每9 060 bp核苷酸出现一个单核苷酸重复序列;三核苷酸次之(26 112),占比27.91%,总长度为376 377 bp,平均每17 350 bp有一个三核苷酸重复序列;二核苷酸最少(15 609),占比16.68%,总长度为204 198 bp,平均每29 030 bp出现一个二核苷酸重复序列;四、五、六核苷酸重复序列类型极少,仅占1.94%,其中五核苷酸重复仅有317,占比仅为0.34%。此外,重复类型不同的SSR位点,出现频率也存在较大差异,单核苷酸重复类型至六核苷酸重复类型的SSR出现频率依次为27.18%,8.48%,14.19%,0.56%,0.17%和0.25%,其中单核苷酸重复类型的SSR出现频率最高,每100条Unigene含SSR位点数高达27.18个,五核苷酸重复类型的SSR出现频率最低,每100条Unigene仅含0.17个SSR位点。
表2 沙鞭转录组SSR位点重复类型、数量及分布Table 2 The repeating type,number,and distribution of SSR loci in transcriptomes of Psammochloa villosa
2.3 转录组SSR基元类型分析
沙鞭转录组SSR基元类型分析结果表明,SSR重复基元类型有168个,不同重复次数形成的SSR位点数93 563个(图1和表3)。其中,单核苷酸重复有2种基元类型,(A/T)n基元类型为主要类型,形成39 544个SSR位点,占同类基元SSR位点的79.05%,为总SSR位点的42.26%;二核苷酸重复有4种基元类型,优势基元类型为(AG/CT)n,形成8 691个SSR位点(59.68%,9.29%);三核苷酸重复有10种基元类型,基元类型中SSR位点最多的是(CCG/CGG)n,形成9 175个SSR位点(35.14%,9.81%),其次为(AGC/CTG)n(22.7%,6.33%),形成5 927个SSR位点,(AGG/CCT)n基元类型形成SSR位点最少,形成4 129个SSR位点(15.81%,4.41%);四核苷酸重复有31种基元类型,形成SSR位点较多的基元类型依次为(AGCG/CGCT)n,(ATCC/ATGG)n,(ACGC/CGTG)n,分别含有256(24.85%,0.27%)、163(15.83%,0.17%)和118(11.46%,0.13%)个SSR位点;五核苷酸重复有42种基元类型,SSR位点形成较多的基元类型依次为(AGAGG/CCTCT)n,(AGGGG/CCCCT)n和(ACTCG/AGTCG)n,分别形成60(18.93%,0.06%),27(8.52%,0.03%)和25(7.89%,0.03%)个SSR位点;六核苷酸重有基元类型79种,形成SSR位点较多的基元类型依次为(ACCAGC/CTGGTG)n,(AGGCGG/CCGCCT)n,(AC-AGCC/CTGTGG)n,(ACGGCG/CCGTCG)n,(AGA-GGG/CCCTCT)n和(ACCGCC/CGGTGG)n,分别形成104(22.22%,0.11%),36(7.69%,0.04%),27(5.77%,0.03%),18(3.85%,0.02%),18(3.85%,0.02%)和17(3.63%,0.02%)个SSR位点。
本研究结果还显示,不同基元类型的SSR位点数差异较大,单核苷酸重复中(A/T)n基元的SSR发生频率最高为21.48%;30个基元类型形成的SSR位点发生频率最低,仅含1个SSR序列,其中四核苷酸基元2个、五核苷酸基元5个、六核苷酸基元23个。从基元数量分布看,沙鞭转录组SSR基元类型随SSR基元碱基数增加而增加,而SSR位点数则随基元碱基数增加而下降(图1和表3)。
图1 沙鞭转录组不同重复类型优势基元SSR位点数分布Fig.1 The quantitative distribution of SSR loci of preponderant motifs in different repeat types of transcriptomes of Psammochloa villosa
表3 沙鞭转录组不同重复基元SSR位点数及频率Table 3 The quantities and frequencies of different motif SSR loci in transcriptomes of Psammochloa villosa
续表3
2.4 转录组SSR基元重复次数分析
SSR基元重复次数分析,发现5次重复基元出现频率最高,共16 553个,占总SSR位点数的17.69%,其次为10次重复(14.58%),6次重复(11.68%)和11次重复(7.58%);SSR位点重复5~10次的有52 747个,占56.38%,重复11~20次的有26 315个,占28.13%,重复21~30次的有6 938个,占7.42%,重复31~40次的有2 209个,占2.36%,重复41~50的有1 349个,占1.44%,重复51~60次的有938个,占1.00%;SSR数量随重复次数增加而降低,未呈现于图中的四碱基、五碱基和六碱基重复也具有相同的趋势,随重复次数增多而降低(图2)。
图2 沙鞭转录组中SSR基元重复次数Fig.2 Repeat times of SSR motifs in transcriptomes of Psammochloa villosa
SSR基元重复次数类型分布分析,发现沙鞭转录组中不同重复次数形成的SSR位点随基元序列长度呈现较大差异;不同基元类型构成的SSR位点中,重复次数最小的最多,随基元序列长度增长,重复次数类型总体呈现下降趋势(表4)。单核苷酸重复次数类型分布最广,介于10~40,有60种类型,不同重复次数类型形成的SSR位点数量差异较大,其中最小重复次数(10次)形成的SSR位点占比最高,占所有单核苷酸SSR序列的24.56%,最大重复次数(40次)占所有单核苷酸SSR序列的0.34%,有171个SSR位点;而重复次数类型最少的五核苷酸则介于5~8,有16种,其中5次为最小重复次数,形成最多的SSR位点(255个),占五核苷酸重复序列总SSR位点的79.50%,最大重复次数为8次,形成3个SSR位点,占比1.19%。重复次数介于10~40基元重复次数类型详见表4。
表4 沙鞭转录组SSR基元重复次数统计Table 4 The statistics of repetition times for SSR motifs in transcriptomes of Psammochloa villosa
2.5 转录组不同基元类型SSR位点长度分析
沙鞭转录组不同基元SSR位点长度统计分析,发现不同类型基元SSR位点包含的长度类型不同,但主要集中于12~36 bp,二核苷酸至六核苷酸在此长度范围内共包含43 085个SSR位点,占统计SSR位点的98.98%(统计重复次数5~40 SSR数量,位点总数为43 531),且SSR位点长度与数目呈负相关(图3和表5)。三核苷酸基元构成的SSR位点长度在12~36 bp数量最多,为26 051个,占三核苷酸SSR位点总数的99.77%;二核苷酸次之(15 250个,97.73%);五核苷酸最少(314个,99.05%);四核苷酸和六核苷酸分别为1 028个(99.81%)和442个(94.44%)。
图3 沙鞭转录组不同基元类型SSR位点统计Fig.3 The statistics of different motif SSR loci in transcriptomes of Psammochloa villosa
表5 沙鞭不同基元和重复次数SSR位点长度分析Table 5 Statistics of the length of different motifs and repetition time SSR loci of Psammochloa villosa
2.6 转录组SSR引物设计
本研究采用Primer3软件批量设计SSR引物,共设计43 620对引物,基于自动和人工筛选得到31对符合要求的引物,其中二碱基重复引物11对、三碱基重复引物19对、四碱基重复引物1对,预计扩增产物长度为173~277 bp(表6)。
表6 31对SSR引物信息Table 6 Information of 31 pairs of SSR primers
续表6
2.7 转录组中含SSR的Unigene功能注释及分类
通过对56 824条含SSR的Unigenes的GO和KOG功能注释,本研究发现KOG注释将29 444条Unigenes归为24类(图4),且含SSR的基因序列功能丰富。其中,翻译后修饰、蛋白质周转、分子伴侣功能类占比最大,有3 757个Unigenes,占KOG注释Unigenes总数的12.76%;其次是一般功能预测(3 511,11.92%)和信号转导机制(3 468,11.78%);细胞外结构占比最少,仅有9个Unigenes,占比0.03%。GO注释将10 864个Unigenes归为细胞组成(Cellular component)、分子功能(Molecular function)和生物学过程(Biological process)的41个功能类群(图5),其中主要功能类群为结合、催化活性、代谢过程、细胞过程、细胞和细胞组分。
图4 沙鞭转录组含SSR位点的Unigene序列KOG功能分类Fig.4 KOG functional classification of unigenes containing SSR loci in transcriptomes of Psammochloa villosa注:1-核糖核酸处理和修饰;2-碳水化合物运输和代谢;3-能量生产和转换;4-细胞周期控制、细胞分裂、染色体分割;5-氨基酸运输和代谢;6-核苷酸转运和代谢;7-辅酶运输和代谢;8-脂质运输和代谢;9-翻译、核糖体结构和生物合成;10-转录;11-复制、重组和修复;12-细胞壁,膜,包膜生物发生;13-细胞运动;14-翻译后修饰、蛋白质周转、分子伴侣;15-无机离子转运和代谢;16-次级代谢物生物合成、转运和分解代谢;17-一般功能预测;18-未知功能;19-信号转导机制;20-细胞内运输、分泌和囊泡转运;21-防御机制;22-细胞外结构;23-核结构;24-细胞骨架Note:1-RNA processing and modification;2-Carbohydrate transport and metabolism;3-Energy production and conversion;4-Cell cycle control,cell division,chromosome partitioning;5-Amino acid transport and metabolism;6-Nucleotide transport and metabolism;7-Coenzyme transport and metabolism;8-Lipid transport and metabolism;9-Translation,ribosomal structure and biogenesis;10-Transcription;11-Replication,recombination and repair;12-Cell wall/membrane/envelope biogenesis;13-Cell motility;14-Posttranslational modification,protein turnover,chaperones;15-Inorganic ion transport and metabolism;16-Secondary metabolites biosynthesis,transport and catabolism;17-General function prediction only;18-Function unknown;19-Signal transduction mechanisms;20-Intracellular trafficking,secretion,and vesicular transport;21-Defense mechanisms;22-Extracellular structures;23-Nuclear structure;24-Cytoskeleton
图5 沙鞭转录组含SSR位点的Unigene序列GO功能分类Fig.5 GO functional classification of unigenes containing SSR loci in transcriptomes of Psammochloa villosa注:1-细胞;2-细胞成分;3-细胞器;4-膜;5-膜成分;6-细胞器成分;7-蛋白质复合物;8-超分子复合物;9-膜封闭腔;10-细胞外组分;11-拟核;12-催化活性;13-转运蛋白活性;14-结合;15-分子传感器活性;16-抗氧化活性;17-分子功能调节器;18-结构分子活性;19-转录调节活性;20-过时信号传感器活动;21-定位;22-生物调节;23-代谢过程;24-细胞过程;25-发育过程;26-多细胞生物过程;27-生殖过程;28-繁殖;29-生物过程的调节;30-多生物体过程;31-生物过程的负调控;32-应激反应;33-信号;34-免疫系统过程;35-生物过程的正调控;36-生长;37-细胞成分组织或生物发生;38-节律过程;39-碳利用;40-移动;41-细胞增殖Note:1-cell;2-cell part;3-organelle;4-membrane;5-membrane part;6-organelle part;7-protein-containing complex;8-supramolecular complex;9-membrane-enclosed lumen;10-extracellular region;11-nucleoid;12-catalytic activity;13-transprter activity;14-binding;15-molecular transducer activity;16-antioxidant activity;17-molecular function regulator;18-structural molecule activity;19-transcription regulator activity;20-obsolete signal transducer activity;21-localization;22-biological regulation;23-metabolic process;24-cellular process;25-developmental process;26-multicellular organismal process;27-reproductive process;28-reproduction;29-regulation of biological process;30-multi-organism process;31-negative regulation of biological process;32-response o stimulus;33-signaling;34-immune system process;35-positive regulation of biological process;36-growth;37-cellular component organization or biogenesis;38-rhythmic process;39-carbon utilization;40-locomotion;41-cell proliferation
3 讨论
先前研究表明,三代全长转录组测序技术无需打断和组装,具有测序读长长,能直接读取反转录全长cDNA等[26],尤其能有效获取高质量单个RNA分子的全部序列,精准得到mRNA的同源异构体、单碱基变异、可变剪接、同源基因和等位基因等信息,因而现已成为DNA测序技术未来发展的主要方向[27]。本研究基于PacBio Sequel测序平台,获得沙鞭的全长转录组含184 076条Unigene序列,去冗余后得到93 563个SSR重复序列,其分布于56 824条Unigene序列上,SSR发生频率为30.87%。徐金青等[21]通过对青稞转录组9 576条Unigene序列分析,发现SSR位点11 930个,发生频率为16.49%;王恒波等[22]在甘蔗中发现27 241个SSR位点,平均每1.08个基因出现一个SSR位点,发生频率为14.02%;朱永群等[27]通过对禾本科牧草苏丹草(Sorghumsudanense)转录组数据的综合分析,发现SSR位点发生频率为16.82%,这些结果显著低于本研究中SSR位点的发生频率,因此我们认为沙鞭转录组中SSR位点的发生频率较高,位点数量丰富,具有较高的开发潜能。
沙鞭转录组含有丰富的SSR重复类型,单核苷酸至六核苷酸重复均存在,以单核苷酸、二核苷酸及三核苷酸重复为主,其占总SSR位点的98.06%,其中以单核苷酸重复最多(50 027,53.47%)。王恒波等[22]通过对甘蔗转录组SSR重复类型的分析,发现其以单核苷酸、二核苷酸和三核苷酸重复为主要的SSR重复类型,占比分别为40.67%、11.97%和23.67%,这与本研究结果基本一致,尤其绝大多数模式植物如拟南芥(Arabidopsisthaliana)[29]、棉花(Gossypiumspp.)[30]和水稻(Oyrzasativa)[29]中也获得类似结论,从而进一步说明本研究的结果是准确和合理的。同时,本研究显示沙鞭转录组含有168个SSR重复基元类型,不同重复次数下形成的SSR位点数共93 563个;基元类型随SSR基元碱基数增加而增加,SSR位点数随SSR基元碱基数增加而降低。其中,单核苷酸重复的2种基元类型中(A/T)n占绝对优势,形成39 544个SSR位点,占同类基元SSR位点的79.05%,占总SSR位点的42.26%。先前研究表明,高粱(Sorghumbicolor)[31](65.60%)、水稻[31](64.40%)和甘蔗[22](84.78%)等3种禾本科植物转录组中单核苷酸重复基元也是(A/T)n占优势,据此我们认为沙鞭转录组中SSR基元应具有某种碱基偏好性,富含(A/T)n基元类型可能是禾本科植物的共同特点。二核苷酸重复有4种类型,(AG/CT)n为优势基元类型;三核苷酸重复有10种基元类型,优势基元类型为(CCG/CGG)n、(AGC/CTG)n和(AGG/CCT)n,这与青稞转录组中SSR以(AG/CT)n[21]为优势基元、玉米(Zeamays)[32]中以(CCG/CGG)n和(AGG/CCT)n为优势基元相同,这也得到先前诸多学者[30]认为大多数单子叶植物转录组中二核苷酸和三核苷酸的优势重复基元分别为(AG/CT)n和(CCG/CGG)n观点的证实。此外,沙鞭SSR不同基元长度和重复次数类型分布分析,我们发现沙鞭转录组中SSR长度主要集中于12~36 bp,长度≥20 bp的SSR序列共20 364个,占统计总数的23.09%,12~20 bp的占统计总数的55.82%,其与SSR位点数目呈负相关;随SSR基元序列长度增加,重复次数类型总体呈下降趋势,显然沙鞭SSR具有较高的多态性,因此SSR分子标记具有较高的开发价值和潜能。
另外,本研究基于转录组数据筛选出31对符合要求的SSR引物;同时,对含SSR的Unigene序列进行了生物功能分析,结果发现其功能主要集中于翻译后修饰、蛋白质周转、催化活性和代谢过程,翻译后修饰是植物细胞快速响应外界环境过程的重要生物学过程,通过将磷酸基、甲硫氨酸等多样化基团共价连接到靶蛋白上,来调节靶蛋白的活性和定位,控制靶蛋白与其它蛋白间的相互作用,致使靶蛋白质具有更加复杂和完善的结构与功能,从而提高植物的耐逆性;植物蛋白质周转也是外界胁迫条件下植物维持自身正常新陈代谢和生物功能的必要条件。由此看来,研究沙鞭转录组中功能性SSR不仅可为其耐逆适应性研究提供参考数据,而且也可为新基因开发提供理论支撑。
4 结论
本研究获得沙鞭93 563个SSR重复序列,发生频率为30.87%,SSR位点数量丰富,表现出较高的多态性潜能;转录组中单核苷酸重复以(A/T)n为优势基元,可能与碱基偏好性有关;含SSR的Unigene功能主要集中于翻译后修饰、蛋白质周转、分子伴侣、结合、催化活性、代谢过程等,推测与沙鞭有较强耐逆性有关。本研究认为进行沙鞭转录组SSR位点特征分析可为将来沙鞭SSR引物开发、遗传多样性与亲缘关系探讨乃至新基因发现等提供重要参考依据。