利用转录组数据获取岷县龙胆叶绿体基因组序列的方法

导航：龙图腾网> 最新专利技术> 利用转录组数据获取岷县龙胆叶绿体基因组序列的方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：中国科学院西北高原生物研究所

摘要：本发明公开了一种利用转录组数据获取岷县龙胆叶绿体基因组序列的方法，通过二代测序技术获得岷县龙胆的转录组测序原始数据，经过过滤以及与已知的龙胆属叶绿体基因组进行比对，筛出叶绿体基因reads，将筛出的reads组装成叠连群，其后将叠连群建成本地比对数据库，与参考序列比对，根据比对结果排序和拼接，每拼接5—6kb，将新组装的序列与其它叶绿体基因组序列进行比对，以检查所拼接的序列，最后根据首尾的重叠区将序列组装成环，再通过PCR和一代测序技术填补其中的间隙，最终获得岷县龙胆的叶绿体基因组序列。本发明有利于了解岷县龙胆叶绿体基因组结构等重要信息，也进一步地开发了转录组数据的价值。

主权项：1.利用转录组数据获取岷县龙胆叶绿体基因组序列的方法，其特征在于，包括以下步骤：利用高通量测序技术对岷县龙胆叶片的转录组样品进行测序，获得原始数据；过滤掉低质量数据，从而获得转录组的有效数据；从有效数据中筛选出能定位到参考叶绿体基因组上的机读序列（reads）；组装所获得的reads，构建叠连群（contigs）；根据参考叶绿体基因组对叠连群进行排序以及进一步的拼接和组装；每拼接5—6kb，将新拼接的序列已知的众多序列进行blast比对，以检查所拼接的序列；合并首尾序列的重叠部分，获得环状序列；根据所存在的间隙（gap）两端序列设计引物对gap进行PCR，通过末端终止测序法（即一代测序）获得gap区序列以填补gap，从而获得完整的叶绿体基因组序列。

全文数据：利用转录组数据获取岷县龙胆叶绿体基因组序列的方法技术领域本发明涉及生物科学领域，具体涉及利用转录组数据获取岷县龙胆叶绿体基因组序列的方法。背景技术获取叶绿体基因组序列对研究绿色植物的光合作用等能量代谢过程以及研究物种的系统发育等有重要意义；目前常用的获取叶绿体基因组序列的方法有三种：①提取纯净的叶绿体DNA，然后通过测序获得，该方法对实验材料要求较高且实验难度大，②利用通用引物通过长片段PCR方法将植物总DNA中的叶绿体DNA扩增出来，然后通过测序获得，但该方法所用的引物往往不具有广泛的通用性，导致许多植物类群的叶绿体DNA并不能完整扩增，③直接对植物总DNA进行测序，然后通过生物信息学的方法将其中的叶绿体DNA筛选出来，然后通过拼接组装获得，然而该方法的测序结果中，非叶绿体DNA（核DNA和线粒体DNA）序列往往会占据极大部分的数据量，导致实验成本偏高。转录组在细胞表型和功能、基因结构、基因功能、基因表达以及分子标记开发等领域有重要研究价值，因而在过去的相关研究工作中产生了大量的植物转录组数据；中国科学院昆明植物研究所的高立志研究组研究表明，植物的整个叶绿体基因组能发生全转录；如果能从转录组数据中将来自叶绿体的RNA序列全部筛选出来，然后经过拼接组装形成全转录组闭合环状序列，该闭合环状序列即可代表相应物种的叶绿体基因组序列，这必然可以让我们获得叶绿体基因组的大量信息，也可以进一步的发掘转录组数据的价值。发明内容针对现有技术的不足之处以及现在已经存在大量转录组数据的事实，本发明旨在提供一种充分发掘转录组数据价值以及获得叶绿体基因组序列的方法。本发明方法具体通过以下技术方案实现：利用转录组数据获取岷县龙胆叶绿体基因组序列的方法，包括以下步骤：1）利用高通量测序技术对相应植物叶片的转录组样品进行测序；2）过滤掉冗余的、不理想的与非目标数据，从而获得转录组的有效数据（cleandata）；3）从cleandata中筛选出能定位到参考叶绿体基因组上的reads；4）组装步骤（3）所获得的reads，构建叠连群（contigs）；5）根据参考基因组对叠连群进行排序以及进一步的拼接和组装；6）每拼接5—6kb则将新拼接的序列与已知的核酸序列进行blast，以检查所拼接的序列；7）合并首尾序列的重叠部分，获得环状序列；8）如果存在间隙（gaps），则根据gaps两端序列设计引物对gap进行PCR，通过一代测序法获得gap区序列以填补gap，从而获得完整的叶绿体基因组序列；进一步的，步骤（3）选取选取与样本物种亲缘关系近的物种的叶绿体基因组序列作为参考叶绿体基因组序列。本发明避免了叶绿体基因组的分离与纯化以及长片段PCR等实验操作，直接利用转录组的高通量测序数据进行组装以获得完整的叶绿体基因组序列；本发明所用的组装、检测与填补gap的方法使所获得的叶绿体DNA序列形成完整的闭环结构，并可判断所获得序列的质量；本发明不鼓励测得转录组序列仅用于叶绿体基因组序列的发掘。具体实施方式利用转录组数据获取岷县龙胆叶绿体基因组的序列的方法，包括以下步骤:1岷县龙胆的转录组在illumina的hiseq2500miseq平台上完成测序，采用双末端模式建库测序，获得原始数据（rawdata）；2利用SolwxaQA过滤掉低质量数据，从而获得转录组的有效数据（cleandata）；3从cleandata中筛选出能定位到参考叶绿体基因组上的reads；4使用SOAPdenovo软件组装所获得的reads，构建叠连群（contigs）；5根据参考基因组，借助BioEdit软件的本地比对（localblast）功能对叠连群进行排序以及进一步的拼接和组装；6每拼接5—6kb，利用NCBI网站上的BLAST工具将新拼接的序列与NCBI的所有序列进行blast，以检查所拼接的序列；7合并首尾序列的重叠部分，获得环状序列；8如果存在缺失（gaps），则根据gaps两端序列设计引物对gap进行PCR，通过一代测序法获得gap区序列以填补gap，从而获得完整的叶绿体基因组序列；进一步的，步骤（3）选取选取与样本物种亲缘关系近的物种的叶绿体基因组序列作为参考叶绿体基因组序列。本发明避免了叶绿体基因组的分离与纯化以及长片段PCR等实验操作，直接利用转录组的高通量测序数据进行组装以获得完整的叶绿体基因组序列；本发明所用的组装、检测与填补gap的方法使所获得的叶绿体DNA序列形成完整的闭环结构，并可判断所获得序列的质量。

权利要求：1.利用转录组数据获取岷县龙胆叶绿体基因组序列的方法，其特征在于，包括以下步骤：利用高通量测序技术对岷县龙胆叶片的转录组样品进行测序，获得原始数据；过滤掉低质量数据，从而获得转录组的有效数据；从有效数据中筛选出能定位到参考叶绿体基因组上的机读序列（reads）；组装所获得的reads，构建叠连群（contigs）；根据参考叶绿体基因组对叠连群进行排序以及进一步的拼接和组装；每拼接5—6kb，将新拼接的序列已知的众多序列进行blast比对，以检查所拼接的序列；合并首尾序列的重叠部分，获得环状序列；根据所存在的间隙（gap）两端序列设计引物对gap进行PCR，通过末端终止测序法（即一代测序）获得gap区序列以填补gap，从而获得完整的叶绿体基因组序列。2.根据权利要求1所述的利用转录组数据获取岷县龙胆叶绿体基因组序列的方法，其特征在于：步骤（1）不需要分离叶绿体，甚至不需要提取DNA，而是采用高通量双末端测序方法对转录组进行建库测序。3.根据权利要求1所述的利用转录组数据获取岷县龙胆叶绿体基因组序列的方法，其特征在于：步骤（3）中所用参考叶绿体基因组为岷县龙胆的近缘物种的叶绿体基因组，即已知的龙胆科植物叶绿体基因组。4.根据权利要求1所述的利用转录组数据获取岷县龙胆叶绿体基因组序列的方法，其特征在于：步骤（6）可以判断组装质量。

百度查询：中国科学院西北高原生物研究所利用转录组数据获取岷县龙胆叶绿体基因组序列的方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种荧光硅点、荧光硅点制备方法、pH检测方法及生物传感器

下一篇：无线信道模型的更新方法、装置、设备及存储介质

相关技术

一种荧光硅点、荧光硅点制备方法、pH检测方法及生物传感器

无线信道模型的更新方法、装置、设备及存储介质

一种双头机床的半导体芯片夹取装置

一种数据传输方法、装置、设备及计算机可读存储介质

折边装置、折边系统及折边方法

半导体器件及其制备方法

一种碳纤维纺丝前驱体及碳纤维的生产方法

一种数据加载方法、装置、电子设备及存储介质

用于烯烃生产的配置

定子组件、电机、压缩机和制冷设备

用于涡轮发动机的密封支撑组件

装置、方法和计算机程序

岷县相关技术

一种提高岷县黑裘皮羊生产性能的育种方法_甘肃省农业科学院畜草与绿色农业研究所(甘肃省农业科学院农业质量标准与检测技术研究所)_202011398738.X

利用转录组数据获取岷县龙胆叶绿体基因组序列的方法_中国科学院西北高原生物研究所_201810008272.4

岷县黒裘皮羊育肥早期断奶羔羊用全价颗粒饲粮及其制备方法_中国农业科学院兰州畜牧与兽药研究所_201410034071.3

岷县黑裘皮羊耳缘组织成纤维细胞系及其培养方法_中国农业科学院北京畜牧兽医研究所_200610161947.6

岷县黑裘皮羊耳缘组织成纤维细胞系及其培养方法_中国农业科学院北京畜牧兽医研究所_200610161947.6

龙胆相关技术

一种滇龙胆种子风力筛选装置_临沧耀阳生物药业科技有限公司_202420271509.9

一种滇龙胆种子包衣装置_临沧耀阳生物药业科技有限公司_202420271527.7

一种具有环境控制机构的滇龙胆培育装置_临沧耀阳生物药业科技有限公司_202420271507.X

含有龙胆属和火绒草属和/或积雪草属的提取物的化妆品组合物_维蕾德股份公司_202280084463.3

一种滇龙胆茎叶切除装置_临沧耀阳生物药业科技有限公司_202420068896.6

一种龙胆小肽及其制备方法和应用_北华大学_202410933733.4

一种大花蔓龙胆的栽培方法_中国科学院昆明植物研究所_202411106689.6

一种便于调节的滇龙胆灌溉装置_临沧耀阳生物药业科技有限公司_202420183890.3

一种多级筛分的滇龙胆选种装置_临沧耀阳生物药业科技有限公司_202420068892.8

尖叶假龙胆来源的Gen-miR-5在制备防治心肌肥大的药物中的应用_河北中医学院_202310388055.3

叶绿体相关技术

一种刚果野芝麻叶绿体InDel标记检测引物及其应用_江西省农业科学院作物研究所_202410837260.8

叶绿体全基因组在鉴定和/或区分丁香或肉桂子中的应用_江阴天江药业有限公司_202410614561.4

一种基于桔梗叶绿体基因区序列制备的条形码及其应用_北京中医药大学_202310137040.X

一种基于桔梗叶绿体基因间区序列制备的条形码及其应用_黑龙江诺初中药材种植有限公司_202310137045.2

一种快速鉴定植物叶绿体完整性的方法_北京林业大学_202110049498.0

叶绿体基因matK条形码在鉴定和/或区分椿皮或香椿皮中的应用_江阴天江药业有限公司_202410614554.4

一种基于丹参叶绿体基因组多态性基因片段制备的条形码及其应用_北京中医药大学_202111238915.2

一种利用拟南芥细胞悬浮系制备完整叶绿体的方法_中国农业科学院烟草研究所(中国烟草总公司青州烟草研究所)_202410583777.9

一种沅陵山核桃叶绿体基因组及在种质鉴定中的应用_湖南省植物园_202410389333.1

用于白姜花杂交后代鉴定的叶绿体SSR标记引物及应用_广东省农业科学院环境园艺研究所_202311210695.1

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

利用转录组数据获取岷县龙胆叶绿体基因组序列的方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务