转录组合并数据分析报告-454(2)

2019-03-11 15:40

图2.3.1 reads长度分布示意图

表2.3.1 预处理后reads基本统计信息

ALL Reads num 2348,945 Total bases 699,966,000 Length range(bp) 100-627 Average length(bp) 298 Length std 90.9 2.4 序列拼接

应用Newbler v2.5.3软件进行序列拼接,参数如3.1-d所示,拼接结果统计如表2.4.1所示,拼接结果在每个组织的分布情况如表2.4.2所示。

表2.4.1 拼接结果统计

Isotig num 84,867 Isotig bases 41,802,506 N50(bp) 547 Average length(bp) 492.6 Average depth 27.3 Singlets num 42,844 表2.4.2 拼接结果各组织分布统计

Tissue name ji shen gan

Singlets num 5745 9769 5841 Singlets rate (%) 13 23 13 Isotig num 30959 13463 7932 Isotigs rate (%) 36 16 9 5

nao 21489 51 32813 39 在Newbler软件中引入Isotig的概念。从结构上讲可把contig比作exon,把Isotig比作整个转录本,不同的Isotig可由1至多个contig进行不同组合而成。Isotig更能反映转录本的真实情况,后续分析将使用Isotig及singlets序列进行。

2.5 SSR分析

将2.4得到的Isotig 及 Singlets用MISA软件进行SSR分析,参数如3.1-e所示。统计结果如表2.5.1所示,详细结果见结果文件。

表2.5.1 SSR分析结果统计

SSR type statistics 含有SSR的序列个数 2个以上SSR序列个数 混合型SSR个数 单碱基型SSR个数 双碱基型SSR个数 3碱基型SSR个数 4碱基型SSR个数 5碱基型SSR个数 6碱基型SSR个数 1-6碱基型SSR总数 All 17082 2060 1385 5787 8406 2032 760 87 10 14581 2.6 SNP分析

将2.4得到的Isotig序列进行SNP分析。用ssahasnp软件将每个Isotig所对应的reads比对到Isotig,通过拼接时覆盖到同一位置上碱基的不同来预测可能的SNP位点,其中SNP覆盖率大于10以及突变率大于20%,详细结果见SNP/all_SNP_result.xlsx文件。对SNP类型进行统计,统计图如图2.6.1所示。不同组织SNP统计结果见结果文件。

6

4004201019941780626480206468overall transitionsA<->GC<->Toverall transversionA<->T图2.6.1 SNP类型统计

G<->TC<->GA<->C

2.7 blast注释

对2.4得到的Isotigs及singlets进行blastx注释。与Swiss-Prot数据库进行比对,合并比对结果,取e值小于等于1e-3,alignment大于等于30%的比对结果。详细结果见结果文件。

2.8 GO分类

根据2.7的比对结果进行GO分类,得到所有序列在Gene Ontology的三大分类:molecular function, cellular component, biological process的各个层次上的分布情况。详细结果见结果文件。并给出各分类第二层次上的分布图形如图2.8.1,图2.8.2,图2.8.3所示。

7

图2.8.1 biological process level 2 distribution

图2.8.2 cellular component level 2 distribution

8

图2.8.3 Molecular function level 2 distribution

2.9 差异基因分析

将参与拼接的四个组织reads分布情况进行统计,然后分别将每个组织两两比较,得出两者之间的差异基因以及无差异基因。这里采用Fisher检验,参考表达量为各组织表达量总和,差异基因阈值P:0.05,详细结果见:ji_nao,ji_gan,ji_shen,nao_gan,nao_shen,gan_shen这六个表,其中带颜色标记的差异基因:红色代表前者表达量大于后者,例如ji_shen,则为ji表达量大于shen表达量;绿色表达前者表达量小于后者,例如ji_shen,则为ji表达量小于shen表达量;黑色字体即无颜色表示为无差异基因。

2.10 UniGene比对

应用tblastx程序将拼接出的Unigene(127711)与指定的7种鱼的EST/mRNA序列进行比对,根据如下参数提取比对结果:alignment >= 40% (query or subject); E: 1e-05。比对统计结果如表2.10.1所示,详细结果见结果文件。

表2.10.1 比对统计结果

Species of EST/mRNA Carassius auratus Cyprinus carpio

Unique num of unigene align to EST/mRNA 5298 8895 Percent % 4.15 6.96 9


转录组合并数据分析报告-454(2).doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:新SQL——SERVER实验练习答案

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: