NCBI使用方法(4)

2019-03-22 11:10

体,所以对应了一个古老的保守 domain。 7、 疟原虫基因组 1) 疟原虫遗传学和基因组:提供与疟原虫遗传学和基因相关的数据和信息。资源包括物种特异的序 列 BLAST 数据库(恶性疟原虫,所有疟原虫,以及弓形虫),基因组图谱,连锁标记,以及遗传学研究 信息。链接到其他的疟原虫网站和相关的寄生虫遗传学数据库包括弓形虫。 2) Entrez 基因组 — 恶性疟原虫的染色体全长的图形视图,完整的染色体序列数据(2 和 3),链 接到正在进行的染色体的分离数据表(来自于 HB3 X Dd2 杂交的染色体) ,链接到其他基因组测序中心。 3) FTP 站点 (pub/Malaria 目录):用于查找在 DNA 序列中 STS 的电子 PCR 疟原虫版。 4) FTP 站点 (genbank/genomes 目录):下载各种格式的完整的染色体序列数据(2 和 3) ,包括 G enBank 的 flat file (*.gbk),GenBank 的概要文件(*.gbs),FASTA 核酸文件(*.fna),FASTA 氨基酸文 件(*.faa),蛋白表(*.ptt)和其他。 8、 细菌基因组 1) Entrez 基因组 — 完整细菌基因组的图形表示,可以整个的查看,也可以逐步放大的看。链接到 相关的序列数据。对每一个细菌都提供了一个编码区域的概要和 TaxTable。 2) 微生物基因组测序计划:完成的和正在进行的测序计划,链接到 NCBI 的图形视图和测序中心。 3) COGs :相邻类的聚簇 — 来自于完整基因组的基因家族自然系统。COGs 用比较 21 种完整的基 因组的编码的蛋白序列描绘了 17 个主要的种系发生系统。每个 COG 包含至少来自 3 个世系的独立蛋白或 蛋白家族的相邻体,所以对应了一个古老的保守 domain。 4) FTP 站点:

下载各种格式的完整的细菌染色体序列数据,包括 GenBank 的 flat file (*.gbk),Gen Bank 的概要文件(*.gbs),FASTA 核酸文件(*.fna),FASTA 氨基酸文件(*.faa),蛋白表(*.ptt)和其 他。 5) 微生物基因组 BLAST 数据库 :与完成的和未完成的微生物基因组进行 BLAST

GenBank Overview 基本信息

? 什么是GenBank?GenBank是一个有来自于70,000多种生物的核苷酸序列的数据库。每条纪录都有编码区(CDS)特征的注释,还包括氨基酸的翻译。GenBank属于一个序列数据库的国际合作组织,包括EMBL和DDBJ。

? 纪录样本 - 关于GenBank的各个字段的详细描述,以及同Entrez搜索字段的交叉索引。

? 访问GenBank - 通过Entrez Nucleotides来查询。用accession number,作者姓名,物种,基因/蛋白名字,还有许多其他的文本术语来查询。关于Entrez更多的信息请看下文。用BLAST来在GenBank和其他数据库中进行序列相似搜索。用E-mail来访问Entrez和BLAST可以通过Query和BLAST服务器。另外一种选择是可以用FTP下载整个的GenBank和更新数据。

? 增长统计 - 参见公布通知的2.2.6(每个分类的统计),2.2.7(每

个物种的统计),2.2.8(GenBank增长)小节。

? 公布通知,最新 - 最近和即将有的变化,GenBank的分类,数据增长统计,GenBank的引用。

? 公布通知,旧 - 同上相同,是过去公布的统计。

? 遗传密码 - 15个遗传密码的概要。用来确保GenBank中纪录的编码序列被正确的翻译。 (向)GenBank提交(数据)

? 关于提交序列数据,收到accession number,和对纪录作更新的一般信息。

? BankIt - 用于一条或者少数条提交的基于WWW的提交工具软件。(请在提交前用VecScreen去除载体)

? Sequin - 提交软件程序,用于一条或者很多条的提交,长序列,完整基因组,alignments,人群/种系/突变研究的提交。可以独立使用,或者用基于TCP/IP的“network aware”模式,可以链接到其他NCBI的资源和软件比如Entrez和PowerBLAST。(请在提交前用VecScreen去除载体)

? ESTs - 表达序列标签,短的、单次(测序)阅读的cDNA序列。也包括来自于差异显示和RACE实验的cDNA序列。

? GSSs - 基因组调查序列,短的、单次(测序)阅读的cDNA序列,exon trap获得的序列,cosmid/BAC/YAC末端,及其他。 ? HTGs - 来自于大规模测序中心的高通量基因组序列,未完成的(阶段0,1,2)和完成的(阶段3)序列。(注意:完成的人类的HTG

序列可以同时在GenBank和Human Genome Sequencing页面上访问。)

? STSs - 序列标签位点。短的在基因组上可以被唯一操作的序列,用于产生作图位点。

? 注:SNPs - 人类的和其他物种的遗传变异数据可以提交到NCBI数据库的单核苷酸多态性库中(dbSNP)。 国际核苷酸序列数据库合作组织

? GenBank,DDBJ,EMBL - 合作计划的概述,并链接到相应的主页。GenBank,DDBJ(DNA Data Bank of Japan),and EMBL (European Molecular Biology Laboratory)数据库共享的数据是每天都交换的,因此他们是相等的。数据纪录的格式和搜索方式可能会不一样,但是accession number,序列数据和注解都是一模一样的。即,你可以用accession number U12345在GenBank,DDBJ或EMBL中查找相应纪录,得到的结果是完全一样的序列数据,参考内容等等。

? DDBJ/EMBJ/GenBank特性表 — 特性表格式和标准被合作数据库用在序列记录的注释上,使得数据共享成为可能,包括详细的描述生物特性和特性限定语的附录,以及IUPAC规定的核苷酸和氨基酸的代号。

________________________________________ FTP GenBank and Daily Updates

? GenBank普通文件格式 — 参见GenBank记录样本和在

GenBank公布通知中的详细描述,下载大多数最近的完全公告和日常积累或非积累更新数据。

? ASN.1格式 — 摘要句法记号1,国际标准组织(ISO)数据表示格式,下载大多数最近的完全公告和日常积累或非积累更新数据。 ? FASTA格式 — 定义行号后只跟随序列数据(示例),参见描述数据库的readme文件,包括nt.Z(每天更新的非冗余BLAST核酸数据库,包括GenBank+EMBL+DDBJ+PDB序列,但是不包括EST, STS, GSS, or HTGS序列),nr.Z(每日更新的非冗余蛋白质),est.Z, gss.Z, htg.Z, sts.Z,和其它文件。 分子数据库概览 核酸序列

? Entrez核酸 — 用accession number,作者姓名,物种,基因/蛋白名字,以及很多其它的文本术语来搜索核酸序列记录(在GenBank + PDB中)。更多的关于Entrez的信息见下。如果要检索大量数据,也可使用Batch Entrez(批量Entrez)。

? RefSeq — NCBI数据库的参考序列。校正的,非冗余集合,包括基因组DNA contigs,已知基因的mRNAs和蛋白,在将来,整个的染色体。Accession numbers用NT_xxxxxx, NM_xxxxxx, NP_xxxxxx, 和NC_xxxxxx的形式来表示。

? dbEST — 表达序列标签数据库,短的、单次(测序)阅读的cDNA序列。也包括来自于差异显示和RACE实验的cDNA序列。 ? dbGSS —基因组调查序列的数据库,短的、单次(测序)阅读的


NCBI使用方法(4).doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:发电机的励磁限制与保护的配合整定

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: