ZH-CN/EN
格式转换工具
序列分析工具
序列图形化分析工具
随机序列
Miscellaneous
The Sequence Manipulation Suite Copyright © 2000, 2004 Paul Stothard. Send questions and comments to stothard@ualberta.ca
Sequence Manipulation Suite:
关于
Sequence Manipulation Suite 是用 JavaScript 1.5 编写的,这是一种轻量级、跨平台、面向对象的脚本语言。JavaScript 现在由 ECMA(欧洲计算机制造商协会)标准化。ECMA 标准的第一个版本记录在 ECMA-262 规范中。ECMA-262 标准也被 ISO(国际标准化组织)批准为 ISO-16262。JavaScript 1.5 与 ECMA-262 第 3 版完全兼容。
提交到 Sequence Manipulation Suite 的序列不会离开您的计算机,而是由您的浏览器执行 JavaScript 进行操作。Sequence Manipulation Suite 由 Paul Stothard(加拿大阿尔伯塔大学)编写。发送问题至 stothard@ualberta.ca。
以下是组成 Sequence Manipulation Suite 的程序的简短描述:
格式转换
合并FASTA序列 - 将多个FASTA序列记录转换成一个单个的序列。当你希望使用一个接受单一序列输入的程序来确定一组序列的密码子使用情况时,可以使用合并FASTA。
EMBL to FASTA - 接受一个或多个EMBL文件作为输入,并返回每个文件中的DNA序列,格式为FASTA。当你希望快速从EMBL文件中去除所有非DNA序列信息时,可以使用此程序。
EMBL序列特征提取 - 接受一个或多个EMBL文件作为输入,并读取特征表中描述的序列特征信息。该程序提取或突出显示相关的序列段,并以FASTA格式返回每个序列特征。当你希望从包含许多内含子的基因组序列中导出cDNA的序列时,EMBL特征提取器特别有用。
EMBL翻译区提取器 - 接受一个或多个EMBL文件作为输入,并返回文件中描述的每个蛋白质转录的FASTA格式。当你对DNA序列的预测蛋白质转录比DNA序列本身更感兴趣时,可以使用EMBL翻译区提取器。
过滤DNA - 从文本中删除非DNA字符。当你希望从序列中删除数字和空格,使其适合其他应用程序时,可以使用此程序。
过滤蛋白质 - 从文本中删除非蛋白质字符。当你希望从序列中删除数字和空格,使其适合其他应用程序时,可以使用此程序。
GenBank转换为FASTA - 接受一个或多个GenBank文件作为输入,并返回每个文件中的完整DNA序列,格式为FASTA。当你希望快速从一个GenBank文件中去除所有非DNA序列信息时,可以使用此程序。
GenBank序列特征提取器 - 接受一个或多个GenBank文件作为输入,并根据GenBank发布说明中的规则,读取特征表中描述的序列特征信息。该程序提取或突出显示相关的序列段,并以FASTA格式返回每个序列特征。当你希望从包含许多内含子的基因组序列中导出cDNA的序列时,GenBank特征提取器特别有帮助。
GenBank翻译区提取器 - 接受一个或多个GenBank文件作为输入,并返回文件中描述的每个蛋白质转录的FASTA格式。当你对DNA序列的预测蛋白质转录比DNA序列本身更感兴趣时,应使用GenBank翻译提取器。
氨基酸单字母到三字母转换 - 氨基酸单字母到三字母转换工具.
DNA区段提取器 - 接受一个或多个DNA序列以及一组位置或范围。返回对应于位置或范围的碱基,可以是一个新的序列,一组FASTA记录,大写文本或小写文本。使用范围提取器DNA可以通过位置信息获取子序列。
蛋白区段提取器 - 蛋白区段提取器可以将指定位置或区段的氨基酸提取并整合到新的序列中。输出结果可以为新序列、FASTA格式、大写文字形式、小写文字形式。
反向互补 - 反向互补计算工具将一段DNA序列转换成反向互补序列。本工具支持全部IUPAC的DNA字母。如果目标序列的反向链中包含ORF,您可以使用此工具。
密码子分离器 - 将一个编码序列划分为三个新的序列,每一个都由密码子位置中的一个碱基组成。.
分割FASTA - FASTA文件分割工具可以将FASTA序列分割成指定长度的短序列,同时,您可以指定重叠区域的长度。
单字母蛋白序列转换 - 单字母蛋白序列转换工具可以将三字母蛋白序列转换成单字母蛋白序列。数字、空格会自动清除。没标准的三字母被忽略。.
滑动窗口方式提取DNA序列 - 此工具按窗口位置及大小提取DNA子序列。输出结果可以可以为新序列、可以大写、可以小写。
滑动窗口方式提取蛋白序列 - 此工具可以按照指定的窗口大小和窗口位置提取蛋白子序列。窗口内的氨基酸残基可以新序列、大写、小写方式返回。
序列分析工具:
绘制密码子谱 -密码子谱工具用于分析一段DNA序列,生成图形化的密码子谱。密码子谱是由表示密码子使用频率的横向长条组成。横向长条的长度反映了对应密码子的使用频率。
密码子使用频率表计算 - 密码子使用频率计算工具用于统计一条或多条DNA中每一种密码子的使用次数和使用频率。因为此工具会比较同义密码子的使用频率,所以您可以用它来评估特定同义密码子的组成是否与特定物种相符。
CpG岛分析 - CpG岛分析工具用于分析CpG岛的潜在区域,分析算法请参考文献Gardiner-Garden and Frommer (1987)。算法采用大小为200bp、步长为1的滑动窗口进行计算。CpG岛是Obs/Exp值大于60%,GC含量大于50%的一段序列。期望值(Exp)=‘C’的出现次数 * ‘G’的出现次数 / 滑动窗口大小。CpG岛一般出现在脊椎动物基因的5'端,所以此工具可以在基因组中标记出潜在基因。
DNA分子量计算器 - DNA分子量计算器用于计算一条至多条DNA序列的分子量。序列可以按照单链、双链、线性、环形方式进行计算。单链序列按具有5'磷酸化进行计算。需要计算分子拷贝数的时候,可以使用此工具。
正则表达式查找DNA片段 - 接受一个或多个序列以及一个搜索模式,并返回与模式匹配的位置和数量。搜索模式以JavaScript正则表达式的形式编写,这与其他编程语言中编写的正则表达式相似,例如Perl。
DNA碱基统计 - DNA碱基统计工具会统计序列中所有碱基的出现次数及出现频率。此工具的分析结果可以用作快速比较不同序列的碱基组成。
模糊查找DNA序列 - 接受一个DNA序列和一个查询序列,并返回与查询相同或相似的位点。例如,你可以使用这个程序来查找可以容易地突变成有用限制位点的序列。
模糊查找蛋白质序列 - 接受一个蛋白质序列和一个查询序列,并返回与查询相同或相似的位点。
序列相似度评估工具 - 接受一组对齐的序列(以FASTA或GDE格式)并计算每对序列的身份和相似性。身份和相似性值常常被用来评估两个序列是否有共同的祖先或功能。
酶切突变工具 - 酶切突变工具可以在目标序列中查找与特定酶切位点最为相似的片段,并进行定点突变。此工具会展示翻译后的蛋白质序列信息,以便于查看哪一种开放阅读框被该突变修改了。酶切突变工具可以为PCR或者定点突变选择最小代价即可获取限制性酶切位点的序列位置。
根据已知蛋白序列生成cDNA - 此工具可以根据已知的多条蛋白序列结合密码子使用频率表,将蛋白序列反翻译为可编码的DNA序列。此工具还可以在核苷酸水平统计三联密码子每位碱基中ATGC的组成比例。在根据相关物种设计PRC引物,用以退火至unsequenced coding sequence时可以使用。
开放阅读框查找器 - 在你输入的DNA序列中搜索开放阅读框(ORFs)。程序返回每个ORF的范围以及它的蛋白质翻译。ORF查找器支持整个IUPAC字母表和几种遗传密码。在新测序DNA中搜索潜在的蛋白质编码片段时,使用ORF查找器。
双序列密码子比对工具 - 接受两个编码序列并确定最优的全局对齐,来寻找保守的编码序列区域。
双序列DNA碱基比对工具 - 接受两个DNA序列并确定最优的全局对齐,来寻找保守的序列区域。
蛋白双序列比对工具 - - 接受两个蛋白质序列并确定最优的全局对齐。使用Pairwise Align Protein来寻找保守的序列区域。
PCR引物统计 - 接受一组PCR引物序列并返回描述每个引物属性的报告,包括熔解温度,GC含量百分比和PCR适应性。使用PCR引物统计来评估潜在的PCR引物
PCR产物预测 - PCR产物预测工具需要输入1至多条DNA模板序列和两条引物序列。此工具会搜索完全匹配的退火位点,用以生成PCR产物。生成结果会按照大小排序、每个产物都会标记长度、在母序列中的长度以及产生它们的引物。您可以使用线性序列或环形序列作为模板。在进行PCR实验之前,可以使用此工具推测产物的大小。
蛋白亲水性分析工具 -该工具会根据统计数据为每一个氨基酸分配一个亲水值,整个序列的亲水值=所有氨基酸的亲水值除以总氨基酸数。(Kyte and Doolittle;1982)。
蛋白等电点计算器 - 蛋白等电点计算器可以计算出蛋白序列的理论等电点。在跑二维凝胶电泳时,使用此工具可以预估蛋白的条带位置。
蛋白分子量计算 - 蛋白分子量计算器可以同时计算1到多条蛋白序列的分子量。您可以为蛋白序列添加一定拷贝数的抗原决定簇或者融合蛋白。在跑一维凝胶电泳的时候,使用此工具可以大致知道目标蛋白相对于蛋白标准品的位置。
正则表达式查找蛋白序列 - 接受一个或多个序列以及一个搜索模式,并返回与模式匹配的位点的数量和位置。搜索模式以JavaScript正则表达式的形式编写,它类似于其他编程语言,如Perl中编写的正则表达式
蛋白序列统计 - 蛋白序列统计工具统计目标序列中每种氨基酸残基的出现次数及频率,也可以统计特定类型氨基酸的出现次数及频率。输出格式便于快速比较不同蛋白的氨基酸组成。
DNA模拟酶切工具 - DNA模拟酶切工具可以模拟1至3个限制性内切酶同时酶切DNA序列。酶切的片段在输出结果中会按照大小排序,描述信息中包含长度、在原序列中的位置、酶切使用的酶。您可以设置以线性方式,或者环形分子方式进行酶切,甚至可以分子混合方式(多序列FASTA)模拟酶切。使用此工具可以预测酶切后的片段大小。
常见酶切位点统计 - 限制性酶切位点统计工具可以统计常用限制性酶切位点的数量和位置。使用此工具可以快速判断某限制性内切酶是否会切割目标DNA。
蛋白序列到基因序列 - 接受一个蛋白质序列作为输入,并使用一个密码子使用表来生成代表最可能的非退化编码序列的DNA序列。从每个氨基酸的所有可能的密码子中派生的共识序列也被返回。当设计PCR引物与一个相关物种的未测序编码序列退火时,使用反向翻译。
DNA翻译工具 - 接受一个DNA序列并将其转化为你指定的阅读框架中的蛋白质。翻译支持整个IUPAC字母表和几种遗传密码。
序列图形化分析工具
颜色法标记DNA/蛋白保守区 - 接受一组对齐的序列(以FASTA或GDE格式)并为对齐着色。程序检查每个残基并将其与同一列中的其他残基进行比较。在序列中相同的残基被赋予黑色背景,而在序列中相似的残基被赋予灰色背景。剩余的残基接收白色背景。您可以指定必须相同和相似的残基的百分比,以便应用颜色。使用颜色对齐保护来增强序列对齐程序的输出。
颜色法标记蛋白残基生化相似度 - 接受一组对齐的序列(以FASTA或GDE格式)并为对齐着色。程序检查每个残基并将其与同一列中的其他残基进行比较。在序列中相同或相似的残基被赋予彩色背景。颜色是根据残基的生化属性选择的。您可以指定必须相同和相似的残基的百分比,以便应用颜色。使用颜色对齐属性来突出具有保守生化属性的蛋白质区域。
DNA序列分组格式化 - 调整DNA序列的间距并添加编号。您可以指定组大小(每组的碱基数)以及每行的碱基数。这个程序的输出可以作为一个方便的参考,因为编号和间距使您可以快速定位特定的碱基。
蛋白序列分组格式化 - 调整蛋白质序列的间距并添加编号。您可以指定组大小(每组的残基数)以及每行的残基数。这个程序的输出可以作为一个方便的参考,因为编号和间距使您可以快速定位特定的残基。
引物模板匹配工具 - 引物模板匹配工具可以用格式化文字的方式将引物映射到模板上,用以展示PCR引物的退火位置。限制性酶切位点及翻译后的蛋白序列也会展示在结果中。当需要为模板设计大量引物时,此工具特别有用。此工具支持所有IUPAC字符和多种密码子表。
酶切位点标记图 - 限制性酶切位点分布图以格式化文字的形式将限制性酶切位点标记在序列中。输出结果还会根据阅读框的位置,列出翻译后的蛋白序列。当计划克隆策略的时候,可以参考此工具。本工具支持IUPAC字符和多种密码子。
DNA翻译图谱 - DNA翻译工具以格式化文本的方式显示所有蛋白质翻译信息。阅读框位置可以指定为1、2、3或所有,您也可以指定大写字符为阅读框。此工具支持所有IUPAC字母和多种密码子表。
随机序列:
随机突变DNA序列 - DNA突变工具可以随机引入突变。您可以设置突变次数,可以指明是否突变开始或结尾的三个碱基。突变的位点随机产生,多次突变可能会发生在同一个位点。此工具可以辅助评估特定位点碱基的作用。
随机突变蛋白序列 - 蛋白突变工具可以将突变引入蛋白序列。您可以指定突变次数、是否突变首位氨基酸(一般是起始密码子对应的氨基酸)。突变位点会被随机选取,多次突变可以发生在同一位点。此工具可以辅助评估特定氨基酸对蛋白的意义。
随机生成cDNA序列 - 生成一个随机的开放阅读框,以起始密码子开始,以终止密码子结束。您可以选择使用的遗传代码和要生成的序列的长度。随机序列可以用来评估序列分析结果的显著性。
随机生成DNA序列 - 生成指定长度的随机序列。
随机突变特定位置的DNA - DNA区域随机突变器可以随机突变指定区域的DNA序列。
随机生成蛋白序列 -生成指定长度的蛋白随机序列。
随机突变蛋白序列的特定位置 - 蛋白序列区域性随机突变器可以在指定的区域内随机突变氨基酸残基。
DNA随机采样 - DNA采样工具每次从指定序列随机挑选一个碱基,经过多次随机挑选直至形成指定长度的构建。相同位置的碱基可以被重复挑选。
蛋白质随机采样 - 蛋白质采样器从采样库中每次随机挑选一个氨基酸,经过重复采样最后获得指定长度的序列。相同位置的氨基酸可以被重复挑选。
打乱DNA - DNA序列打乱工具可以将DNA的碱基顺序重新打乱。此工具用于评估序列分析结果的重要性,特别是序列组成作为主要考虑因素的时候
打乱蛋白序列 - 蛋白序列打乱工具用于随机打乱蛋白序列的氨基酸残基顺序。打乱后的蛋白序列用于评估蛋白分析结果的重要性,特别是序列组成是主要考虑因素的时候。
打开新窗口 | 主页 | 引用
Mon Nov 6 02:56:29 2017
Valid XHTML 1.0; Valid CSS