NGS数据分析实践:06. 数据预处理 - 序列比对+PCR重复标记+Indel区域重比对+碱基质量重校正
相关推荐
-
【直播】我的基因组52:X和Y染色体的同源区域探索
很久以前,我其实就遇到过通过NGS测序数据来判定性别的难题(搜索我博客即可查看详情),本次探究自己的基因组得到的统计结果与常识不符,所以我可以肯定是我们的常识太浅显了. [直播]我的基因组48:我可能 ...
-
如何下载生物数据(三):GATK数据下载
来源地址:https://blog.csdn.net/xxxie_/article/details/100111991 欢迎订阅WX众号:基因学苑,更多精彩内容等你发掘! 基因学苑Q群:3279872 ...
-
RNA-seq 检测变异之 GATK 最佳实践流程
RNA-seq 序列比对 对 RNA-seq 产出的数据进行变异检测分析,与常规重测序的主要区别就在序列比对这一步,因为 RNA-seq 的数据是来自转录本的,比对到参考基因组需要跨越转录剪切位点,所 ...
-
从fasta序列里面模拟测序的reads走SNP-calling流程
很简单的一个shell脚本,从UCSC里面单独下载X,Y染色体的fasta序列,写脚本从Y染色体序列里面模拟双端测序的fastqa文件,然后用bwa软件比对到X染色体,作为参考基因组. 全部代码如下: ...
-
4 比对到参考基因组输出bam文件
进到align目录 对质量好的测序数据进行比对 1. 一个个比对,生成BAM文件 align目录 sample=SRR7696207 bwa mem -t 2 -R "@RG\tID:$sa ...
-
【直播】我的基因组(十一):测序数据的比对
上一次直播中,我们对拿到手的测序数据进行了质控,测序数据的质量已经得到了保证.那么接下来就可以把它拿来与参考基因组比对了,这里我们先用参考基因组hg19,大家可以参照[直播]我的基因组(五):测试数据 ...
-
如何查找基因上的SNP位点
在医学文献中,经常会发现以基因名+突变信息命名的SNP,如UGT1A9*3 98T>C,如果我们要找到这个在染色体上的位置.对应的rs编号.或者要提取序列进行sanger测序验证时,这样命名的突 ...
-
生信编程系列(1-2)
有一些五六年前的学生们都成长为了各个生物信息学相关公司的小领导,而且他们都有了自己的公众号,知乎号,也算是一番人物.最近他们跟我反馈面试找不到或者说很难直接考核筛选到认真干活的生信工程师,挺有意思的. ...
-
【直播】我的基因组 43:简单粗糙的WGS数据分析流程
前面我们扯到bam文件的各种操作,vcf文件的各种操作,基础知识不牢固的同学可能已经云里雾里了.这次我们来讲一个简单的.就是拿到了fastq的测序数据,如何把全基因组分析给跑一遍.(不谈细节!) 首先 ...
-
【直播】我的基因组70:比对文件并不能完美的还原出测序文件
前面我们说到过可以用软件或者自己写脚本从已经比对到参考基因组的sam/bam格式文件提取出原始的测序fastq文件. 但是我在IGV里面检查bam文件的时候发现了一些难以理解的现象,所以趁这个机会把它 ...
-
使用bowtie2和samblaster一步到位的干净比对
bowtie2 以前都是和samtools组合,如下: bowtie2 -x $index -U $id | samtools sort -@ 4 -o $sample.bam - 运行速度很慢,现 ...
