生信人的linux考试

一、在任意文件夹下面创建形如 1/2/3/4/5/6/7/8/9 格式的文件夹系列。

二、在创建好的文件夹下面,比如我的是 /Users/jimmy/tmp/1/2/3/4/5/6/7/8/9 ,里面创建文本文件 me.txt

三、在文本文件 me.txt 里面输入内容:

  1. Go to: http://www.biotrainee.com/

  2. I love bioinfomatics.

  3. And you ?

前三题效果如下:

前三题效果

四、删除上面创建的文件夹 1/2/3/4/5/6/7/8/9 及文本文件 me.txt

五、在任意文件夹下面创建 folder 1~5这5个文件夹,然后每个文件夹下面继续创建 folder 1~5这5个文件夹,效果如下:

第五题效果

六、在第五题创建的每一个文件夹下面都 创建第二题文本文件 me.txt ,内容也要一样。

七,再次删除掉前面几个步骤建立的文件夹及文件

八、下载 http://www.biotrainee.com/jmzeng/igv/test.bed 文件,后在里面选择含有 H3K4me3 的那一行是第几行,该文件总共有几行。

九、下载 http://www.biotrainee.com/jmzeng/rmDuplicate.zip 文件,并且解压,查看里面的文件夹结构

十、打开第九题解压的文件,进入 rmDuplicate/samtools/single 文件夹里面,查看后缀为 .sam 的文件,搞清楚 生物信息学里面的 SAM/BAM 定义是什么。

十一、安装 samtools 软件

十二、打开 后缀为 BAM 的文件,找到产生该文件的命令。 提示一下命令是:

  1. /home/jianmingzeng/biosoft/bowtie/bowtie2-2.2.9/bowtie2-align-s --wrapper basic-0 -p 20 -x /home/jianmingzeng/reference/index/bowtie/hg38 -S /home/jianmingzeng/data/public/allMouse/alignment/WT_rep2_Input.sam -U /tmp/41440.unp

十三题、根据上面的命令,找到我使用的参考基因组 /home/jianmingzeng/reference/index/bowtie/hg38 具体有多少条染色体。

十四题、上面的后缀为 BAM 的文件的第二列,只有 0 和 16 两个数字,用 cut/sort/uniq等命令统计它们的个数。

十五题、重新打开 rmDuplicate/samtools/paired 文件夹下面的后缀为 BAM 的文件,再次查看第二列,并且统计

十六题、下载 http://www.biotrainee.com/jmzeng/sickle/sickle-results.zip 文件,并且解压,查看里面的文件夹结构, 这个文件有2.3M,注意留心下载时间及下载速度。

十七题、解压 sickle-results/single_tmp_fastqc.zip 文件,并且进入解压后的文件夹,找到 fastqc_data.txt 文件,并且搜索该文本文件以 >>开头的有多少行?

十八题、下载 http://www.biotrainee.com/jmzeng/tmp/hg38.tss 文件,去NCBI找到 TP53/BRCA1等自己感兴趣的基因对应的 refseq数据库 ID,然后找到它们的 hg38.tss 文件的哪一行。

https://www.ncbi.nlm.nih.gov/gene/7157

十九题、解析 hg38.tss 文件,统计每条染色体的基因个数。

二十题、解析 hg38.tss 文件,统计 NM和 NR开头的熟练,了解 NM和 NR开头的含义。

另外,本练习题应该会持续更新,欢迎点击 http://www.bio-info-trainee.com/2900.html 我博客 继续关注。

又被某些变态举报了我们诱导粉丝点击广告,这次实在是太意外了,感觉总是有刁民要害朕,唉,本来准备再骂一番,想了想,作为生信界第一大号,不能丢了风度,反正一天的广告费才几十块钱。(你相信吗?)

咱不要了。

一口老血都喷出来了

未来两个星期大家都看不到广告了,恭喜咯,也恭喜那个刁民。

(0)

相关推荐

  • 比对软件-Bowtie2

    bowtie2 语法很重要!!!! Usage: bowtie2 [options]* -x <index> {-1 <m1> -2 <m2> | -U <r ...

  • 生信技巧第5课-生信人必须安装的软件

    长期更新列表: 视频讲解-R爬取生信软件列表到思维导图 生信技巧第3课-请你务必学好R语言 broad官网出品的 必须神器 IGV 资料大全,含视频 不知不觉就第5讲了,本次视频没有干货,只是为了保证 ...

  • 生信人的20个R习题

    听说你需要编程练习题? 习题列表 安装一些R包: 数据包: ALL, CLL, pasilla, airway 软件包:limma,DESeq2,clusterProfiler 工具包:reshape ...

  • 生信人应该这样学R语言系列视频学习心得笔记分享

    耗费半年的时间精心制作了成套的生物信息学入门视频教程,并且在生信技能树联盟平台发布了这个长达74个小时全套生物信息学入门视频:生信技能树视频课程学习路径,这么好的视频还免费! 在B站看了看,大家学的热 ...

  • 一个做生信人只有一个显示屏?-No- 双屏幕技巧-word、pdf文件怎么投影

    word.pdf文件怎么投影 首先,直奔主题,回答下标题"word/pdf文件怎么投影?"(电脑-屏幕:投影仪-幕布) 打开投影模式选项,方法:键盘上"win键(四个小方 ...

  • 【生信笔记】Linux如何自动登录服务器账号?

    在使用服务器时,往往需要进行密码登录,甚至有的需要先登录堡垒机,再登录开发机,输入过程较为繁琐,因此可以考虑将命令写成脚本的形式自动化登录. expect是一个能实现自动和交互式任务的解释器,它也能解 ...

  • 纯生信补充验证,反而被审稿人怼惨了

    做纯生信数据挖掘一定要验证吗?不一定,因为一堆没有验证的文章照样发表了.补充验证一定可以加分?也不一定,看期刊主编和审稿人的.下面这两个案例就是因为补充了验证,差点对审稿人怼哭了,被拒稿的可能性也很大 ...

  • 很多人都说纯生信不好发,难道做实验就一定好发?

    很多人可能听别人说:"纯生信不好发表了,老是被拒稿."原本自己是打算学习纯生信来毕业的,听到这样的传闻之后就不想学习了,一直直到毕业都还没有文章毕业.纯生信的确是没有以前好发,但是 ...

  • 纯生信投稿时,期刊主编让推荐审稿人,该咋办?

    不知道大家是否记得之前100多篇SCI论文大规模撤稿事件,这些作者基本都是国内临床医生.研究人员,撤稿的主要原因是伪造审稿人.什么是伪造审稿人?在大规模撤稿事件之前,很多期刊都是在投稿的时候要求作者推 ...

  • 生信主管应该了解的十个Linux知识点

    linux的发行版非常多,其实本质上差别不大,哪怕是mac的OS应该是也是同样的管理操作模式.以下针对于ubuntu适用,当然ubuntu本身也有版本的区别,目前是16,我下面的操作是在12上进行的. ...