(awk命令在mac和Ubuntu下面表现不一样)生信编程200题邀请优秀本科生加入一起攻克

最近在带领学徒,重现当初的 »生信技能树互动作业脚本能力实践生信人必练的200个数据处理任务

其中第11题,很有趣:把文件内容按照染色体分开写出

学徒问我为什么标准答案是错的,然后我验证后的确发现以前没有问题的代码居然报错了:

awk '{print >> ( $1".tmp") }' batch1-cnvkit-all.seg 

报错如下:

awk: sample100.tmp makes too many open files
 input record number 3696, file batch1-cnvkit-all.seg
 source line number 1

我略微思考了一下,学徒用的是Mac电脑,猜想可能是mac和Ubuntu命令不兼容

所以我把同样的数据上传到我的Ubuntu服务器,发现同样的代码就不报错 ,诡异!

附赠:生信编程实战5个月传送门 http://www.biotrainee.com/thread-1075-1-1.html

首先是第一个月的超级难题

  • 生信编程直播第一题:人类基因组的外显子区域到底有多…

  • 生信编程直播第二题:hg19基因组序列的一些探究

  • 生信编程直播第三题:hg38每条染色体基因,转录本的分布

  • 生信编程直播第四题:多个同样的行列式文件合并起来

  • 生信编程直播第五题:根据GTF画基因的多个转录本结构

然后是第二个月,关于kegg数据库的注释:

  • 生信编程直播第六题:下载最新版的KEGG信息,并且解析好

  • 生信编程直播第七题:写超几何分布检验!

  • 其中shell是单独出题,生信编程直播第六题:批量根据基因list来提取信息(shell)

  • 生信编程直播第7题:批量从NCBI下载数据(shell)

接下来是第3个月,回归基础:

  • 生信编程直播第8题-几个ID转换咯

  • 生信编程直播第0题-生信编程很简单

  • 生信编程直播第9题:根据指定染色体及坐标得到参考碱基

  • 生信编程直播第10题:根据指定染色体及坐标得到位置信息

  • 生信编程直播第11题:把文件内容按照染色体分开写出

  • 生信编程直播第12题:json格式数据的格式化

(0)

相关推荐

  • 第2章 基因和染色体的关系

    第2章 基因和染色体的关系

  • 10个超级棒的Awk命令

    Awk命令是处理数据的强大工具.它获取输入数据,对其进行操作,并在标准输出中给出结果.可以对文件的行和列执行各种操作. 要有效地处理数据,了解"awk"命令的基本要素是非常重要的, ...

  • awk命令常用功能及参数选项 Linux系统运维

    awk是Linux工作中的重要工具,掌握awk工具的运用,必将使得运维工作得心应手.awk不仅是Linux系统中的一个命令,还是一种编程语言,可以用来处理数据和生成报告.处理的数据可以是一个或多个文件 ...

  • AWK 命令

    阅读目录 入门实例 回到顶部 入门实例 last -n 5 仅取出前五行 root pts/1 192.168.1.100 Tue Feb 10 11:21 still logged in root ...

  • 神操作!使用命令更改MAC截图默认保存格式的方法

    一些朋友在使用Mac截图的时候发现,它的默认的保存格式是PNG,虽然图片很清晰但是确很大,那么要怎样更改截图默认格式呢?这里以常用的jpg为例子,教大家Mac是如何更改截图默认保存格式. 详细如下 第 ...

  • Linux awk 命令详解

    awk是行处理器:相比较屏幕处理的优点,在处理庞大文件时不会出现内存溢出或处理缓慢的问题,常用来格式化文本信息. awk处理过程:依次对每一行进行处理,然后输出.①读取被匹配到的行数据:②按照输入分隔 ...

  • 生信第二步-ubuntu上安装单细胞3大包

    生信第一步-购买腾讯云服务器搭建自己的生信分析环境 由于R,Rstudio,Shiny都已经安装好了,那么我就直接进入服务器,进行安装.人在墙外,因此无需设置cran repos和Bioc_mirro ...

  • #零命令行#生信数据下游分析系列 - 开篇帖

    写在前面 在"肉眼可见"的范围内,与生信靠得上边的公众号却一个劲儿地推送"界面化操作软件"的,可能就我一个.毕竟我暂时还没有我觉得拿得出手的东西来分享.可能是因 ...

  • 序列提取 - 《-零命令行-生信下游数据分析》- 第一弹

    写在前面 <-零命令行-生信下游数据分析>的第一帖主题,定为序列提取.因为序列提取,可以说是目前最常见的生信下游数据分析需求,其主要见于场景: 1.物种基因组已公布,但没有对应的数据库,而 ...

  • 特斯拉全年盈利,北汽系能源裁员20%!两极表现因何而生?

    汽车圈,近段时间可真热闹.如,因为芯片缺货波及汽车行业,多家汽车企业不得不采取削减产量.减产等方式应对危机.当然,他们也有着自己的小心机--优先将芯片供给利润更高的高端车型.此外,福特中国也闹出宣传乌 ...