生信笔记 | 文本挖掘的一般流程
相关推荐
-
分子信标结合新型流式细胞仪特异性检测细胞外囊泡miRNA(内有福利)
通常,外泌体/细胞外囊泡(EV)RNA/miRNA的分析涉及复杂的EV分离.核酸提取.PCR或者RNA-seq或者印记法等.今天我们为大家介绍一种利用分子信标 (molecular beacons, ...
-
【Molecular Cancer】上海市第一人民医院:放疗后垂死癌细胞的外泌体miR-194-5p增强肿瘤再生细胞的存活和繁殖
近日,来自上海交通大学附属第一人民医院田聆教授课题组在Molecular Cancer杂志上发表文章,报道了外泌体miR-194-5p增强了肿瘤再生细胞中的DNA损伤反应,从而增强了肿瘤的重新增殖.阿 ...
-
把tcga大计划的CNS级别文章标题画一个词云
TCGA计划官方文章在:https://www.cancer.gov/about-nci/organization/ccg/research/structural-genomics/tcga/publ ...
-
R文本挖掘:社会网络分析
社会网络分析是综合运用图论.数学模型来研究行动者与行动者.行动者与其所处社会网络.以及一个社会网络与另一社会网络之间关系的一种结构分析方法.在这个定义中的"行动者",或称" ...
-
R文本挖掘:文本主题分析topic analysis
对于海量未知内容文本的挖掘,主题分析是一个常见的技巧,在主题模型中,主题表示一个概念.一个方面,表现为一系列相关的单词,是这些单词的条件概率.形象来说,主题就是一个桶,里面装了出现概率较高的单词,这些 ...
-
【生信笔记】如何避免基因名称被Excel自动转换?
在进行生信分析时我们会发现,将测序数据用Microsoft Excel打开后,部分基因名会自动转换为日期或浮点. 例如,将下表中第一列的数据导入Excel后,将自动转换为第二列的内容: 一旦导入Exc ...
-
【生信笔记】Linux如何自动登录服务器账号?
在使用服务器时,往往需要进行密码登录,甚至有的需要先登录堡垒机,再登录开发机,输入过程较为繁琐,因此可以考虑将命令写成脚本的形式自动化登录. expect是一个能实现自动和交互式任务的解释器,它也能解 ...
-
【生信笔记】R语言将Excel文件按照列名拆分为多个文件
首先来看拿到这组数据,需要按照outcome的列名不同将数据保存为Paresthesia.csv和Dry mouth.csv两个文件,假如数据量少,我们一般在Excel进行筛选(保证列名存在,直接复制 ...
-
【生信笔记】数据框按照特定顺序修改列名
在前期我们为大家介绍了[R包荟萃]热图绘制工具:pheatmap包详解,其中想要绘制分组的热图时需要两个数据,即原始表达矩阵mat和分组信息annotation_col,其中annotation_co ...
-
【生信笔记】高速下载测序数据:Aspera的安装与使用
当我们需要一些NGS数据时,一般会去NCBI或者EBI的数据库中下载.但是当我们用wget下载时,时常会出现断开连接或者网络下载速度缓慢,对于几十G或者上百G的数据,下载无计可施,这是则可以使用Asp ...
-
【生信笔记】右键菜单打开WSL功能方法简介
在人工智能以及生物信息学发展迅速的现在,充分掌握相关技术是非常重要的,而由于系统的差异,导致很多软件需要在Linux或者Mac OS上运行,长期以来,在Windows系统上解决这一难题的方式是安装虚拟 ...
-
生信笔记 | 自定义GSEA分析中的gmt格式文件
在GSEA分析中,在MSigDB(Molecular Signatures Database)数据库中定义了很多基因集,下载的基因集是gmt格式文件.下载的gmt格式文件,打开后可以看见是下面这个样子 ...
-
【生信笔记】查找GEO数据集
A 什么是GEO数据库? GEO数据库全称Gene Expression Omnibus database,是由美国国立生物技术信息中心NCBI创建并维护的基因表达数据库.它创建于2000年,收录了世 ...
-
Nextflow 快速搭建生信分析流程(八)- Combine Operators
本节我们介绍Nextflow中的Combine Operators类型.Combine-operators-合并操作符合并操作符包含以下类型:joincrosscollectFilecombineco ...