百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

转录组及可视化分析——样本间相关性绘图

zhezhongyun 2025-06-19 02:12 3 浏览

背景介绍

在进行正式的转录组分析之前,一般可以先对样本的相关性进行绘图,用于观察各个组之间或组内样本的相关性。

数据介绍

数据的话我们采用的是送样测序公司反馈给我们的 gene_count 文件,格式如下:

gene_id: 基因 ID

gene_count: C1-T3 都是各个组的 gene count 数值

其他列一般我自己分析的话是不需要的。

我给大家提供了四种格式的数据,大家可以 下载到本地使用直接读取在线数据,就可以案例分析了。

链接:
https://gitee.com/escibiu/bioinformatics/tree/master/transcriptomics

比如 xlsx 的数据,想要获取文件的链接,直接点击进去后,右击 原始数据复制链接 即可

在线连接就拿到了:
https://gitee.com/escibiu/bioinformatics/raw/master/transcriptomics/gene_count.xlsx,直接
read.xlsx() 读取即可

软件介绍

R: 4.5.0

RStudio: 2025.05.0

教程介绍

1.首先加载需要的 R 包,这里我只读取 xlsx 格式数据,所以用到 openxlsx 包以及数据处理的 tidyverse

# 加载需要用的数据包
library(openxlsx)
library(tidyverse)

2.进行读取数据文件

# 读取测序原始文件
# 读取Control,Model,P,T四个组别
gene_count <- read.xlsx("https://gitee.com/escibiu/bioinformatics/raw/master/transcriptomics/gene_count.xlsx",
                        sheet = 1,
                        # 只需要id列和gene count列
                        rowNames = TRUE)[,1:12]

# 查看数据
view(gene_count)

3.计算样本间相关性

# 计算相关性
r <- cor(gene_count,
         # 计算相关性的方法有"pearson", "spearman", "kendall"
         method = "pearson",
         
         # 缺失值处理的方式
         use = "pairwise.complete.obs")
view(r)

4.使用热图来展示各个组间的相关性。很明显,从整体来讲,各个组间相关性没有明显的特征。表明各个组间整体差异不是很明显。

# 绘制热图
library(pheatmap)
pheatmap(r,
         # 是否显示列名
         show_rownames = TRUE,
         
         # 设置格子宽度
         cellwidth = 20,
         
         # 设置格子高度
         cellheight = 30,
         
         # 显示数字
         display_numbers = TRUE,
         
         # 字体大小,型号,是否加粗
         show_colnames = TRUE,
         fontsize = 12,
         font.family = "Arial",
         font.face = "bold",
         
         # 指定颜色
         color = colorRampPalette(c("#374E55FF","white","#B24745FF"))(50),

         filename = "1. 样本相关性热图.pdf",
         
        # 指定切分为几个分类
         cutree_rows = 3,
         cutree_cols = 3)

5.也可以不要聚类试试,方便观察组间和组内相关性

pheatmap(r,
         # 是否显示列名
         show_rownames = TRUE,
         
         # 设置格子宽度
         cellwidth = 20,
         
         # 设置格子高度
         cellheight = 30,
         
         # 显示数字
         display_numbers = TRUE,
         
         # 字体大小,型号,是否加粗
         show_colnames = TRUE,
         fontsize = 12,
         font.family = "Arial",
         font.face = "bold",
         
         # 指定颜色
         color = colorRampPalette(c("#374E55FF","white","#B24745FF"))(50),

         # filename = "1. 样本相关性热图.pdf",
         cluster_rows = FALSE,
         cluster_cols = FALSE)

6.也可以绘制相关性矩阵图

# 也可以绘制相关性矩阵图
library(corrgram)
corrgram(gene_count,
         
         # 样本文字大小
         cex.labels = 0.8,
         
         # 指定下方面板的形状,具体参数看下方注释
         lower.panel="panel.pts",   
         
         # 指定上方面板的形状,具体参数看下方注释
         upper.panel="panel.cor",   
         
         # 指定中间面板的形状,具体参数看下方注释
         diag.panel="panel.density",
         
         # 计算相关性的方法有"pearson", "spearman", "kendall"
         cor.method="pearson")  

7.好啦,这就是今天学习的如何对各组样本进行相关性绘图,用来评估组内和组间样本的相关性,赶紧来试试吧。

相关推荐

写作排版简单三步就行-工具篇(作文排版编辑软件)

和我们工作中日常word排版内部交流不同,这篇教程介绍的写作排版主要是用于“微信公众号、头条号”网络展示。写作展现的是我的思考,排版是让写作在网格上更好地展现。在写作上花费时间是有累积复利优势的,在排...

CSS继承的元素属性小总结(css 继承性)

所有元素可继承:visibility和cursor内联元素和块级元素可继承:letter-spacingword-spacingwhite-spaceline-heightcolorfontfont-...

Cube 技术解读 | Cube 小程序技术详解

作者:曾维宏(恒实)“本文为《Cube技术解读》系列第三篇文章,之前上线的《支付宝新一代动态化技术架构与选型综述》《Cube卡片技术栈解读》欢迎大家回顾。”小程序作为动态化或者跨端开发的一种技术栈...

“战斗民族”这样为新生儿检查?(战斗民族)

<fontface="近日,一条被称为“俄罗斯新生儿检查”的视频在微博疯传,视频中检查者粗鲁的动作让网友们纷纷感染“怪不得是战斗民族”。视频真实性有待考证,但宝宝出生后确实需要马不停蹄地做一系...

实测,大模型谁更懂数据可视化?(实测,大模型谁更懂数据可视化技术)

大家好,我是Ai学习的老章看论文时,经常看到漂亮的图表,很多不知道是用什么工具绘制的,或者很想复刻类似图表。实测,大模型LaTeX公式识别,出乎预料前文,我用Kimi、Qwen-3-235B...

「Python爬虫」:破解网站字体加密和反反爬虫

前言:字体反爬,也是一种常见的反爬技术,例如58同城,猫眼电影票房,汽车之家,天眼查,实习僧等网站。这些网站采用了自定义的字体文件,在浏览器上正常显示,但是爬虫抓取下来的数据要么就是乱码,要么就是变成...

转录组及可视化分析——样本间相关性绘图

背景介绍在进行正式的转录组分析之前,一般可以先对样本的相关性进行绘图,用于观察各个组之间或组内样本的相关性。数据介绍数据的话我们采用的是送样测序公司反馈给我们的gene_count文件,格式如下:...

阿里巴巴矢量图标库 iconfont 的使用方法

xx-blog主题使用的图标库是阿里巴巴的iconfont,因此这里介绍一下此主题库的用法。首先去iconfont主题库,注册一个账号,然后就可以找自己喜欢的图标了,找到后点击添加购物车,就回到了右侧...

五行取名(五行取名的正确方法)

1、五行的分类原则以方位来论:东方属木;南方属火;西方属金;北方属水;中央属土。以季节来论:春季属木;夏季属火;秋季属金;冬季属水;季末属土。以气候来论:风属木;暑属火;燥属金;寒属水;湿属土。以颜色...

4K显示器软件界面字体过小解决方法

用4K显示器(win10或者win11下)的朋友会发现一些软件并不能随着系统的字体放大而放大字体,用起来很不方便。譬如常用的ps或者行业专用软件。笔者经过摸索,发现这样设置一下可以解决。下面以Psc...

VBA之Word应用:利用Range方法进行字体及对齐方式设置

《VBA之Word应用》(版权10178982),是我推出第八套教程,教程是专门讲解VBA在Word中的应用,围绕“面向对象编程”讲解,首先让大家认识Word中VBA的对象,以及对象的属性、方法,然后...

办公小技巧:告别侵权 PPT字体自己造

很多朋友还不知道,我们每天面对的字体都是有版权保护的,如果对这方面的内容不了解,一不小心就可能造成侵权。那么我们在日常设计PPT文稿的时候,如何避免字体侵权呢?首先我们得懂得如何查看版权信息,另外还需...

显示器颜色显示有偏差?你校准过吗?

编辑:晴晨购物、拍照、做视频、玩游戏……看似不一样的操作都怕一件事:颜色有偏差。购物时商品颜色有出入,毫不知情的情况下把责任推给了商家,那么拍照、做视频、玩游戏呢?我们先来看看某网友的诉苦:“我的是台...

设计字体那些事(设计字体种类大全图)

做设计几年,平均每年都能遇见好多因为字体侵权的事情,今天就结合我自己的经验和了解简单介绍下字体那些事#毒角SHOW角角用了这款字体,竟被送律师函赔偿10万https://www.douyin.com...

LCD智能显示模块-绘图板(lcd显示模块流程图)

TOPWAY智能模块(SmartLCD)是专门为工业显示应用而设计的TFT液晶显示模块。我司自主研发的界面编辑软件RGTools/SGTools提供了18个控件,通过些控件能实现丰富的显...