r语言go数据包_go解析数据包

作者：小编更新时间：2023-08-12 18:06:47 浏览量：471人看过

【R语言】解决GO富集分析绘图,标签重叠问题

前面我给大家详细介绍过

GO简介及GO富集结果解读

四种GO富集柱形图、气泡图解读

GO富集分析四种风格展示结果—柱形图,气泡图

KEGG富集分析—柱形图,气泡图,通路图

DAVID GO和KEGG富集分析及结果可视化

r语言go数据包_go解析数据包-图1

也用视频给大家介绍过

GO和KEGG富集分析视频讲解

最近有粉丝反映说,利用clusterProfiler这个包绘制GO富集分析气泡图和柱形图的时候,发现GO条目的名字都重叠在一起了.

气泡图

柱形图

我们知道R的版本在不停的更新,相应的R包也在不停的更新.我把绘制气泡图和柱形图相关的函数拿出来认真的研究了一下,终于发现的症结所在.

dotplot这个函数,多了个 label_format 参数

r语言go数据包_go解析数据包-图2

我们来看看这个参数究竟是干什么用的,看看参数说明

label_format :

是不是还是原来的配方,还是熟悉的味道

同样的柱形图,我们也能让他恢复原来的容貌.

关于如何使用R做GO和KEGG富集分析,可参考下文

R语言：clusterProfiler进行GO富集分析和Gene_ID转换

ID转换用到的是 bitr() 函数,bitr()的使用方法：

org.Hs.eg.db包含有多种gene_name的类型

keytypes() ：keytypes(x),查看注释包中可以使用的类型

columns() ：类似于keytypes(),针对org.Hs.eg.db两个函数返回值一致

select() ：select(x, keys, columns, keytype, ...) eg.

函数enrichGO()进行GO富集分析,enrichGO()的使用方法：

举例：

r语言ggbio包使用方法

第一步：获取要绘图的整洁数据（涉及到数据整洁和操作的知识）

第二步：整洁数据做映射操作,确定x,y,color,size,shape,alpha等

第三步：选择合适的几何对象（根据画图的目的、变量的类型和个数）

第四步：坐标系和刻度配置

第五步：标签信息和图例信息

第六步：选择合适的主题

数据（data）

映射（mapping）

几何对象（geom）

标度（scale）

统计变换（stats）

坐标系（coord）

位置调整（Position adjustments）

分面（facet）

主题（theme）

输出（output）

注意：

①.）添加图层的加号（+）只能放在行末尾

数据（Data）用于画图的整洁数据

library(tidyverse

ggplot()先只提供数据,创建一个空图形.

# ggplot()先提供整洁数据,生成一个空图形

映射,把数据变量集与图形属性库建立关联.

最常用的映射有：

x：x轴

y：y轴

color：颜色

size：大小

shape：形状

fill：填充

alpha：透明度

以mpg数据集为例,把变量displ和hwy分别映射到x和y,变量drv映射到color,此时图形就有了坐标轴和网格线,color需要在有了几何对象后才能体现出来.

# 映射操作

ggplot(data = mpg, mapping = aes(x = displ,

y = hwy, color = drv))

几何对象是表达数据的视觉对象

不同类型的几何对象是从不同的角度表达数据.

几何对象很简单,只需要添加图层即可.

例如,以mpg数据集为例,画散点图.

y = hwy,

color = drv)) +

geom_point()层依次叠加,在上图的基础上,再添加一个几何对象：光滑曲线.

#继续增加一个几何对象：光滑曲线

# 写法1

geom_point() +

geom_smooth(se=FALSE)

ggplot(data = mpg, mapping = aes(x = displ, y = hwy)) +

geom_point(aes(color = drv)) +

思考题：

标度

标度函数用来控制几何对象中的标度映射（x轴,y轴或者由color,fill,shape,size产生的图例）.

拓展功能：scales包提供很多设置刻度标签风格的函数,比如百分数、科学计数法法、美元格式等.

连续变量使用scale_*_continuous()函数,参数breaks设置各个刻度的位置,参数labels设置各个刻度对应的标签.

离散变量使用scale_*_discrete()函数,修改离散变量坐标轴的标签.

时间变量使用scale_x_date()函数设置日期刻度,参数date_breaks设置刻度间隔,date_labels设置标签的日期格式

以mpg数据集为例,修改连续变量坐标轴刻度及标签.

# scale_y_continuous函数

# 对比分析和观察

# 图1

ggplot(mpg, aes(displ, hwy)) +

geom_point()

labels = c(" 一五 "," 二五 "," 三五 "))

以mpg数据集为例,修改离散变量的标签

# scale_x_discrete函数

ggplot(mpg, aes(x = drv)) +

geom_bar()

geom_bar() +

"r" = " 后驱 "))

# scale_x_date函数

economics %% glimpse()

geom_line()

geom_line() +

scale_y_continuous(labels = scales::percent)

用labs()函数参数x,y或者xlab(),ylab(),设置x轴,y轴标签.

若用参数color生成了图例,可以在labs()函数用参数color修改图例名.

用theme图层的参数legend.position设置图例的位置.

以mpg数据为例.

# 修改坐标轴标签,图例名和图例位置

mpg

labs(x = " 引擎大小 (L)", y = " 高速燃油率 (mpg)",

color = " 驱动类型 ") +

theme(legend.position = "top")

xlab(" 引擎大小 (L)") +

ylab(" 高速燃油率 (mpg)") +

labs(color = " 驱动类型 ") +

theme(legend.position = "none")

用coord_cartesian()函数参数xlim和ylim,或者用xlim(),ylim()设置x轴和y轴的范围.

以mpg数据集为例.

# 修改坐标轴的范围

# 图1 coord_cartesian()的参数xlim和ylim

用scale_x_log10()函数变换坐标系,可以保持原始数据的坐标刻度.

用labs()函数设置图形标题.

参数title 设置正标题

参数subtitle 设置副标题

参数caption 设置脚注标题（默认右下角）

# 设置标题

# mpg数据集为例

p - ggplot(mpg, aes(displ, hwy)) +

geom_smooth(se = FALSE) +

labs(title = " 燃油效率与引擎大小的关系图 ",

subtitle = " 两座车 ( 跑车 ) 因重量小而符合预期 ",

caption = " 数据来自 fueleconomy.gov")

标题若要居中,采用theme图层设置.

数据的某个维度信息可以通过颜色来表示.

可以直接使用颜色值,建议使用RColorBrewer（调色板）或者colorspace包.

①.）连续变量

- 用scale_color_gradient()设置二色渐变色.

# 连续变量

# 图1 scale_color_gradient()函数

ggplot(mpg, aes(displ, hwy, color = hwy)) +

scale_color_gradient(low = "green", high = "red")

- 用scale_color_distiller()设置调色板中的颜色

scale_color_distiller(palette = "Set1")

- 用scale_color_manual()手动设置颜色,还可以修改图例及其标签信息

# 离散变量

# 图1 scale_color_manual()函数

ggplot(mpg, aes(displ, hwy, color = drv)) +

scale_color_manual(" 驱动方式 ",

values = c("red", "blue", "green"),

labels = c(" 四驱 ", " 前驱 ", " 后驱 "))

-用scale_fill_brewer()调用调色板中的颜色

ggplot(mpg, aes(x = class, fill = class)) +

ggrepel包提供了geom_label_repel()函数或者geom_text_repel()函数,为图形添加文字标注.

操作步骤：

第一步：先准备好标记点的数据

第二步：增加文字标注图层,包括标记点的数据和标注的文字给label参数

# 设置文字标注信息

library(ggrepel)

# 选取每种车型 hwy 值最大的样本

best_in_class - mpg %%

r语言go数据包_go解析数据包-图3

group_by(class) %%

slice_max(hwy, n = 1)

best_in_class %% select(class, model, hwy)

geom_point(aes(color = class)) +

geom_label_repel(data = best_in_class,

aes(label = model))

计变换、坐标系和位置调整

.1 统计变换

统计变换是构建新的统计量而画图.

例如,条形图或直方图,是对数据分组的频数做画图；平滑曲线是对数据拟合模型的预测值画图.

①.）可在几何对象中直接使用的统计变换,直接使用几何对象就可以了.

能在几何对象创建的,而需要单独使用.

mpg数据集为例.

stat_summary()做统计绘图并汇总.

# 图1 stat_summary()做统计绘图并汇总

p - ggplot(mpg, aes(x = class, y = hwy)) +

p + stat_summary(fun = mean,

fun.min = function (x) {mean(x) - sd(x)},

fun.max = function (x) {mean(x) + sd(x)},

geom = "pointrange",

color = "red")

tat_smooth()添加光滑曲线,与geom_smooth()相同.

参数method设置平滑曲线的拟合方法,如lm线性回归、glm广义线性回归、loess多项式回归、gam广义加法模型(mgcv包)、rlm稳健回归(MASS包)等.

参数se设置是否绘制置信区间.

stat_smooth(method = "lm",

se = FALSE)

geom_smooth(method = "lm",

- coord_cartesian()

常用的其它坐标系：

以mpg数据集为例,坐标轴翻转.

# 图1 坐标轴翻转coord_flip()

p - ggplot(mpg, aes(class, hwy)) +

geom_boxplot()

p + coord_flip()

直角坐标下条形图转换为极坐标下玫瑰图.

p - ggplot(mpg, aes(class, fill = drv)) +

p + coord_polar()

条形图的位置调整

# 图1：条形图条形位置调整

ggplot(mpg, aes(class, fill = drv)) +

geom_bar(position = "dodge")

geom_bar(position = position_dodge(preserve = "single"))

散点图的散点位置调整

# 图1：散点图的散点位置调整

geom_point(position = "jitter")

用patchwork包排布多个图形

library(patchwork)

p1 - ggplot(mpg, aes(displ, hwy)) +

分面

利用分类变量把图形分成若干"子图"（面）,实际上就是对数据分组后再画图,属于数据分析里面细分和下钻的思想.

封装分面,先生成一维的面板系列,再封装到二维中.

参数scales设置是否共用坐标刻度,fixed 默认共用, free 不共用,还可以额通过free_x,free_y单独设置.

[R语言] GO富集分析可视化 GOplot::GOCircle

查看GOplot内示例数据的格式,对自己的数据做处理

观察结论：

观察自己的两个数据表：

table.legend 设置为T时会显示表格

本图中表格和图例是出图后剪切拼合而成,没有用R中的拼图包

以上就是土嘎嘎小编为大家整理的r语言go数据包相关主题介绍,如果您觉得小编更新的文章只要能对粉丝们有用,就是我们最大的鼓励和动力,不要忘记讲本站分享给您身边的朋友哦！！

网站首页

视频教程

下载频道

文章中心

问答中心

在线工具

r语言go数据包_go解析数据包

【R语言】解决GO富集分析绘图,标签重叠问题

R语言：clusterProfiler进行GO富集分析和Gene_ID转换

r语言ggbio包使用方法

[R语言] GO富集分析可视化 GOplot::GOCircle

相关推荐

编辑推荐

热门文章