网站首页 > 文章中心 > 其它

r语言go数据包_go解析数据包

作者:小编 更新时间:2023-08-12 18:06:47 浏览量:471人看过

【R语言】解决GO富集分析绘图,标签重叠问题

前面我给大家详细介绍过

GO简介及GO富集结果解读

四种GO富集柱形图、气泡图解读

GO富集分析四种风格展示结果—柱形图,气泡图

KEGG富集分析—柱形图,气泡图,通路图

DAVID GO和KEGG富集分析及结果可视化

r语言go数据包_go解析数据包-图1

也用视频给大家介绍过

GO和KEGG富集分析视频讲解

最近有粉丝反映说,利用clusterProfiler这个包绘制GO富集分析气泡图和柱形图的时候,发现GO条目的名字都重叠在一起了.

气泡图

柱形图

我们知道R的版本在不停的更新,相应的R包也在不停的更新.我把绘制气泡图和柱形图相关的函数拿出来认真的研究了一下,终于发现的症结所在.

dotplot这个函数,多了个 label_format 参数

r语言go数据包_go解析数据包-图2

我们来看看这个参数究竟是干什么用的,看看参数说明

label_format :

是不是还是原来的配方,还是熟悉的味道

同样的柱形图,我们也能让他恢复原来的容貌.

关于如何使用R做GO和KEGG富集分析,可参考下文

R语言:clusterProfiler进行GO富集分析和Gene_ID转换

ID转换用到的是 bitr() 函数,bitr()的使用方法:

org.Hs.eg.db包含有多种gene_name的类型

keytypes() :keytypes(x),查看注释包中可以使用的类型

columns() :类似于keytypes(),针对org.Hs.eg.db两个函数返回值一致

select() :select(x, keys, columns, keytype, ...) eg.

函数enrichGO()进行GO富集分析,enrichGO()的使用方法:

举例:

r语言ggbio包使用方法

第一步:获取要绘图的整洁数据(涉及到数据整洁和操作的知识)

第二步:整洁数据做映射操作,确定x,y,color,size,shape,alpha等

第三步:选择合适的几何对象(根据画图的目的、变量的类型和个数)

第四步:坐标系和刻度配置

第五步:标签信息和图例信息

第六步:选择合适的主题

数据(data)

映射(mapping)

几何对象(geom)

标度(scale)

统计变换(stats)

坐标系(coord)

位置调整(Position adjustments)

分面(facet)

主题(theme)

输出(output)

注意:

①.)添加图层的加号(+)只能放在行末尾

数据(Data)用于画图的整洁数据

library(tidyverse

ggplot()先只提供数据,创建一个空图形.

# ggplot()先提供整洁数据,生成一个空图形

映射,把数据变量集与图形属性库建立关联.

最常用的映射有:

x:x轴

y:y轴

color:颜色

size:大小

shape:形状

fill:填充

alpha:透明度

以mpg数据集为例,把变量displ和hwy分别映射到x和y,变量drv映射到color,此时图形就有了坐标轴和网格线,color需要在有了几何对象后才能体现出来.

# 映射操作

ggplot(data = mpg, mapping = aes(x = displ,

y = hwy, color = drv))

几何对象是表达数据的视觉对象

不同类型的几何对象是从不同的角度表达数据.

几何对象很简单,只需要添加图层即可.

例如,以mpg数据集为例,画散点图.

y = hwy,

color = drv)) +

geom_point()层依次叠加,在上图的基础上,再添加一个几何对象:光滑曲线.

#继续增加一个几何对象:光滑曲线

# 写法1

geom_point() +

geom_smooth(se=FALSE)

ggplot(data = mpg, mapping = aes(x = displ, y = hwy)) +

geom_point(aes(color = drv)) +

思考题:

标度

标度函数用来控制几何对象中的标度映射(x轴,y轴或者由color,fill,shape,size产生的图例).

拓展功能:scales包提供很多设置刻度标签风格的函数,比如百分数、科学计数法法、美元格式等.

连续变量使用scale_*_continuous()函数,参数breaks设置各个刻度的位置,参数labels设置各个刻度对应的标签.

离散变量使用scale_*_discrete()函数,修改离散变量坐标轴的标签.

时间变量使用scale_x_date()函数设置日期刻度,参数date_breaks设置刻度间隔,date_labels设置标签的日期格式

以mpg数据集为例,修改连续变量坐标轴刻度及标签.

# scale_y_continuous函数

# 对比分析和观察

# 图1

ggplot(mpg, aes(displ, hwy)) +

geom_point()

labels = c(" 一五 "," 二五 "," 三五 "))

以mpg数据集为例,修改离散变量的标签

# scale_x_discrete函数

ggplot(mpg, aes(x = drv)) +

geom_bar()

geom_bar() +

"r" = " 后驱 "))

# scale_x_date函数

economics %% glimpse()

geom_line()

geom_line() +

scale_y_continuous(labels = scales::percent)

用labs()函数参数x,y或者xlab(),ylab(),设置x轴,y轴标签.

若用参数color生成了图例,可以在labs()函数用参数color修改图例名.

用theme图层的参数legend.position设置图例的位置.

以mpg数据为例.

# 修改坐标轴标签,图例名和图例位置

mpg

labs(x = " 引擎大小 (L)", y = " 高速燃油率 (mpg)",

color = " 驱动类型 ") +

theme(legend.position = "top")

xlab(" 引擎大小 (L)") +

ylab(" 高速燃油率 (mpg)") +

labs(color = " 驱动类型 ") +

theme(legend.position = "none")

用coord_cartesian()函数参数xlim和ylim,或者用xlim(),ylim()设置x轴和y轴的范围.

以mpg数据集为例.

# 修改坐标轴的范围

# 图1 coord_cartesian()的参数xlim和ylim

用scale_x_log10()函数变换坐标系,可以保持原始数据的坐标刻度.

用labs()函数设置图形标题.

参数title 设置正标题

参数subtitle 设置副标题

参数caption 设置脚注标题(默认右下角)

# 设置标题

# mpg数据集为例

p - ggplot(mpg, aes(displ, hwy)) +

geom_smooth(se = FALSE) +

labs(title = " 燃油效率与引擎大小的关系图 ",

subtitle = " 两座车 ( 跑车 ) 因重量小而符合预期 ",

caption = " 数据来自 fueleconomy.gov")

p

标题若要居中,采用theme图层设置.

数据的某个维度信息可以通过颜色来表示.

可以直接使用颜色值,建议使用RColorBrewer(调色板)或者colorspace包.

①.)连续变量

- 用scale_color_gradient()设置二色渐变色.

# 连续变量

# 图1 scale_color_gradient()函数

ggplot(mpg, aes(displ, hwy, color = hwy)) +

scale_color_gradient(low = "green", high = "red")

- 用scale_color_distiller()设置调色板中的颜色

scale_color_distiller(palette = "Set1")

- 用scale_color_manual()手动设置颜色,还可以修改图例及其标签信息

# 离散变量

# 图1 scale_color_manual()函数

ggplot(mpg, aes(displ, hwy, color = drv)) +

scale_color_manual(" 驱动方式 ",

values = c("red", "blue", "green"),

labels = c(" 四驱 ", " 前驱 ", " 后驱 "))

-用scale_fill_brewer()调用调色板中的颜色

ggplot(mpg, aes(x = class, fill = class)) +

ggrepel包提供了geom_label_repel()函数或者geom_text_repel()函数,为图形添加文字标注.

操作步骤:

第一步:先准备好标记点的数据

第二步:增加文字标注图层,包括标记点的数据和标注的文字给label参数

# 设置文字标注信息

library(ggrepel)

# 选取每种车型 hwy 值最大的样本

best_in_class - mpg %%

r语言go数据包_go解析数据包-图3

group_by(class) %%

slice_max(hwy, n = 1)

best_in_class %% select(class, model, hwy)

geom_point(aes(color = class)) +

geom_label_repel(data = best_in_class,

aes(label = model))

计变换、坐标系和位置调整

.1 统计变换

统计变换是构建新的统计量而画图.

例如,条形图或直方图,是对数据分组的频数做画图;平滑曲线是对数据拟合模型的预测值画图.

①.)可在几何对象中直接使用的统计变换,直接使用几何对象就可以了.

能在几何对象创建的,而需要单独使用.

mpg数据集为例.

stat_summary()做统计绘图并汇总.

# 图1 stat_summary()做统计绘图并汇总

p - ggplot(mpg, aes(x = class, y = hwy)) +

p + stat_summary(fun = mean,

fun.min = function (x) {mean(x) - sd(x)},

fun.max = function (x) {mean(x) + sd(x)},

geom = "pointrange",

color = "red")

tat_smooth()添加光滑曲线,与geom_smooth()相同.

参数method设置平滑曲线的拟合方法,如lm线性回归、glm广义线性回归、loess多项式回归、gam广义加法模型(mgcv包)、rlm稳健回归(MASS包)等.

参数se设置是否绘制置信区间.

stat_smooth(method = "lm",

se = FALSE)

geom_smooth(method = "lm",

- coord_cartesian()

常用的其它坐标系:

以mpg数据集为例,坐标轴翻转.

# 图1 坐标轴翻转coord_flip()

p - ggplot(mpg, aes(class, hwy)) +

geom_boxplot()

p + coord_flip()

直角坐标下条形图转换为极坐标下玫瑰图.

p - ggplot(mpg, aes(class, fill = drv)) +

p + coord_polar()

条形图的位置调整

# 图1:条形图条形位置调整

ggplot(mpg, aes(class, fill = drv)) +

geom_bar(position = "dodge")

geom_bar(position = position_dodge(preserve = "single"))

散点图的散点位置调整

# 图1:散点图的散点位置调整

geom_point(position = "jitter")

用patchwork包排布多个图形

library(patchwork)

p1 - ggplot(mpg, aes(displ, hwy)) +

分面

利用分类变量把图形分成若干"子图"(面),实际上就是对数据分组后再画图,属于数据分析里面细分和下钻的思想.

封装分面,先生成一维的面板系列,再封装到二维中.

参数scales设置是否共用坐标刻度,fixed 默认 共用, free 不共用,还可以额通过free_x,free_y单独设置.

[R语言] GO富集分析可视化 GOplot::GOCircle

查看GOplot内示例数据的格式,对自己的数据做处理

观察结论:

观察自己的两个数据表:

table.legend 设置为T时会显示表格

本图中表格和图例是出图后剪切拼合而成,没有用R中的拼图包

以上就是土嘎嘎小编为大家整理的r语言go数据包相关主题介绍,如果您觉得小编更新的文章只要能对粉丝们有用,就是我们最大的鼓励和动力,不要忘记讲本站分享给您身边的朋友哦!!

版权声明:倡导尊重与保护知识产权。未经许可,任何人不得复制、转载、或以其他方式使用本站《原创》内容,违者将追究其法律责任。本站文章内容,部分图片来源于网络,如有侵权,请联系我们修改或者删除处理。

编辑推荐

热门文章