目录
情形
不同种类的萼片差异
数据类型查看:
差异分析:
不同萼片的种类差异
数据准备
二分类卡方检验
绘图
情形
:当有两列数据进行分析比较时,一列为连续变量,一列数据为分类变量。
rm(list = ls())
library(ggplot2)
library(ggpubr)
library(cowplot)
data
如下整理鸢尾花部分数据:“Sepal.Length”是连续变量,“Species”只选择了两种数据。
分析两列数据:2种情况
①比较不同种类的萼片长度是否存在差异。
②比较不同萼片长度的种类是否存在差异。
不同种类的萼片差异
数据类型查看:
数据分布检测:第六讲 R-数据正态分布检验 – 知乎 (zhihu.com)
#①比较不同种类的萼片长度是否存在差异。
#分析方法选择
shapiro.test(data2$Sepal.Length)
#W = 0.96964, p-value = 0.02076 不符合正太分布
#密度图
ggdensity(data2$Sepal.Length,
main = "Density plot of sepal length",
xlab = "sepal length")
#正态性测试对样本量敏感。小样本最常通过正态性测试。
#因此,重要的是将外观检查和显着性测试相结合以做出正确的决定
#综合分析也可以采用t检验
数据分布情况
差异分析:
#pdf("plot.pdf",width = 4,height = 4)##保存图片
p
不同萼片的种类差异
将萼片长度分为二分类变量(如:长短),然后分析不同萼片组的种类是否存在差异
数据准备
##数据准备
rm(list = ls())
library(ggplot2)
library(ggpubr)
library(cowplot)
data
二分类卡方检验
R语言卡方检验最全总结_医学和生信笔记的博客-CSDN博客
R语言—卡方检验 – 知乎 (zhihu.com)
R=C=2时四格表卡方检验
当 n(样本量)≥40 且所有的T(期望频数)≥5时,用2检验的基本公式或四格表资料之2检验的专用公式;当P ≈ 时,改用四格表资料的 Fisher 确切概率法;
当 n≥40 但有 1≤T 当 n
#生服务器托管网成二维列联表
mytable
绘图
比例计算
##绘制堆砌图并展示结果
#表格汇总结果(为了展示比例)
result %
group_by(Species, SepalLength) %>%
summarize(count = n()) %>%
mutate(proportion = count / sum(count))
print(result)# 输出结果
result
完整图
#pdf("plot.pdf",width = 4,height = 4)##保存图片
ggplot(data3,aes(x=SepalLength,#X轴
fill=Species))+
geom_bar(position = "fill")+
scale_y_continuous(expand = expansion(mult=c(0.01,0.1)),##展示百分比服务器托管网
labels = scales::percent_format())+
scale_fill_manual(values = c("setosa"="#98d09d","versicolor"="#dadada"),##根据需求修改配色
limits=c("setosa","versicolor"))+
theme_set(theme_bw())+
theme(panel.grid = element_blank())+#不展示网格线
geom_text(data=dat01,##展示比例
aes(x=SepalLength,y=0.05,#设置Y轴展示的位置
label=paste0(dat01$proportion)),##展示的是比例
inherit.aes = FALSE,
vjust=-0.2)+
geom_text(aes(x = 1.5, y = 1.1,#调整文本注释位置
label = "p-value 1.244e-15"))+#添加P(前面计算)
labs(title = "AAABBB",#标题
x="SepalLength",
y="Species")
dev.off()
更多绘图细节
ggplot2作图最全教程(上) – 知乎 (zhihu.com)
ggplot2作图最全教程(下) – 知乎 (zhihu.com)
服务器托管,北京服务器托管,服务器租用 http://www.fwqtg.net
相关推荐: Kernel Memory 入门系列:自定义处理流程
Kernel Memory 入门系列:自定义处理流程 在整个文档预处理的流程中,涉及到很多的处理步骤,例如:文本提取,文本分片,向量化和存储。这些步骤是Kernel Memory中的默认提供的处理方法,如果有一些其他的需求,也可以进行过程的自定义。 自定义Ha…