色博土导航
发布日期:2025-12-17 13:50 点击次数:156在这个月的前几期推文中色博土导航,主要基于单细胞数据使用小提琴图可视化marker基因进行了整理:
VlnPlot后果及常用参数浅析
基于VlnPlot参数及ggplot2好意思化小提琴图
也有一期答读者问——小提琴图有点无图是何启事?
这期就一齐来学习一下画观点基因的小提琴图并谈论显赫性!
小提琴图可视化并谈论显赫性用途在单细胞数据分析中,通过小提琴图可视化和显赫性谈论不错匡助盘考者直不雅且统计地评估观点基因在不同细胞群体中的抒发相反
展示基因在不同细胞群体的抒发散布:小提琴图不错直不雅地展示基因在各个细胞亚群中的抒发水温情散布情况。
小提琴图巧合响应不同群体中抒发的中位数、四分位数及抒发值的变化鸿沟。特等是在复杂的细胞亚群中,这种散布展示荒谬有助于发现基因的相反性抒发。
详情基因在不同亚群中的特异性抒发:通过显赫性谈论不错明确观点基因是否在特定细胞亚群中显赫抒发。
举例,通过t磨真金不怕火或非参数磨真金不怕火(如Wilcoxon磨真金不怕火)来比拟不同亚群间的抒发水平,匡助筛选出与特定功能或病理情景关系的细胞群体。
为后续功能盘考提供痕迹:显赫性相反的基因抒发频频不错看到基因可能在不同细胞群体的生物功能或疾病流程中起要津作用。
是以当咱们需要查抄单细胞不同分组,或者不同细胞亚群中某个方针基因的抒发情况况且比拟的技巧,就不错谈论一下显赫性
基于小提琴图可视化方针基因也曾以pbmc数据为例,展示NKG7基因在不同细胞亚群中的抒发情况,谈论并展示不同分组间的显赫性
载入需要的数据#给亚群定名new.cluster.ids <- c("Naive CD4 T", "CD14+ Mono", "Memory CD4 T", "B", "CD8 T","FCGR3A+ Mono", "NK", "DC", "Platelet")names(new.cluster.ids) <- levels(pbmc)# 修改Idents等分群编号为细胞类型pbmc <- RenameIdents(pbmc, new.cluster.ids)DimPlot(pbmc, reduction = "umap", label = TRUE, repel = T,pt.size = 0.5) + NoLegend()pbmc$cluster_by_counts=Idents(pbmc)pbmc$celltype=Idents(pbmc)#谈论marker基因pbmc.markers <- FindAllMarkers(pbmc, only.pos = TRUE, min.pct = 0.25, logfc.threshold = 0.25, verbose = FALSE)top5 = pbmc.markers %>% group_by(cluster) %>% top_n(n = 5, wt = avg_log2FC)g = unique(top5$gene)可视化NKG7在不同分群抒发情况# 使用VlnPlot生成NKG7的分组小提琴图,并去掉图例p <- VlnPlot(object = pbmc, features = 'NKG7', pt.size = 0) + NoLegend() + theme(axis.text.x = element_text(angle = 90, hjust = 1))
图片
从小提琴图中不错看到NKG7基因在"CD8 T"以及"NK"中抒发较高, 在"FCGR3A+ Mono"和"DC"中抒发也较其余几个分组高,不错谈论一下这几个分组间的显赫性,然后比拟
显赫性谈论和可视化使用ggpubr包中的stat_compare_means函数在图形上败露不同组之间的显赫性磨真金不怕火后果。
调用常见的统计磨真金不怕火模范(举例t磨真金不怕火、Wilcoxon秩和磨真金不怕火、ANOVA等)来比拟不同组之间的数值相反,并复返显赫性秀丽。
凭证comparisons参数中界说的组别对来谈论两两显赫性。举例,若是comparisons = list(c("Group1", "Group2")),则只比拟“Group1”和“Group2”之间的显赫性。 若未指定具体组对,况且数据包含多个组,会默许进行全局比拟。
凭证遴荐的磨真金不怕火模范,stat_compare_means会在数据里面履行关系的显赫性磨真金不怕火,复返每组对的p值。
凭证谈论获取的p值,生成对应的显赫性秀丽(如*、**、***、****),并凭证p值鸿沟放置秀丽败露:
ns:暗示“不显赫”(not significant),即 p 值 > 0.05,泰国按摩群标明两组之间的相反莫得统计学显赫性。*:暗示 p 值 ≤ 0.05,标明两组之间的相反具有统计学显赫性。**:暗示 p 值 ≤ 0.01,相反高度显赫。***:暗示 p 值 ≤ 0.001,相反极显赫。****:暗示 p 值 ≤ 0.0001,相反荒谬显赫。不错通过参数label = "p.signif"(仅败露显赫性秀丽)或label = "p"(败露具体的p值)进行放置。
1. 遴荐需要比拟的分组进行显赫性谈论和展示#凭证需要遴荐进行比拟的分组my_comparisons <- list( c("CD8 T", "FCGR3A+ Mono"), c("FCGR3A+ Mono", "NK"), c("NK", "DC"))library(ggpubr)# 将VlnPlot调治为ggplot对象,然后添加显赫性比拟p + stat_compare_means(comparisons = my_comparisons,method = "t.test")+ ylim(-2, 15)图片
2. 用*号败露显赫性秀丽,不败露具体数值#用*号败露显赫性秀丽,不败露具体数值p + stat_compare_means(comparisons = my_comparisons,method = "t.test",label = "p.signif")+ ylim(-2, 15)
图片
3. stat_summary()将每个组的均值败露为红点#stat_summary()将每个组的均值败露为红点,便于对比哪个组的平均抒发水平更高。p + stat_compare_means(comparisons = my_comparisons,method = "t.test",label = "p.signif")+ ylim(-2, 15)+ stat_summary(fun = mean, geom = "point", color = "red", size = 3)
图片
stat_summary 是ggplot2包中的一个函数,可用于在图中添加统计提要(举例均值、模范差、中位数等),不错将将指定的统计谈论后果(如平均值或中位数)平直近似到现存的图层上
若是在谈论出不同分组的显赫性之后,不成平直看出来哪个组比哪个组高,不错tat_summary()将每个组的均值败露为红点,便于对比
文末友情宣传若是你也念念作念单细胞转录组数据分析色博土导航,最佳是有我方的谈论机资源哦,比如咱们的2024的分享行状器交个一又友福利价仍然是800,而且还需要有基本的生物信息学基础,也不错望望咱们的生物信息学马拉松讲课,你的生物信息学初学课。
本站仅提供存储行状,通盘现实均由用户发布,如发现存害或侵权现实,请点击举报。