Thanks to visit codestin.com
Credit goes to github.com

Skip to content
/ GEO Public
forked from jmzeng1314/GEO

A2Z DEG and enrichment analysis tutorial on GEO database microarray datasets GSE42872 Affymetrix Human Gene 1.0 ST Array and GSE11121 from Affymetrix Human Genome U133A Array, as well as DEG analysis on RNA-Seq count data

Notifications You must be signed in to change notification settings

JackieMium/GEO

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

63 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

fork 自 Jimmy 的一个处理芯片和 RNA -Seq 数据的 Repo。 原 Repo 信息:

Create: Jianming Zeng
Date: 2018-07-09 20:11:07
Email: [email protected]
Blog: http://www.bio-info-trainee.com/
Forum: http://www.biotrainee.com/thread-1376-1-1.html
CAFS/SUSTC/Eli Lilly/University of Macau
Update Log: 2018-07-09 First version

All credits goes to jmzeng1314. ——————————————————————————————————————————————

Repo 内容概览:

  • 流程涵盖芯片和 RNA-Seq 数据处理的常规流程,前者包括表达数据矩阵获取、数据读入和存储、芯片注释和 DEG 分析,DEG 结果的常见下游富集分析和生存分析和简单可视化;后者包括 RNA-Seq count data 分别通过 DEseq2、edgeR 和 limma-voom 进行 DEG 分析和简单可视化。
  • 项目包含两个不同芯片( GSE42872 和 GSE11122) 和一个 RNA-Seq 数据 (airway),分别放在单独文件夹下。
  • 每个项目文件夹顶层为所有需要用到的 R 脚本,文件夹 raw_data 下存放原始数据,是 GEO 表达矩阵数据或 count data;文件夹 output_data 存放中间数据或输出结果数据;output_plots 存放输出的图片。
  • GSE42872 来自 Affymetrix Human Gene 1.0 ST Array [transcript (gene) version] 芯片,6 个样本 3+3 分为两组。详细信息参考 GEO 页面介绍。
  • GSE11122 来自 Affymetrix Human Genome U133A Array 芯片,200 个样本。详细信息参考 GEO 页面介绍。
  • airway 来自 airway 包自带数据集,是人气道平滑肌细胞的 RNA—Seq 数据。详细信息参考 GEO 页面介绍和 airway 文件夹内 PDF(原始文献)。

使用指北

建议下载 Repo 后双击 xxx.Rproj 在 RStudio 中打开项目文件,然后依次打开打开 stepNum.R 这些文件就可以愉快地开始了。 注意:

  • 每执行完一个脚本时建议重启 R,在 RStudio 中快捷键 Ctrl + Shifr + F10 即可;
  • 由于原始数据、中间输出数据和图在 Repo 其实里已经有了,所以建议在执行到存储数据或存储图片时直接跳过,或者更好的做法是,更改文件名或者存储路径,这样你就可以把你输出的文件或者图片和 repo 里的做对比,看看你的输出(或者我的)有没有问题。
  • 中国大陆网络环境建议切换镜像到国内并安装需要用到的包,举例:
options(repos="http://mirrors.ustc.edu.cn/CRAN/")
install.packages("pheatmap")

source("https://bioconductor.org/biocLite.R") 
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/")
BiocInstaller::biocLite('org.Hs.eg.db')

部分结果图片

样本聚类和主成分分析:

Cluster

PCA

差异基因火山图

50 个差异基因的热图

heatmap

KEGG 富集

KEGG_GSEA

KEGG-enrichment

GO 富集

GO-BP

生存分析

Survival

About

A2Z DEG and enrichment analysis tutorial on GEO database microarray datasets GSE42872 Affymetrix Human Gene 1.0 ST Array and GSE11121 from Affymetrix Human Genome U133A Array, as well as DEG analysis on RNA-Seq count data

Topics

Resources

Stars

Watchers

Forks

Packages

No packages published

Languages

  • R 100.0%