IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> Python知识库 -> Chip-seq分析笔记 -> 正文阅读

[Python知识库]Chip-seq分析笔记

目录

前言

一、软件安装

二、创建环境及安装软件

1.创建环境 chipseq

2.chipseq 环境下安装软件

三、具体分析步骤

1.数据来源

2.下载数据并重命名

3.fastq 文件转换(--sra-id?此步骤把 SRR 的名称改掉,加快运行速度,速度非常快)

4.质控

4.1 trim_galore

4.2 FastQC质控报告生成(旧的数据)

5.bowtie2比对(15min/file)

6.samtools sam?转换?bam

6.1view &sort

6.2 index

7.bamCoverage?BW转换 bam 转换成 bw

8.IGV查看 bw文件 peak

9.MACS2 callpeak

10.MACS2 差异分析(2021-10-15 待完善)

11.Homer 分析 motif

11.1查看所有的?list:

11.2下载注释信息

11.3 Create a tag directory

11.4 Differentially Bound Peaks(找差异peak)

11.5?Annotate peaks(Peak注释)

用 R 把差异peak 和 Peak 注释合并:fread,merge 函数

11.6 其他功能

12. ROSE 寻找超级增强子 SE(super enhancer)

12.1 参考教程:?ROSE | 超级增强子鉴定

12.2 ROSE 安装见上

12.3 ROSE 寻找 SE


前言

自己做笔记自己看的


一、软件安装

? 设备:mac m1 电脑

?? ? ? ? ? ? ? ? ? ???????Anaconda | Individual Edition??下载链接

? ? ? ? ? ? ? ? ? ?Installing on macOS — Anaconda documentation?帮助链接

? ? ? ? ? ? ? ?pycharm CE

二、创建环境及安装软件

1.创建环境 chipseq

conda? create -n chipseq? python=3
	conda activate chipseq #激活环境
	conda deactivate

2.chipseq 环境下安装软件

ps:一项一项安装,不然容易卡住

conda install -y bioconda parallel-fastq-dump ?#SRR→FASTQ 转换

conda install -y trim-galore #质控

conda install -y?bioconda bowtie2 # fastq比对到 hg19

brew tap homebrew/science?

brew install samtools?#sam 转化为 bam

conda install -y macs2 #峰值定量,差异分析

conda install -y conda-forge libgfortran #macs2 差异分析辅助用

conda install -y bioconda deeptools #可视化
   #包含 bamcoverage
    https://deeptools.readthedocs.io/en/latest/content/tools/bamCoverage.html

IGV 下载https://software.broadinstitute.org/software/igv/download #可视化




ROSE 安装

https://bitbucket.org/young_computation/rose/src/master/ ROSE 下载
#把所有要处理的文件都放到 rose 文件夹:sorted.bam, bed,bam.bai
#创建 Python2.7
	conda  create -n rose  python=2.7
	conda activate rose

Homer安装

perl configureHomer.pl -install

open -a TextEdit ~/.bash_profile

PATH=$PATH:/Users/chucknorris/homer/bin/??#路径加入到系统路径中

source ~/.bash_profile
  • perl?configureHomer.pl -list #查看所有的?list

三、具体分析步骤

1.数据来源

使用数据Wang J, Zou JX, Xue X, Cai D et al.?ROR-γ drives androgen receptor expression and represents a therapeutic target in castration-resistant prostate cancer.?Nat Med?2016 May;22(5):488-96. PMID:?27019329

GSM1868876: C4-2B vehicle Input chip seq; Homo sapiens; ChIP-Seq(SRR2242690)

https://trace.ncbi.nlm.nih.gov/Traces/sra/?run=SRR2242690

GSM1868866: C4-2B vehicle AR chip seq; Homo sapiens; ChIP-Seq(SRR2242680)

https://trace.ncbi.nlm.nih.gov/Traces/sra/?run=SRR2242680

GSM1868862: 2nd time C4-2B vehicle AR chip seq; Homo sapiens; ChIP-Seq(SRR2242676)?

https://trace.ncbi.nlm.nih.gov/Traces/sra/?run=SRR2242676

GSM1868864: 2nd time C4-2B vehicle Input chip seq; Homo sapiens; ChIP-Seq(SRR2242678)

https://trace.ncbi.nlm.nih.gov/Traces/sra/?run=SRR2242678

2.下载数据并重命名

wget https://sra-pub-run-odp.s3.amazonaws.com/sra/SRR8557353/SRR8557353
mv???? SRR8557353????? input.h3k.con
?
wget https://sra-downloadb.be-md.ncbi.nlm.nih.gov/sos3/sra-pub-run-20/SRR8557351/SRR8557351.1
mv? SRR8557351.1?? ip.h3k.con
?
wget https://sra-downloadb.be-md.ncbi.nlm.nih.gov/sos3/sra-pub-run-21/SRR8557354/SRR8557354.1
mv? SRR8557354.1?? input.h3k.xy
?
wget https://sra-pub-run-odp.s3.amazonaws.com/sra/SRR8557352/SRR8557352
mv?? SRR8557352???? ip.h3k.xy

3.fastq 文件转换(--sra-id?此步骤把 SRR 的名称改掉,加快运行速度,速度非常快)

parallel-fastq-dump —sra-id input.h3k.con —threads 35? —outdir out/ —split-files —gzip
parallel-fastq-dump —sra-id ip.h3k.con?? —threads 35? —outdir out/ —split-files —gzip
parallel-fastq-dump —sra-id? input.h3k.xy?? —threads 35? —outdir out/ —split-files —gzip
parallel-fastq-dump —sra-id?? ip.h3k.xy?? —threads 35? —outdir out/ —split-files —gzip

4.质控

4.1 trim_galore

  • trim_galore(只能单线程)
    • Cutadapt:去接头,去除3端低质量碱基,去除长度太短的序列
      • ????report.txt
      • ????fq.gz(用来比对)
trim_galore input.h3k.con_1.fastq.gz? -q 25 —phred33 —length 25 -e 0.1 —stringency 4 
trim_galore input.h3k.xy_1.fastq.gz? -q 25 —phred33 —length 25 -e 0.1 —stringency 4 
trim_galore ip.h3k.con_1.fastq.gz? -q 25 —phred33 —length 25 -e 0.1 —stringency 4 
trim_galore ip.h3k.xy_1.fastq.gz? -q 25 —phred33 —length 25 -e 0.1 —stringency 4 

4.2 FastQC质控报告生成(旧的数据)

  • fastqc -o?/Users/xusiqi/CHIP/out?-t 6?/Users/xusiqi/CHIP/out/SRR2242680_1_trimmed.fq.gz
  • fastqc -o?/Users/xusiqi/CHIP/out?-t 6?/Users/xusiqi/CHIP/out/SRR2242690_1_trimmed.fq.gz
  • fastqc -o?输出绝对路径?-t 线程数 输入文件绝对路径
  • -o?后面为文件输出绝对路径,-t 6(为线程数),?最后为输入文件绝对路径;大约 5min/file

5.bowtie2比对(15min/file)

bowtie2 -p 35 -x /Users/xusiqi/CHIP/index/hg19/hg19 -U? /Users/xusiqi/CHIP/lesson23/out/input.h3k.con_1_trimmed.fq.gz? -S input.h3k.con.sam
bowtie2 -p 35 -x /Users/xusiqi/CHIP/index/hg19/hg19 -U? /Users/xusiqi/CHIP/lesson23/out/input.h3k.xy_1_trimmed.fq.gz? -S input.h3k.xy.sam
bowtie2 -p 35 -x /Users/xusiqi/CHIP/index/hg19/hg19 -U? /Users/xusiqi/CHIP/lesson23/out/ip.h3k.con_1_trimmed.fq.gz? -S ip.h3k.con.sam
bowtie2 -p 35 -x /Users/xusiqi/CHIP/index/hg19/hg19 -U? /Users/xusiqi/CHIP/lesson23/out/ip.h3k.xy_1_trimmed.fq.gz? -S ip.h3k.xy.sam

6.samtools sam?转换?bam

6.1view &sort

samtools view -S -b input.h3k.con.sam > input.h3k.con.bam
samtools sort input.h3k.con.bam -o input.h3k.con.sorted.bam
?
samtools view -S -b input.h3k.xy.sam > input.h3k.xy.bam
samtools sort input.h3k.xy.bam -o input.h3k.xy.sorted.bam
?
samtools view -S -b ip.h3k.con.sam >ip.h3k.con.bam
samtools sort ip.h3k.con.bam -o ip.h3k.con.sorted.bam
?
samtools view -S -b ip.h3k.xy.sam > ip.h3k.xy.bam
samtools sort ip.h3k.xy.bam -o ip.h3k.xy.sorted.bam

6.2 index

samtools index input.h3k.con.sorted.bam
samtools index input.h3k.xy.sorted.bam
samtools index ip.h3k.con.sorted.bam
samtools index? ip.h3k.xy.sorted.bam

7.bamCoverage?BW转换 bam 转换成 bw

bamCoverage -e 170 -bs 10 -p 35 -b input.h3k.con.sorted.bam -o input.h3k.con.sorted.bw
bamCoverage -e 170 -bs 10 -p 35 -b input.h3k.xy.sorted.bam -o input.h3k.xy.sorted.bw
bamCoverage -e 170 -bs 10 -p 35 -b ip.h3k.con.sorted.bam -o ip.h3k.con.sorted.bw
bamCoverage -e 170 -bs 10 -p 35 -b ip.h3k.xy.sorted.bam -o ip.h3k.xy.sorted.bw

8.IGV查看 bw文件 peak

9.MACS2 callpeak

  • macs2 callpeak -t?实验?sorted.bam?-c???对照inputsorted.bam?-g hs -B -f BAM -n?输出名称(无后缀,简单命名)?-q 0.05
    macs2 callpeak -t ip.h3k.con.sorted.bam -c? ?input.h3k.con.sorted.bam -g hs -B -f BAM -n con? -q 0.05
    macs2 callpeak -t ip.h3k.xy.sorted.bam -c? ?input.h3k.xy.sorted.bam -g hs -B -f BAM -n xy -q 0.05
    

10.MACS2 差异分析(2021-10-15 待完善)

参考教程:

Call differential binding events · macs3-project/MACS Wiki · GitHub

需要的文件名

  • input.h3k.con.sorted.bam
  • input.h3k.xy.sorted.bam?
  • ip.h3k.con.sorted.bam???
  • ip.h3k.xy.sorted.bam
  • con_control_lambda.bdg

  • xy_control_lambda.bdg

  • con_treat_pileup.bdg??

  • ?xy_treat_pileup.bdg

d-length?

tags after filtering

macs2 predictd -i input.h3k.con.sorted.bam

macs2 predictd -i input.h3k.xy.sorted.bam

macs2 predictd -i ip.h3k.con.sorted.bam

macs2 predictd -i??ip.h3k.xy.sorted.bam

199

205

13313222

24184450

22342330

21410271

202

callpeak excle?表中就有

11.Homer 分析 motif

公众号参考?HOMER | chipseq数据进行peaks的差异分析

11.1查看所有的?list:

perl configureHomer.pl -list

11.2下载注释信息

perl configureHomer.pl -install hg19   
#(安装hg19的GENOMES,会自动下载human数据,1.38G,多试几次,网速可达 6-7Mb)

11.3 Create a tag directory

  • homer?下新建一个?out?文件夹,在此路径下运行以下代码

    makeTagDirectory?文件夹名(tag directory)??-genome?hg19(带绝对路径)??-checkGC??输入文件 sam(绝对路径)

  • 输入文件名:input.h3k.con.sam?input.h3k.xy.sam??ip.h3k.con.sam????ip.h3k.xy.sam
  • makeTagDirectory? input.h3k.con ?-genome /Users/xusiqi/chip/homer/data/genomes/hg19 -checkGC /Users/xusiqi/chip/lesson23/out/input.h3k.con.sam
    makeTagDirectory input.h3k.xy ?-genome /Users/xusiqi/chip/homer/data/genomes/hg19 -checkGC /Users/xusiqi/chip/lesson23/out/input.h3k.xy.sam
    makeTagDirectory? ip.h3k.con ?-genome /Users/xusiqi/chip/homer/data/genomes/hg19 -checkGC /Users/xusiqi/chip/lesson23/out/ip.h3k.con.sam
    makeTagDirectory? ip.h3k.xy ?-genome /Users/xusiqi/chip/homer/data/genomes/hg19 -checkGC /Users/xusiqi/chip/lesson23/out/ip.h3k.xy.sam
    

11.4 Differentially Bound Peaks(找差异peak)

getDifferentialPeaks <peak file> <target tag directory> <background tag directory> [options]

输入文件名:

con_peaks.narrowPeak ?xy_peaks.narrowPeak
input.h3k.con ? input.h3k.xy ? ?ip.h3k.con ? ? ip.h3k.xy

getDifferentialPeaks /Users/xusiqi/chip/lesson23/out/con_peaks.narrowPeak ip.h3k.con/ input.h3k.con/ > con.diffpeaks.csv
getDifferentialPeaks /Users/xusiqi/chip/lesson23/out/xy_peaks.narrowPeak ip.h3k.xy/ input.h3k.xy/ > xy.diffpeaks.csv

11.5?Annotate peaks(Peak注释)

Usage:?annotatePeaks.pl?<peak?file?|?tss>?<genome?version>??[additional?options...]

输入文件名:con.diffpeaks.csv ? ?xy.diffpeaks.csv

annotatePeaks.pl con.diffpeaks.csv /Users/xusiqi/chip/homer/data/genomes/hg19 > con.diffpeaks.anno.txt
annotatePeaks.pl xy.diffpeaks.csv /Users/xusiqi/chip/homer/data/genomes/hg19 > xy.diffpeaks.anno.txt

用 R 把差异peak 和 Peak 注释合并:fread,merge 函数

11.6 其他功能

  • annotatePeaks.pl程序还可以用于创建显示相对于给定基因组特征(包括转录起始位点(TSS)或用户想要定义的任何其他区域)的相对读富集的直方图。由于TSS经常用于此目的,所以HOMER为TSS提供了一个内置注释(基于RefSeq转录本)。创建直方图的关键参数是“-hist #”和“-size #”选项,它们控制直方图的装箱大小和总长度。另一个重要的选项是“-d”,它指定要为哪些实验编译直方图。
    • annotatePeaks.pl tss hg19 -size 8000 -hist 10 -d h3k.con/ h3k.bay/ > output.txt
    • 用电子表格程序/Excel打开output.txt文件。将注意到第一列给出了到TSS的距离偏移量,然后是对应于每个实验的“覆盖率”、“+标记”和“-标记”的列。尝试用第一列作为X-Y线形图来查看模式。

12. ROSE 寻找超级增强子 SE(super enhancer)

12.1 参考教程:?ROSE | 超级增强子鉴定

12.2 ROSE 安装见上

12.3 ROSE 寻找 SE

?
python ROSE_main.py -g HG19 -i xy_summits.bed -r ip.h3k.xy.sorted.bam -c input.h3k.xy.sorted.bam -o /Users/xusiqi/chip/rose/xy
python ROSE_main.py -g HG19 -i con_summits.bed -r ip.h3k.con.sorted.bam -c input.h3k.con.sorted.bam -o /Users/xusiqi/chip/rose/con

(未完待续)


  Python知识库 最新文章
Python中String模块
【Python】 14-CVS文件操作
python的panda库读写文件
使用Nordic的nrf52840实现蓝牙DFU过程
【Python学习记录】numpy数组用法整理
Python学习笔记
python字符串和列表
python如何从txt文件中解析出有效的数据
Python编程从入门到实践自学/3.1-3.2
python变量
上一篇文章      下一篇文章      查看所有文章
加:2021-10-16 19:36:13  更:2021-10-16 19:36:26 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/15 19:49:48-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码