97超级碰碰碰久久久_精品成年人在线观看_精品国内女人视频免费观_福利一区二区久久

如何對二代測序數(shù)據(jù)進(jìn)行質(zhì)量分析?

時(shí)間:2022-07-10 19:48:20 其他 我要投稿
  • 相關(guān)推薦

如何對二代測序數(shù)據(jù)進(jìn)行質(zhì)量分析?

從事生物信息學(xué)分析的學(xué)生和工作人員都會(huì)接觸到二代測序數(shù)據(jù),我們從測序公司拿到所需要的數(shù)據(jù)之后,首先最關(guān)心的問題就是測序數(shù)據(jù)的質(zhì)量好不好,本文介紹一下如何對二代測序數(shù)據(jù)進(jìn)行質(zhì)量分析(QC)

工具/原料

linux系統(tǒng):ubuntu 或者 服務(wù)

fastqc

方法/步驟

1

安裝fastqc

注意將fastqc加入到系統(tǒng)環(huán)境變量中,以便于在終端或命令行中直接運(yùn)行

具體安裝方法參考fastqc官方手冊

2

在命令行中直接運(yùn)行命令

fastqc [-o output dir] [--(no)extract] [-f fastq|bam|sam] [-c contaminant file]

output dir指的是輸出結(jié)果路徑

extract參數(shù)指的是輸出結(jié)果是否解壓

-f 參數(shù) 是輸入文件的格式,指的是測序數(shù)據(jù)

3

運(yùn)行fastqc:

fastqc seqfile1.fq seqfile2.fq

4

輸出結(jié)果:在output dir目錄下的一個(gè)壓縮文件(未壓縮)

通常我們只需關(guān)注如下幾個(gè)結(jié)果

1 每個(gè)位置的堿基測序質(zhì)量。通常我們一般認(rèn)為從第二個(gè)堿基開始,平均每個(gè)堿基的測序質(zhì)量boxplot下四分位線在30分以上,則認(rèn)為測序質(zhì)量非常好

5

2.每條序列的測序質(zhì)量 一般認(rèn)為90%的reads測序質(zhì)量在35分以上,則認(rèn)為該測序質(zhì)量非常好

6

3. ATCG堿基在各個(gè)位置上的分布 一般來說,AT含量高于CG含量,AT含量約28%,CG含量約22%。由于測序問題,通常第一二位置的堿基測序質(zhì)量比較低,ATCG含量也不正常。這種情況不影響數(shù)據(jù)質(zhì)量,如果實(shí)在介意,可在后續(xù)bowtie mapping的時(shí)候?qū)⑶皟蓚(gè)堿基去掉


【如何對二代測序數(shù)據(jù)進(jìn)行質(zhì)量分析?】相關(guān)文章:

如何分析報(bào)錄比數(shù)據(jù)01-31

店鋪的數(shù)據(jù)分析該如何來做06-17

如何進(jìn)行初中化學(xué)試卷分析03-31

數(shù)據(jù)分析報(bào)告07-28

大數(shù)據(jù)分析07-20

銷售數(shù)據(jù)的分析方法07-25

大數(shù)據(jù)分析07-25

多維數(shù)據(jù)分析方法04-07

數(shù)據(jù)分析工作職責(zé)07-28

數(shù)據(jù)分析常用方法07-26