如何對二代測序數據進行質量分析?
從事生物信息學分析的學生和工作人員都會接觸到二代測序數據,我們從測序公司拿到所需要的數據之後,首先最關心的問題就是測序數據的質量好不好,本文介紹一下如何對二代測序數據進行質量分析(QC)
工具/原料
linux系統:ubuntu 或者 服務
fastqc
方法/步驟
1
安裝fastqc
注意將fastqc加入到系統環境變量中,以便於在終端或命令行中直接運行
具體安裝方法參考fastqc官方手冊
2
在命令行中直接運行命令
fastqc [-o output dir] [--(no)extract] [-f fastq|bam|sam] [-c contaminant file]
output dir指的是輸出結果路徑
extract參數指的是輸出結果是否解壓
-f 參數 是輸入文件的格式,指的'是測序數據
3
運行fastqc:
fastqc
4
輸出結果:在output dir目錄下的一個壓縮文件(未壓縮)
通常我們只需關注如下幾個結果
1 每個位置的鹼基測序質量。通常我們一般認為從第二個鹼基開始,平均每個鹼基的測序質量boxplot下四分位線在30分以上,則認為測序質量非常好
5
2.每條序列的測序質量 一般認為90%的reads測序質量在35分以上,則認為該測序質量非常好
6
3. ATCG鹼基在各個位置上的分佈 一般來説,AT含量高於CG含量,AT含量約28%,CG含量約22%。由於測序問題,通常第一二位置的鹼基測序質量比較低,ATCG含量也不正常。這種情況不影響數據質量,如果實在介意,可在後續bowtie mapping的時候將前兩個鹼基去掉
-
實用的西遊記作文300字實用【7篇】
在日常學習、工作或生活中,大家都嘗試過寫作文吧,作文一定要做到主題集中,圍繞同一主題作深入闡述,切忌東拉西扯,主題渙散甚至無主題。作文的注意事項有許多,你確定會寫嗎?以下是小編為大家整理的西遊記作文300字7篇,歡迎大家借鑑與參考,希望對大家有所幫助。西遊記作文...
-
[精華]西遊記作文4篇
在學習、工作乃至生活中,大家對作文都不陌生吧,作文根據寫作時限的不同可以分為限時作文和非限時作文。那要怎麼寫好作文呢?下面是小編為大家整理的西遊記作文4篇,歡迎閲讀,希望大家能夠喜歡。西遊記作文篇1我手上拿着《西遊記》,不禁浮想聯翩,過了一會兒,我就覺得雙眼...
-
[精選]西遊記作文5篇
無論在學習、工作或是生活中,大家都不可避免地會接觸到作文吧,作文要求篇章結構完整,一定要避免無結尾作文的出現。你知道作文怎樣才能寫的好嗎?以下是小編精心整理的西遊記作文5篇,希望能夠幫助到大家。西遊記作文篇1自從西天取回真經後,唐僧師徒名聲大振,許多高校都...
-
西遊記作文4篇(優)
在日復一日的學習、工作或生活中,大家都經常看到作文的身影吧,作文是通過文字來表達一個主題意義的記敍方法。相信許多人會覺得作文很難寫吧,下面是小編收集整理的西遊記作文5篇,歡迎閲讀與收藏。西遊記作文篇1先説那神通廣大的孫悟空吧,他有着火眼金睛,能看透人心...