日韩国产欧美区_高清电影一区_国产精品日韩精品在线播放_日韩精品三区四区

當前位置: 首頁 > 學科分類 > 生物

生物學重復,三個生物學重復是什么意思

  • 生物
  • 2023-04-11
目錄
  • 取樣生物學三次重復
  • 生物重復是什么意思
  • 生物重復和技術重復區別
  • 生物學為什么要三次重復實驗
  • 實驗重復三次怎樣取結果

  • 取樣生物學三次重復

    生物重復和技術重復分別是什么?在一個實驗中應該如何安排生物重復和技術重復?

    重復是實驗設計的重要原則之一,實驗重復無論對于實驗結果的可重復性,還是對于最終實驗結論的可靠性,都起著起決定性的作用。

    實驗重復還可以進一步細分為生物重復(biological replicates)和技術重復(technical replicates),那么生物重復和技術重復分別是什么?在一個實驗中應該如何安排生物重復和技術重復?

    生物重復和技術重復分別是什么?

    生物重復:指對同一個處理組中獨立來源的重復樣本分別進行獨立分析,是整個實驗的完全重復,如將具有同一基因型的多個細胞株進行獨立地測定。由于遺傳和環境等因素的影響會引起有機體的個體差異,因此需要采用生物重復的實驗設計方法來消除該差異。目前都以3次生物學重復實驗設計為主,要求嚴格的實驗可以做5次重復。

    技術重復:指對同一樣本進行重復地檢測分析,例如同一份細胞中抽提的蛋白質進行三次質譜檢測,或者對同一RNA-seq樣本測序3次。與生物學重復相比,技術重復的測量變異程度較小,從而可以減少實驗中的分析變異,將對同一份樣本產生高重復性的測量結果 。

    簡單來講,生物重復是生物級別的重復,一般都是生物樣本的重復。而技術重復,更多的是參數測定環節的重復,一般是對同一生物樣本進行多次測定。

    進一步分析,其實可以發現生物重復是衡量實驗的總波動的(處理組間的差異不列入此處的波動,他們應該稱為效應),它包括樣本個體間差異和技術重復差異,而技術重復更多的是單純的衡量參數測量時的波動,如實驗操作嫻熟程度、儀器穩定性等等。

    在一個實驗中應該如何安排生物重復和技術重復?

    如此說來,對于一個實驗來說,如果條件允許的話,最好把生物重復和技術重復做全了?

    然而StatQuest推薦的策略是只需要生物重復即可,不需要技術重復。為什么?

    只做生物重復

    以小鼠的RNA-seq實驗為例,先看一下生物偏差(biological variation)和技術偏差(technical variation )。

    下圖代表小鼠的RNA-seq數據,虛線μ是總體小鼠的Read Counts,藍色條代表5個樣本小鼠的Read Counts。那那么樣本小鼠的Read和總體μ是存在一定的差異的,我們將5個樣本小鼠的Read取平均:

    average = [(μ+5)+(μ-1)+(μ+4)+(μ+2)+(μ-5)] / 5 = μ + (5-1+4+2-5)/5

    隨著生物重復的增多,(5-1+4+2-5)/5會逐漸趨向于0,這個平均數也會趨近于總體搜咐均值μ。

    剛才只考慮了生物生物偏差,沒有考慮技術偏差,下圖中添加悄灶了技術偏差,棕色條為生物偏差,綠色箭頭為技術偏差,那么此時依然可以取5個樣本小鼠的Read平均:

    average = μ + (5-1+4+2-5)/5 + (-2+5+2-2-1)/5

    隨著生物重復的增多,生物偏差(5-1+4+2-5)/5 逐漸趨向于0,技術偏差也會逐漸趨向于0,這個平均數也會趨近于總體均值μ。

    所以只做生物重復就可以很好的使用樣本代表總體。

    只做技術重復

    繼續進行實驗,下圖代表對1#小鼠測定了5次RNA-seq數據。那么同樣方法取5個RNA-seq數據的平均:

    average = μ + 5 + (-2+5+2-2-1)/5

    隨著技術重復數的增加,技術偏差(-2+5+2-2-1)/5會逐漸趨近于0,而這個平均數會逐漸趨近于μ + 5,永遠也不會等于總體均值μ,因此做再多的技術重復,最終的RNA-seq數據也無法很好的代表總體。

    同時做生物重復和技術重復

    以下圖為例,1#小鼠做了2個技術重復,2#小鼠做了3個技術重復,此時的生物偏差為5、5、-1、-1、-1,而技術偏差不變(技術偏差是參數測定時的偏差,不會因樣本而異,而且因樣本而已的偏差肯定是樣本偏差),所以樣本均值為:

    average = μ + (5+5-1-1-1)/5 + (-2+5+2-2-1)/5

    隨著樣本量啟漏扮的增加,技術偏差(-2+5+2-2-1)/5會逐漸趨向于零。

    但生物偏差(5+5-1-1-1)/5雖然也會收斂到0,但是此時所需要的樣本量比‘只做生物重復’時大大增加,也就是說生物偏差的收斂速度變慢了。

    這個生物偏差收斂變慢的速度有多慢呢?

    假如多了3個技術重復,那么就需要3倍的樣本量才能抵得上‘只做生物重復’時的收斂速度。說白了,就是多做的技術重復最多不過和‘只做生物重復’的效果持平而已。

    做一下總結:

    只做生物重復:最佳的實驗設計,可以很好的代表總體;

    只做技術重復,沒有生物重復:不要使用這種實驗設計,永遠只會得到總體的有偏估計。

    生物重復和技術重復:不推薦做,并不能很好的提高樣本的代表性,要么獲得一個有偏的估計,要么需要更多的樣本。

    生物重復是什么意思

    你好,這是正常褲瞎現象,我們可以去兩個樣本的平均值。

    生物重復:指對同一個處理組掘純念中獨立來源的重復樣本分別進行獨立分析,是整個實驗的完全重復,如將具有同一基因型的多個細胞株進行獨立地測定。由于遺傳和環境等因素的影響會引起有機體的個體差異,因此需要采用生物重復的實驗設計方法來消除判困該差異。目前都以3次生物學重復實驗設計為主,要求嚴格的實驗可以做5次重復。發現生物重復是衡量實驗的總波動的(處理組間的差異不列入此處的波動,他們應該稱為效應),它包括樣本個體間差異和技術重復差異。

    生物重復和技術重復區別

    太長不看系列

    技術重復:一個樣本重復多次

    生物學重復:同一批次每個生物重復一次(多次)

    當生物學重復之間存在相關性,需要考慮有效樣本數(effective sample size)

    effective genome size和effective sample size不一樣,不要混為一談

    廢話超多系列

    首先我們區分一下生物學重復和技術重復,有的人可能不屑一顧,和我的反應一樣。但是別著急,答應我先區分下面兩種情況屬于什么重復,答對了再嘲諷我好么?

    現在有一只小鼠A,我們對它的肌肉組織取樣,連續三次檢測其基因表達水平

    現在有一只小鼠A,我們連續三次對它的肌肉組織取樣,然后分別對該樣品進行測序

    文字不方便理解的話,可以看下面的圖示:

    事實上,這兩種重復都是屬于技術重復,因為它們都是針對的一只小鼠做的實驗(一個生物)。但是這兩種技術重復的側重點有些許不同。

    第一種技術重復,重點是RNA-seq檢測方法的準確度。比如當你發現了一個新的檢測基因表達量的方法,就需要用這種重復 來驗證該方法的準確度

    第二種技術重復,重點是檢測這個 小鼠本身的基因表達水平, 而非檢測方法。

    那么,什么是生物學重復呢?比如我有一群小鼠,我挑選其中三只,做相同處理,然后分別取樣檢測基因表達水平:

    這是因為,我們的每一次測量都來自于不同的小鼠(生物)。除此之外,我們還可以知道,生物學重復研究的重點從個體轉移到了這類群體。

    既然有了重復(有了不同的樣本),我們接下來需要考慮的就是樣本數的問題:

    如果我們對檢測基因表達水平的方法感興趣,那我們的樣本數與技術重復相關:

    下面的情況,樣本數為3(三個技術重復):凱拍搜

    假如我們對于藍色小鼠這一族群感興趣:

    下面的情況,樣本數為3:

    下面的情況,樣本數依然為3,這是因為技術重復不影響我們關注的重點(技術重復關注的是個體或者是方法的準確度)

    假如我們對小鼠的某一族群感興趣,我們對三種顏色的小鼠都檢測一下基因表達:

    但是,如果藍色小鼠有一個雙胞胎弟弟,那么此時的樣本數是多少呢?是3還是4呢?

    事實上,樣本數介于3和4之間。這個時候,樣本數不再是簡單的加和,而是要考慮有效樣本數(effective sample size)。計算公式如下:

    此時我們需要關注這兩只藍色小鼠的相關性,若相關系數為0.7,則這倆雙胞胎所代表的樣本數為2/(1+(2-1)*0.7)=2/(1+0.7)=1.18

    若相關系數為0.1,則這倆雙胞胎所代表的樣本數為2/(1+(2-1)*0.1)=2/(1+0.1)=1.82

    由此可知,兩個雙胞胎小鼠的相關性越低,所代表的樣本數越大。相關性越大,則所代表的樣本數越小。甚至若二者完全相同,我們可以把盯歷他們看作是一個(把他們看作是技術重復,不影響樣本數)

    寫在后面的話

    需要注意的是,很多人使用過deeptools,里面涉及到一個effectiv genome size的定義。該定義賀兆與effective sample size完全不同,千萬不要混淆。

    effective genome size相當于是去除了基因組中為N的那些堿基之后的長度。

    生物學為什么要三次重復實驗

    "生物學重復"指的是經過相同方式處理的相同樣品。如圖所示,對照組A、B、C三只小鼠 (control A, B and C) 互為生物學重復。實驗組A、B、C三只小鼠(Treated A)同樣互為生物學重復。

    "生物學重復"的大銀概念容易與"技術重復"相混淆。一衫敬般來說,技術重復指的是同一樣品多次測量。如圖所示,任一小鼠在板A、B、C中被重復測量了三次或仿慎,即技術重復了三次。

    如果你對這個答案有什么疑問,請追問,

    另外如果你覺得我的回答對你有所幫助,請千萬別忘記采納喲!

    實驗重復三次怎樣取結果

    在RNA-Seq等測序設計中,生物學重復和技術重復,是非常需要注意的問題。

    那么問題就來了,生物學重復和技術重復,到底是什么?它們是如何影響我們的實驗設計的。

    生物學重復 (biological replicate):可以理解為我們對一個群體進行研究,但是我們不會對整個群體進行檢測(考慮到成本和工作量的問題,我們肯定也不會采取這種地毯式的方法),只是抽取群體中的一部分進行檢測,用樣本來代表總體。

    這邊樣本個數,實際上就是生物學重復數。

    技術重復 (technical replicate):對一個樣本的數值進行多次測定。

    下表給出常見實驗對應重復類型:

    Replication這篇文章以測定小鼠肝臟細胞中的某一個gene的表達量為例,展示了什么是生物學重復和技術重復以及如何權衡這兩者之間的關系。

    分別給出3種類型的重復,分姿搏別為:畢冊旁

    (1)animal水平的重復

    (2)cell水平的重復

    (3)技術重復

    由上圖可以得到,3種不同種類的重復,所計算出來的表達量方差是不一樣的,但gene表達量的總方差,可以有下列公式計算得到:

    接下來,將總體的重復次數限定,即在滿足的前提條件下,對Var(X)進行計算。

    1、當和均為1,為48的情況下,計算出來的Var(X)如下圖標記:

    這種情況下,只反映了由于cell樣品重復和技術重復所引起的基因表達量誤差。當n_{A}=1(動物樣品數為1),即無法計算由于animal樣品數變化,所帶來的基因表達量誤差。

    因此在上述情況下,就被低估了。

    2、當和均為1,為48的情況下

    計算得到的基因表達量誤差完全是由于技術重復所引起的。因此,如果我們將這種情況下的誤差,認定為由生物重復所引起的,就造成了假陽性。

    同樣地,每一種重復對于真實基因表達量的方差貢獻也不是相同的。

    因為cell重復和測定技術重復,并是一個獨立變量。技術重復本質上是對同一份樣品進行測定,數據在這種情況下的變異,完全是由于人為或機器造成的,而cell重復在本質上可以認為與animal樣品之間存在相關性,因此也不是獨立的。

    3、從的角度,來選擇replicate

    【標注】越小,代表對估計越準確

    可以看到的是,當增大animal重復數時,趨于一個穩定值,該樣本對總體的估計達到了一個較為準確的水平,同時的值也接近于0。

    4、從統計檢驗的角度,來選擇replicate

    使用two-sample t檢驗,來判斷cell樣品的gene表達量方差、動物樣品表達量均值之間是否存在顯著差異。

    下圖很明顯的一個結果就是,隨著的手橡增加,統計檢驗的效能得到提升,假陽性也在降低(同時也得權衡和)

    對于一組數據來說, 研究對象的生物重復比技術重復更能夠反映總體 ,因此在進行實驗設計時,最好將實驗/測序資源傾向這邊,而不是技術重復(除非對技術重復所誘發的影響感興趣)

    [1]劉小樂老師-哈佛計算生物學與生物信息學

    [2] Blainey P, Krzywinski M, Altman N. Points of significance: replication[J]. Nature methods, 2014, 11(9): 879.

    猜你喜歡

    主站蜘蛛池模板: 红安县| 贵港市| 额济纳旗| 抚州市| 新邵县| 固始县| 吕梁市| 巴青县| 韶关市| 肃北| 泗阳县| 吉木乃县| 绥芬河市| 枣强县| 西昌市| 景东| 葫芦岛市| 洪雅县| 互助| 綦江县| 西宁市| 苏州市| 左权县| 万全县| 新宾| 崇文区| 沽源县| 博爱县| 磐石市| 峨眉山市| 梧州市| 威信县| 额济纳旗| 平乐县| 文安县| 罗山县| 余庆县| 博湖县| 广丰县| 资兴市| 玉门市|