国产精品天干天干,亚洲毛片在线,日韩gay小鲜肉啪啪18禁,女同Gay自慰喷水

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

已知均值和標準誤,做bootstrap統(tǒng)計分析【錯題本】

2023-09-06 13:08 作者:米糊炒面吶吶吶  | 我要投稿

bootstrap分析的目的,應該是假定我們當前獲得的數(shù)據(jù)存在隨機取樣的誤差,推測真實值所在的位置后比較真實值和指定值是否有差異——因為我們不知道真實值,所以只能從手頭數(shù)據(jù)得到真實值的概率分布、然后通過比較真實值的概率分布與指定值的包含關系,確定真實值在多大概率上與指定值有差異。 已知n個人兩個條件的平均數(shù)據(jù)x_bar_i和**標準誤差sem_i** (i = 1, 2 為條件編號),想通過bootstrap方法判斷顯著性差異,即針對每個條件、在均值加減標準差的**隨機分布**里(這里假定隨機數(shù)據(jù)服從高斯分布),有放回隨機取樣數(shù)次(比如10000),每次都計算兩個條件的差值,最后得到兩個條件差值的分布,如果分布的95%置信區(qū)間(也就是從分布中尋找累積概率在2.5%-97.5%的數(shù)據(jù)范圍)包含零,則兩個條件沒有差異,如果不包含零,則在p = 5%的犯錯概率上有顯著差異。 遇到了一個問題:這個**隨機分布**的標準差,應該取sem_i還是n個人得到的標準差sd_i = sem_i*(n)^2呢? 錯誤答案:我一開始想,我們感興趣的是真實值,真實值的分布寬度(標準差SD_i)可以用樣本的分布寬度(sd_i)來估計,所以在做bootstrap隨機取樣的時候,應該使用樣本的分布寬度來替代真實值的分布寬度,所以應該選取sd_i。 然而,這個答案錯誤的地方是:手頭已有n個人的平均數(shù)據(jù)x_bar時,真實值服從的分布不是N(x_bar,sd_i^2),而是N(x_bar, sem_i^2)。 解釋: 這里有SEM(standard error of the mean)的數(shù)學推導, en.wikipedia.org/wiki/Standard_error#:~:text=for%20further%20discussion.-,Derivation,and%20some%20simple%20properties%20thereof.

推導結論:從某個正態(tài)分布N (mu, sigma^2)取樣n個點的話,這n個點的均值x_bar的分布是N (mu, sigma^2/n); SEM是均值x_bar的分布的標準差(standard deviation),也就是sigma/sqrt(n) 所以已知n個人的數(shù)據(jù)均值為x,SEM為sem的話,x則視為從均值分布中取出的一個點;從x推斷均值分布的中心位置應該服從分布N(x, sem^2);所以在做bootstrap的時候,要從N(x, sem_i^2)里頭取樣。 對應我自己的筆記微博:https://weibo.com/5896214783/Ni1x72nPC

已知均值和標準誤,做bootstrap統(tǒng)計分析【錯題本】的評論 (共 條)

分享到微博請遵守國家法律
韶关市| 师宗县| 新巴尔虎右旗| 舒兰市| 三台县| 江油市| 宜城市| 邵阳市| 南康市| 油尖旺区| 从化市| 平顺县| 兴义市| 鹿泉市| 郑州市| 崇信县| 嵊州市| 同心县| 芮城县| 林州市| 贵阳市| 新和县| 双峰县| 普定县| 保山市| 海口市| 舞钢市| 罗城| 永兴县| 静海县| 西平县| 藁城市| 公主岭市| 苏尼特左旗| 抚顺县| 兴仁县| 繁峙县| 莱州市| 清河县| 全椒县| 昌平区|