更新時間:2020-08-07 來源:黑馬程序員 瀏覽量:
學習目標
·知道總體、樣本、樣本大小、樣本數(shù)量
·知道樣本統(tǒng)計量和總體統(tǒng)計量
·知道總體分布、樣本分布和抽樣分布
·知道常用的抽樣方法
某糖果公司研發(fā)了一種超長效口香糖,為了得到口味持續(xù)時間的數(shù)據(jù),公司聘請了試吃者幫忙完成檢驗,結(jié)果卻讓人大跌眼鏡!
沒文化,真可怕!我該怎么辦?
有時候數(shù)據(jù)很容易收集,例如參加健身俱樂部的人的年齡,后這一家游戲公司的銷售數(shù)據(jù)。但有時候不太容易,該怎么辦呢?
是時候拿出終極武器了——抽樣
1.抽樣相關概念
總體:是指研究對象的整個群體。
·公司生產(chǎn)的一批糖果
樣本:是從總體中選取的一部分,用于代表總體的整體情況。
·在這批糖果中隨機抽取50顆糖果
樣本數(shù)量:又叫樣本空間,是表示有多少個樣本。
·在這批糖果中隨機抽取50顆糖果,抽5次:樣本數(shù)量=5
樣本大小:也叫樣本容量,表示每個樣本里有多少個數(shù)據(jù)。
·每個樣本50顆糖果:樣本大小=50
統(tǒng)計量:
統(tǒng)計量是對數(shù)據(jù)進行統(tǒng)計得到的量,例如:均值、方差、標準差、比例等。
總體統(tǒng)計量:總體XX
對總體進行統(tǒng)計得到的統(tǒng)計量
·總體均值$$\mu$$:整批所有糖果數(shù)據(jù)的均值
·總體方差$$\sigma^2$$:整批所有糖果數(shù)據(jù)的方差
樣本統(tǒng)計量:樣本XX
對樣本進行統(tǒng)計得到的統(tǒng)計量
·樣本均值$$\bar{X}$$:抽取的某個樣本糖果數(shù)據(jù)的均值
·樣本方差$$S^2$$:抽取的某個樣本糖果數(shù)據(jù)的方差
分布:
·總體分布
總體數(shù)據(jù)的概率分布:整批所有糖果數(shù)據(jù)的概率分布
·往往未知,很多時候無法獲得總體所有元素的觀測值
·可以通過理論計算進行假定
樣本分布
抽取的樣本中數(shù)據(jù)的概率分布:抽取的某個樣本糖果數(shù)據(jù)的概率分布
假設總體大小為m,樣本大小為n,n趨近于m時,樣本分布趨近于總體分布
·樣本分布又稱經(jīng)驗分布
·注意:樣本分布與總體分布近似(抽樣正確的前提下)
抽樣分布
對樣本統(tǒng)計量概率分布的一種描述:所有樣本均值的概率分布
2.抽樣方法
抽樣的目的是為了通過樣本獲得總體的信息,所以關鍵點是怎么抽樣才能保證獲得的樣本具有代表性,下面,我們簡單介紹幾種常用的抽樣方法。
·簡單隨機抽樣(simple random sampling)。原理和我們抽撲克牌、抽獎一樣,就是從一個固定的總體中(比如有N個對象),利用抽簽或其他隨機方法(如隨機數(shù)表)抽取n個對象。所謂隨機,是指總體中每一個對象被抽中的概率相等。假設兩個人抽撲克牌比大小,兩個人抽中大王的概率其實一樣,都是1/54。
·系統(tǒng)抽樣(systematic sampling)。這種抽樣方法的核心在于確定一個所謂的“抽樣間隔”。比如將總體對象隨機編號,從1至100,我們只抽取編號個位數(shù)是7的對象,即編號為7,17,27,…的樣本,本質(zhì)上他們相鄰的編號有一個固定的間隔——10。
·分層抽樣(stratified sampling),是指先將總體按照某種特征分為若干層,比如按照性別分為男女兩層,然后再從每一層內(nèi)進行簡單隨機抽樣。分層的目的就在于提升樣本對總體的代表性,提高估計的精確度,比如一般的理工院校男生多女生少,采用分層抽樣可以保證男性和女性樣本都能被抽中。
·整群抽樣(cluster sampling),是將總體分成幾個群,比如我國開展的大型調(diào)查一般會以省或地區(qū)為群,先采用簡單隨機抽樣的方法抽取群,然后從抽中的群中再抽取相關的個體進行研究。現(xiàn)實過程中可以將抽中的群中的所有對象作為研究樣本,也可以在群內(nèi)部再次進行抽樣獲得部分調(diào)查對象作為樣本。
3.小結(jié)
抽樣相關概念 【知道】
·總體:是指研究對象的整個群體。
·樣本:從總體中選取的一部分
·樣本大?。好總€樣本里有多少個數(shù)據(jù)
·樣本數(shù)量:表示有多少個樣本。
統(tǒng)計量
總體XX
·總體均值$$\mu$$
·總體方差$$\sigma^2$$
樣本XX
·樣本均值$$\bar{X}$$
·樣本方差$$S^2$$
分布:
·總體分布
·樣本分布
·抽樣分布
抽樣方法 【知道】
·簡單隨機抽樣:隨機抽
·系統(tǒng)抽樣:等間隔抽
·分層抽樣:每種分別抽
·整群抽樣:直接抽一撥
猜你喜歡: