Különbség a népesség és a minta standard deviációja között

Anonim

adatkészletnek a leírása szerint Populáció / minta standard deviáció

A statisztikában több mutatót használnak egy adatkészlet leírásához központi tendenciája, diszperziója és hajlékonysága. A standard deviáció az adatkészlet középpontjából származó adatok diszperziójának egyik leggyakoribb mértéke.

A gyakorlati nehézségek miatt a teljes hipotézis vizsgálatakor nem lesz lehetséges az egész népesség adatainak felhasználása. Ezért a mintákból származó adatokat használunk, hogy következtetéseket vonjunk le a lakosság körében. Ilyen helyzetben ezeket becslőknek nevezik, mivel becslést tesznek a populáció paramétereinek értékeiről.

Rendkívül fontos az elfogulatlan becslések használata a következtetésekben. Állítólag nem becsületes becslõnek számít, ha a becslõ várható értéke megegyezik a populáció paraméterével. Például a minta átlagát a népesség átlagának elfogulatlan becslõjeként használjuk. (Matematikailag kimutatható, hogy a minta átlaga várható értéke megegyezik a népesség átlagával). A populáció standard szórásának becslésénél a minta szórás is elfogulatlan becslés.

Mi a népesség szórása?

Ha figyelembe vesszük, hogy az egész népesség adatai (például népszámlálás esetén) figyelembe veszik a népesség szórását, akkor számolni lehet. A lakosság szórásának kiszámításához először számolni kell az adatértékek eltérését a lakossági átlagtól. Az eltérések gyökér középnégyzetét (négyzetes középértékét) a népesség szórásának nevezik.

10 tanulói osztályban könnyen gyűjthetők a diákok adatairól. Ha hipotézist tesztelünk a diákok e népességén, akkor nincs szükség a mintaértékek használatára. Például a 10 diák súlya (kilogrammban) 70, 62, 65, 72, 80, 70, 63, 72, 77 és 79 mérhető. Ezután a tíz ember tömege (kilogrammban) (70 + 62 + 65 + 72 + 80 + 70 + 63 + 72 + 77 + 79) / 10, ami 71 (kilogrammban). Ez a népesség.

Most a népesség szórásának kiszámításához kiszámítjuk az átlagtól való eltéréseket. Az átlagtól való eltérés (70-71) = -1, (62-71) = -9, (65-71) = -6, (72-71) = 1, (80-71) = 9, (70-71) = -1, (63-71) = -8, (72-71) = 1, (77-71) = 6 és (79-71) = 8. Az eltérés négyzetének összege (-1 2 + (-9) 2 + (-6) 2 + 1 2 + 9 2 < 2 + 6 2 + 8 2 + (-8) 2 + = 366. A populáció szórása √ (366/10) = 6. 05 (kilogrammban). 71 az osztály hallgatóinak átlagos súlya és 6.05 a súly pontos eltérése 71-től. Mi a minta szórás? Ha egy minta (n méretű) adatait használjuk fel a népesség paramétereinek becsléséhez, a minta szórását kiszámítjuk. Először kiszámítják az adatértékek eltérését a minta átlagtól. Mivel a minta átlagát a populációs átlag helyett alkalmazzák (ami ismeretlen), a kvadratikus középértéket figyelembe véve nem megfelelő. A minta átlagának kompenzálására az eltérések négyzetének összegét n helyett n-1 osztja el. A minta szórása ennek négyzetgyöke. A matematikai szimbólumokban S minta standard szórással S = √ {Σ (x i -ẍ)

2

/ (n-1)} ẍ a minta átlaga és x i az adatpontok. Most feltételezzük, hogy az előző példában a lakosság az egész iskola diákjai. Ezután az osztály csak egy minta lesz. Ha ezt a mintát használják a becsléshez, a minta szórása √ (366/9) = 6. 38 (kilogrammban), mivel 366-ot osztott 10-el 10 helyett (a minta mérete). Figyelembe kell venni, hogy ez nem garantálja a pontos populációs szórás értékét. Ez csupán becslés. Mi a különbség a népesség szórása és a minta szórása között? • A populáció standard deviációja a pontos disztribúciós érték, amelyet a központból származó diszperzió mérésére használnak, míg a minta szórása egy elfogulatlan becslés. • A populáció standard deviációját akkor számítjuk ki, ha minden egyes népességre vonatkozó adat ismert. Máskülönben a minta szórása kiszámításra kerül.

• A populáció szórását σ = √ {Σ (xi-μ)

2

/ n} adja meg, ahol μ a populációs átlag és n a populáció mérete, de a minta szórását S = √ {Σ (xi-ẍ)

2

/ (n-1)} ahol ẍ a minta átlaga és n a minta mérete.