Különbség a között eltérést és a szórás

Anonim

Eltérés vs standard deviáció

deviáció vs standard deviáció

Leíró és inferenciális statisztikákban több indexet a központi tendenciájának, diszperziójának és ferdeségének megfelelő adatkészlet. Statisztikai következtetésekben ezeket általában becslőként ismerik, mivel becslést tesznek a népességparaméter értékekről.

A diszperzió az adatok terjedésének mérője az adatkészlet közepén. A standard deviáció az egyik leggyakrabban használt diszperzió. Az egyes adatpontok átlagtól való eltérését figyelembe veszik a szórás eltéréseinek kiszámításakor. Ezért érdemes azt állítani, hogy az átlagos szórás az átlag mellett csaknem elegendő képet ad az adatkészletről.

Vegye figyelembe a következő adatkészletet. A tíz ember súlyát (kilogrammban) 70, 62, 65, 72, 80, 70, 63, 72, 77 és 79. A tíz ember tömegének (kilogrammban kifejezett) súlya 71 (kilogrammban).

Mi az eltérés?

A statisztikában az eltérés azt az összeget jelenti, amellyel egyetlen adatpont eltér egy rögzített értéktől, például az átlagtól. Általában k legyen rögzített érték, és x 1 , x 2 , …, x n egy adatkészletet jelöl. Ezután az x j eltérés k-ből (x j -k) van definiálva.

Például a fenti adatkészletben a megfelelő eltérések az átlagtól (70-71) = -1, (62 - 71) = -9, (65-71) = -6, (72-71) = 1, (80-71) = 9, (70-71) = -1, (63-71) = -8, (72-71) = 1, és (79 - 71) = 8.

Mi a szórás?

Ha az egész népességből származó adatokat figyelembe lehet venni (például népszámlálás esetén), akkor lehet számítani a populáció szórását. A lakosság szórásának kiszámításához először számolni kell az adatértékek eltérését a lakossági átlagtól. Az eltérések gyökér középnégyzetét (négyzetes középértékét) a népesség szórásának nevezik. A szimbólumokban σ = √ {Σ (x

i -μ) 2 / n} ahol μ a népesség átlaga és n a népesség mérete.

Ha egy minta (n méretű) adatait használjuk fel a népesség paramétereinek becsléséhez, a minta szórása kiszámításra kerül. Először kiszámítják az adatértékek eltérését a minta átlagtól. Mivel a minta átlagát a populációs átlag helyett alkalmazzák (ami ismeretlen), a kvadratikus középértéket figyelembe véve nem megfelelő. A minta átlagának kompenzálására az eltérések négyzetének összegét n helyett n-1 osztja el. A minta szórása ennek négyzetgyöke.A matematikai szimbólumokban S minta standard deviációval S = √ {Σ (x

i -ẍ) 2 / (n-1)}, ẍ a minta átlaga és xi-k az adatpontok. ->

Az előző adatkészletben az eltérés négyzetösszege (-1)

2 + (-9) 2 + (-6) 2 + 9 2 + (-1) 2 + (-8) 2 + 1 2 + 6 2 + 8 2 = 366. Így a populáció standard szórása √ (366/10) = 6. 05 (kilogrammban). (Feltéve, hogy a vizsgált népesség a 10 főből áll, akikből az adatokat vették). Mi a különbség az eltérés és a szórás között? • A standard deviáció egy statisztikai index és egy becslés, de az eltérés nem. • A standard deviáció egy adatcsomó diszperziójának mértéke a középponttól, míg az eltérés azt az összeget jelenti, amellyel egyetlen adatpont különbözik a rögzített értéktől.