Standard Deviation at Standard Error

Panimula

Standard D pagpatay (SD) at S tandard E rror (SE) ay mukhang katulad na terminolohiya; gayunpaman, ang mga ito ay may iba't-ibang mga konsepto na ginagamit nila halos kapalit sa panitikan ng Istatistika. Ang parehong mga termino ay karaniwang sinusundan ng isang plus-minus na simbolo (+/-) na nagpapahiwatig ng katotohanan na tinutukoy nila ang isang symmetric na halaga o kumakatawan sa isang hanay ng mga halaga. Walang alinlangan, lumilitaw ang parehong mga termino sa isang average (ibig sabihin) ng isang hanay ng mga sinusukat halaga.

Kapansin-pansin, ang SE ay walang kinalaman sa mga pamantayan, may mga pagkakamali, o sa komunikasyon ng data sa siyensiya.

Ang isang detalyadong pagtingin sa pinanggalingan at ang paliwanag ng SD at SE ay ibubunyag, kung bakit ang mga propesyonal na istatistiko at ang mga gumagamit nito ay may cursorily, parehong may posibilidad na magkamali.

Standard Deviation (SD)

Ang SD ay isang naglalarawan istatistika na naglalarawan sa pagkalat ng pamamahagi. Bilang isang sukatan, ito ay kapaki-pakinabang kapag ang data ay karaniwang ipinamamahagi. Gayunpaman, ito ay mas kapaki-pakinabang kapag ang data ay lubos na skewed o bimodal dahil ito ay hindi naglalarawan nang napakahusay ang hugis ng pamamahagi. Kadalasan, ginagamit namin ang SD kapag nag-uulat ng mga katangian ng sample, dahil nilalayon namin ilarawan kung magkano ang data ay nag-iiba sa paligid ng ibig sabihin. Ang iba pang mga kapaki-pakinabang na istatistika para sa paglalarawan ng pagkalat ng data ay ang saklaw ng inter-quartile, ang 25 at 75 na porsyento, at ang hanay ng data.

Figure 1. Ang SD ay isang sukatan ng pagkalat ng data. Kapag ang data ay isang sample mula sa isang pamamahagi ng normal na ipinamamahagi, ang isa ay umaasa sa dalawang-ikatlo ng data na nakasalalay sa loob ng 1 karaniwang paglihis ng ibig sabihin.

Ang pagkakaiba ay isang naglalarawan istatistika din, at ito ay tinukoy bilang ang parisukat ng karaniwang paglihis. Ito ay hindi karaniwang iniulat kapag naglalarawan ng mga resulta, ngunit ito ay isang mas mathematically tractable formula (a.k.a. ang kabuuan ng mga squared deviations) at gumaganap ng isang papel sa pag-compute ng mga istatistika.

Halimbawa, kung mayroon kaming dalawang istatistika P & Q na may mga kilalang variance var (P) & var (Q) , pagkatapos ay ang pagkakaiba ng kabuuan P + Q ay katumbas ng kabuuan ng mga pagkakaiba: var (P) + var (Q) . Ito ngayon ay maliwanag kung bakit gusto ng mga istatistiko na makipag-usap tungkol sa mga pagkakaiba.

Ngunit ang standard deviations ay may mahalagang kahulugan para sa pagkalat, lalo na kapag ang data ay karaniwang ipinamamahagi: Ang agwat ay nangangahulugang +/- 1 SD maaaring inaasahan na makuha ang 2/3 ng sample, at ang interval ay nangangahulugang + - 2 SD maaaring inaasahan na makuha ang 95% ng sample.

Nagbibigay ang SD ng indikasyon kung gaano kalayo ang pagkakaiba ng mga indibidwal na tugon sa isang tanong o "lumihis" mula sa ibig sabihin. Sinasabi ng SD sa tagapagpananaliksik kung paano kumalat ang mga tugon ay - sila ay puro sa paligid ng ibig sabihin, o nakakalat malayo at malawak? Na-rate ba ng lahat ng iyong mga respondent ang iyong produkto sa gitna ng iyong sukat, o sinasang-ayunan ito ng ilan at sinasalungat ito ng ilan?

Isaalang-alang ang isang eksperimento kung saan hiniling ang mga sumasagot na i-rate ang isang produkto sa isang serye ng mga katangian sa isang 5-point scale. Ang ibig sabihin ng isang grupo ng sampung respondent (na may label na 'A' sa pamamagitan ng 'J' sa ibaba) para sa "magandang halaga para sa pera" ay 3.2 na may SD na 0.4 at ang ibig sabihin ng "pagiging maaasahan ng produkto" ay 3.4 na may SD na 2.1.

Sa unang sulyap (pagtingin lamang sa ibig sabihin nito) mukhang ang pagiging maaasahan ay mas mataas kaysa sa halaga. Subalit ang mas mataas na SD para sa pagiging maaasahan ay maaaring ipahiwatig (tulad ng ipinapakita sa pamamahagi sa ibaba) na ang mga tugon ay napaka polarized, kung saan ang karamihan sa mga respondent ay walang mga isyu sa pagiging maaasahan (rated ang katangian ng isang "5"), ngunit ang isang mas maliit, ngunit mahalagang segment ng mga respondents, isang problema sa pagiging maaasahan at na-rate ang katangian "1". Ang pagtingin sa ibig sabihin ay nag-uugnay lamang sa bahagi ng kuwento, gayunpaman, mas madalas kaysa sa hindi, ito ang pinaninindigan ng mga mananaliksik. Ang pamamahagi ng mga tugon ay mahalaga upang isaalang-alang at ang SD ay nagbibigay ng isang mahalagang mapaglarawang sukatan ng ito.

Sumasagot	Magandang Halaga para sa Pera	Pagiging maaasahan ng produkto
A	3	1
B	3	1
C	3	1
D	3	1
E	4	5
F	4	5
G	3	5
H	3	5
Ako	3	5
J	3	5
Ibig sabihin	3.2	3.4
Std. Dev.	0.4	2.1

Unang Pagsisiyasat: Ang mga tumutugon ay nag-rate ng isang produkto sa isang 5-point scale

Dalawang magkakaibang distribusyon ng mga tugon sa 5-point rating scale ang maaaring magbunga ng parehong kahulugan. Isaalang-alang ang sumusunod na halimbawa na nagpapakita ng mga halaga ng pagtugon para sa dalawang magkaibang rating.

Sa unang halimbawa (Rating "A"), ang SD ay zero dahil ang LAHAT ng mga tugon ay eksakto ang ibig sabihin ng halaga. Ang indibidwal na tugon ay hindi lumihis sa lahat mula sa ibig sabihin.

Sa Rating "B", kahit na ang ibig sabihin ng pangkat ay pareho (3.0) bilang unang pamamahagi, ang Standard Deviation ay mas mataas. Ang Standard Deviation ng 1.15 ay nagpapakita na ang indibidwal na mga tugon, karaniwan *, ay medyo higit sa 1 punto ang layo mula sa ibig sabihin.

Sumasagot	Ang rating na "A"	Rating ng "B"
A	3	1
B	3	2
C	3	2
D	3	3
E	3	3
F	3	3
G	3	3
H	3	4
Ako	3	4
J	3	5
Ibig sabihin	3.0	3.0
Std. Dev.	0.00	1.15

Ikalawang Pagsisiyasat: Ang mga tumutugon ay nag-rate ng isang produkto sa isang 5-point scale

Ang isa pang paraan ng pagtingin sa SD ay sa paglalagay ng pamamahagi bilang isang histogram ng mga tugon. Ang isang pamamahagi na may mababang SD ay ipapakita bilang isang mataas na makitid na hugis, habang ang isang malaking SD ay ipinapahiwatig ng isang mas malawak na hugis.

Ang pangkaraniwang SD ay hindi nagpapahiwatig ng "tama o mali" o "mas mabuti o mas masahol pa" - isang mas mababang SD ay hindi kinakailangang mas kanais-nais. Ginagamit itong pulos bilang isang mapaglarawang istatistika. Inilalarawan nito ang pamamahagi kaugnay sa ibig sabihin.

T echnical disclaimer na may kaugnayan sa SD

Ang pag-iisip ng SD bilang isang "average deviation" ay isang mahusay na paraan ng conceptually unawa nito kahulugan. Gayunpaman, hindi ito aktwal na kinakalkula bilang isang average (kung ito ay, tatawagin namin itong "average deviation"). Sa halip, ito ay, "Standard," isang medyo kumplikadong paraan ng pag-compute ng halaga gamit ang kabuuan ng mga parisukat.

Para sa mga praktikal na layunin, ang pagtutuos ay hindi mahalaga. Karamihan sa mga programa ng pagbabahagi, spreadsheet o iba pang mga tool sa pamamahala ng data ay kakalkulahin ang SD para sa iyo. Higit na mahalaga ay upang maunawaan kung ano ang mga istatistika ihatid.

Standard Error

Ang karaniwang error ay isang inferens istatistika na ginagamit kapag ang paghahambing ng ibig sabihin ng sample (katamtaman) sa mga populasyon. Ito ay isang sukatan ng katumpakan ng sample mean. Ang sample na ibig sabihin ay isang istatistika na nagmula sa data na may pinagbabatayan na pamamahagi. Maaari naming makita ang mga ito sa parehong paraan tulad ng data, dahil nag-gumanap kami ng isang eksperimento at mayroon lamang isang solong halaga. Sinasabi sa atin ng istatistika ng istatistika na ang ibig sabihin ng sample (para sa isang malaking 'sampol na sample' at sa ilalim ng ilang mga kondisyon ng regularidad) ay tinatayang karaniwang ipinamamahagi. Ang karaniwang paglihis ng normal na pamamahagi na ito ay tinatawag naming karaniwang error.

Figure 2. Ang pamamahagi sa ilalim repre sents ang pamamahagi ng data, samantalang ang pamamahagi sa itaas ay ang teoretikal na pamamahagi ng sample mean. Ang SD ng 20 ay isang sukatan ng pagkalat ng data, samantalang ang SE ng 5 ay isang sukatan ng kawalan ng katiyakan sa paligid ng ibig sabihin ng sample.

Kapag nais naming ihambing ang paraan ng mga kinalabasan mula sa isang dalawang-eksperimento na eksperimento ng Paggamot A kumpara sa Paggamot B, pagkatapos ay kailangan naming tantiyahin kung gaano kami tiyak na sinusukat ang mga paraan.

Sa totoo lang, kami ay interesado sa kung gaano kami nasusukat ang pagkakaiba sa pagitan ng dalawang paraan. Tinatawag namin itong sukatin ang karaniwang error ng pagkakaiba. Maaaring hindi ka mabigla upang malaman na ang karaniwang error ng pagkakaiba sa sample na paraan ay isang function ng standard error ng mga paraan:

Ngayon na naintindihan mo na ang karaniwang pagkakamali ng ibig sabihin (SE) at ang karaniwang paglihis ng pamamahagi (SD) ay dalawang magkakaibang mga hayop, maaaring ikaw ay nagtataka kung paano sila nakakalito sa unang lugar. Habang nagkakaiba ang mga ito sa conceptually, mayroon silang simpleng matematiko:

, kung saan n ang bilang ng mga punto ng data.

Pansinin na ang karaniwang error ay nakasalalay sa dalawang bahagi: ang karaniwang paglihis ng sample, at ang sukat ng sample n . Ginagawa nito ang intuitive na kahulugan: ang mas malaki ang standard deviation ng sample, ang mas tumpak na maaari naming maging tungkol sa aming mga pagtatantya ng tunay na ibig sabihin.

Gayundin, malaki ang laki ng sample, mas maraming impormasyon ang mayroon kami tungkol sa populasyon at mas tumpak na maaari naming tantiyahin ang tunay na ibig sabihin.

Ang SE ay isang indikasyon ng pagiging maaasahan ng ibig sabihin. Ang isang maliit na SE ay isang indikasyon na ang ibig sabihin ng sample ay isang mas tumpak na pagmuni-muni ng aktwal na populasyon ibig sabihin. Ang isang mas malaking laki ng sample ay karaniwang magreresulta sa isang mas maliit na SE (habang ang SD ay hindi direktang apektado ng laki ng sample).

Ang karamihan sa pananaliksik sa pananaliksik ay nagsasangkot ng pagguhit ng isang sample mula sa isang populasyon. Pagkatapos ay nagsasagawa kami ng mga inferences tungkol sa populasyon mula sa mga resulta na nakuha mula sa sample na iyon. Kung ang isang pangalawang sample ay iguguhit, ang mga resulta ay malamang na wonâ € ™ t eksaktong tumutugma sa unang sample. Kung ang ibig sabihin ng halaga para sa isang katangian ng rating ay 3.2 para sa isang sample, maaaring ito ay 3.4 para sa isang ikalawang sample ng parehong laki. Kung kami ay gumuhit ng isang walang katapusang bilang ng mga sampol (ng pantay na sukat) mula sa aming populasyon, maaari naming ipakita ang naobserbahang paraan bilang pamamahagi. Pagkatapos ay maaari nating kalkulahin ang isang average ng lahat ng aming mga paraan ng sample. Ang ibig sabihin nito ay katumbas ng ibig sabihin ng tunay na populasyon. Maaari rin nating kalkulahin ang SD ng pamamahagi ng mga paraan ng sample. Ang SD ng pamamahagi na ito ng ibig sabihin ng sample ay ang SE ng bawat indibidwal na ibig sabihin ng sample.

Sa gayon, kami ay may pinakamahalagang pagmamasid: Ang ibig sabihin ng SE ang SD ng populasyon.

Sample	Ibig sabihin
1st	3.2
Ika-2	3.4
Ika-3	3.3
Ika-4	3.2
Ika-5	3.1
….	….
….	….
….	….
….	….
….	….
Ibig sabihin	3.3
Std. Dev.	0.13

Talaan na nagpapakita ng ugnayan sa pagitan ng SD at SE

Malinaw na ngayon na kung ang SD ng pamamahagi na ito ay nakakatulong sa atin na maunawaan kung gaano kalayo ang ibig sabihin ng isang sample mula sa tunay na populasyon, pagkatapos ay maaari nating gamitin ito upang maunawaan kung gaano tumpak ang anumang ibig sabihin ng indibidwal na sample na may kaugnayan sa tunay na ibig sabihin. Iyon ang kakanyahan ng SE.

Sa katunayan, nakuha lamang namin ang isang solong sample mula sa aming populasyon, ngunit maaari naming gamitin ang resultang ito upang magbigay ng isang pagtatantya ng pagiging maaasahan ng aming sinusunod na sample mean.

Sa katunayan, ang SE ay nagsasabi sa amin na maaari naming maging 95% tiwala na ang aming sinusunod sample ibig sabihin ay plus o minus halos 2 (talaga 1.96) Standard Error mula sa populasyon ibig sabihin.

Ipinapakita sa talahanayan sa ibaba ang pamamahagi ng mga tugon mula sa aming unang (at tanging) sample na ginamit para sa aming pananaliksik. Ang SE ng 0.13, na medyo maliit, ay nagbibigay sa amin ng isang indikasyon na ang aming ibig sabihin ay medyo malapit sa tunay na kahulugan ng aming kabuuang populasyon. Ang margin ng error (sa 95% confidence) para sa aming ibig sabihin ay (halos) dalawang beses na halaga (+/- 0.26), na nagsasabi sa amin na ang tunay na ibig sabihin ay malamang sa pagitan ng 2.94 at 3.46.

Sumasagot	Marka
A	3
B	3
C	3
D	3
E	4
F	4
G	3
H	3
Ako	3
J	3
Ibig sabihin	3.2
Std. Err	0.13

Buod

Maraming mananaliksik na hindi maintindihan ang pagkakaiba sa pagitan ng Standard Deviation at Standard Error, kahit na karaniwang ito ay kasama sa pagtatasa ng data. Habang ang aktwal na mga kalkulasyon para sa Standard Deviation at Standard Error ay magkatulad na hitsura, kinakatawan nila ang dalawang magkakaibang, ngunit pantulong, mga hakbang. Sinasabi sa amin ng SD ang hugis ng aming pamamahagi, gaano kalapit ang mga indibidwal na halaga ng data mula sa ibig sabihin ng halaga. Sinasabi sa atin ng SE kung gaano kalapit ang ibig sabihin ng sample sa tunay na kahulugan ng pangkalahatang populasyon.Sama-sama, nakatutulong sila upang magbigay ng isang mas kumpletong larawan kaysa sa ibig sabihin ng mag-isa ay maaaring sabihin sa amin.

Standard Deviation at Standard Error

Inirerekumendang