T-TEST at ANOVA

Anonim

T-TEST vs. ANOVA

Ang pagtitipon at pagkalkula ng statistical data upang makuha ang ibig sabihin ay madalas na isang mahaba at nakakapagod na proseso. Ang t-test at ang one-way analysis of variance (ANOVA) ay ang dalawang pinakakaraniwang pagsusulit na ginamit para sa layuning ito.

Ang t-test ay isang statistical hypothesis test kung saan ang istatistika ng pagsubok ay sumusunod sa pamamahagi ng isang Mag-aaral kung ang null hypothesis ay suportado. Ang pagsubok na ito ay inilalapat kapag ang istatistika ng pagsubok ay sumusunod sa isang normal na pamamahagi at ang halaga ng isang scaling term sa test statistic ay kilala. Kung hindi alam ang termino ng scaling, pinalitan ito ng isang pagtatantya batay sa magagamit na data. Ang istatistika ng pagsubok ay susunod sa pamamahagi ng Estudyante.

Ipinakilala ni William Sealy Gosset ang t-istatistika noong 1908. Si Gosset ay isang botika ng Guinness brewery sa Dublin, Ireland. Ang Guinness brewery ay may patakaran ng pagrerekrut ng mga pinakamahusay na nagtapos mula sa Oxford at Cambridge, pagpili mula sa mga maaaring magbigay ng mga application ng biochemistry at istatistika sa itinatag ng kumpanya na pang-industriya na proseso. Si William Sealy Gosset ay isang nagtapos. Sa prosesong ito, inilahad ni William Sealy Gosset ang t-test, na orihinal na nakita bilang isang paraan upang subaybayan ang kalidad ng matapang (ang maitim na serbesa na gumagawa ng brewery) sa isang cost-effective na paraan. Inilathala ni Gosset ang pagsusulit sa ilalim ng pangalan ng mag-aaral na 'Mag-aaral' sa Biometrika, noong 1908. Ang dahilan ng pangalan ng panulat ay ang paggigiit ng Guinness, dahil nais ng kumpanya na panatilihin ang kanilang patakaran tungkol sa paggamit ng mga istatistika bilang bahagi ng kanilang 'mga lihim ng kalakalan'.

Karaniwang sinusunod ng mga istatistika ng T-test ang form na T = Z / s, kung saan ang Z at s ay mga function ng data. Ang variable ng Z ay idinisenyo upang maging sensitibo sa alternatibong teorya; epektibo, ang magnitude ng Z variable ay mas malaki kapag ang alternatibong teorya ay totoo. Sa pansamantala, ang 's' ay isang scaling parameter, na nagpapahintulot sa pamamahagi ng T na matukoy. Ang mga palagay na pinagbabatayan ng isang t-test ay ang a) Z ay sumusunod sa isang standard na normal na pamamahagi sa ilalim ng null hypothesis; b) ps2 sumusunod sa isang ‡ ‡ 2 pamamahagi na may p degree ng kalayaan sa ilalim ng null hypothesis (kung saan ang p ay positibong pare-pareho); at c) ang halaga ng Z at halaga ng s ay malaya. Sa isang partikular na uri ng t-test, ang mga kundisyong ito ay mga kahihinatnan ng populasyon na pinag-aaralan, pati na rin ang paraan kung saan ang data ay tinatanggap.

Sa kabilang banda, ang pagtatasa ng pagkakaiba (ANOVA) ay isang koleksyon ng mga istatistika ng mga modelo. Habang ang mga prinsipyo ng ANOVA ay ginagamit ng mga mananaliksik at estatistiko sa loob ng mahabang panahon, hanggang 1918 na ginawa ni Sir Ronald Fisher ang isang panukala upang gawing pormal ang pag-aaral ng pagkakaiba sa isang artikulo na may pamagat na 'Ang Pagsasalungat sa Kamag-anak sa Pagtutukoy ng Mendelian Inheritance'. Simula noon, ang ANOVA ay pinalawak na sa saklaw at aplikasyon nito. SI ANOVA ay talagang isang maling tawag, dahil hindi ito nagmula sa pagkakaiba ng mga pagkakaiba kundi mula sa mga pagkakaiba sa pagitan ng mga paraan ng mga grupo. Kabilang dito ang mga nauugnay na pamamaraan kung saan ang binagong pagkakaiba sa isang partikular na variable ay hinati sa mga sangkap na maiugnay sa iba't ibang mga mapagkukunan ng pagkakaiba-iba.

Mahalaga, ang isang ANOVA ay nagbibigay ng isang statistical test upang matukoy kung ang paraan ng ilang grupo ay pantay-pantay at, bilang isang resulta, pangkalahatan ang t-test sa higit sa dalawang grupo. Ang ANOVA ay maaaring maging mas kapaki-pakinabang kaysa sa isang dalawang-sample na t-test dahil mas mababa ito ng pagkakataong gumawa ng isang error sa uri. Halimbawa, ang pagkakaroon ng maraming dalawang-sample na t-test ay magkakaroon ng mas malaking pagkakataon na gumawa ng isang error kaysa sa isang ANOVA ng parehong mga variable na kasangkot upang makuha ang ibig sabihin. Ang modelo ay pareho at ang test statistic ay ang F ratio. Sa mga mas simpleng termino, ang mga pagsubok na t-ay isang espesyal na kaso lamang ng ANOVA: ang paggawa ng ANOVA ay magkakaroon ng parehong resulta ng maraming t-test. Mayroong tatlong klase ng mga modelo ng ANOVA: a) Mga modelo ng naayos na epekto na ipinapalagay na ang data ay mula sa mga normal na populasyon, naiiba lamang sa kanilang mga paraan; b) Mga random na epekto ng mga modelo na ipinapalagay ang data ay naglalarawan ng hierarchy ng iba't ibang populasyon na ang mga pagkakaiba ay napipigilan ng hierarchy; at, c) Mixed-effect na mga modelo na mga sitwasyon kung saan pareho ang nakapirming at random na mga epekto ay naroroon.

Buod:

  1. Ang t-test ay ginagamit kapag tinutukoy kung ang dalawang katamtaman o paraan ay pareho o naiiba. Ang ANOVA ay ginustong kapag inihambing ang tatlo o higit pang katamtaman o paraan.
  2. Ang isang t-test ay may higit na posibilidad na gumawa ng isang error na mas maraming mga paraan ang ginagamit, na kung bakit ang ANOVA ay ginagamit kapag paghahambing ng dalawa o higit pang mga paraan.