Összeomlási tanfolyam statisztikák

Egyszerű magyarázatok, példák és vizsgafeladatok

Ez a cikk a hipotézis tesztelésének általános cikkén alapul. Javaslom, hogy előzetesen olvassa el és értse meg ezt a cikket; ez sokkal könnyebbé teszi a cikk elolvasását és megértését.

A tesztválasztás táblázata

Az alábbi táblázat (kattintson rá egy nagyobb képért) megmutatja, hogy melyik a legalkalmasabb teszt a cél és a befolyásoló változók bizonyos skálaszintjéhez. ->

Ennek magyarázatát a cikk további részében találja. A legvégén van néhány minta gyakorlat, amely bemutatja ennek a táblázatnak a használatát.

tesztet

Először határozza meg a célváltozó típusát, majd a befolyásoló változó típusát. Ebben a táblázatban megtalálja a megfelelő módszert az adatok elemzésére.

Gyors figyelmeztetés: Sok helyzetben nagyon egyszerű kiválasztani a megfelelő tesztet, és gyakorlatilag csak egy lehetőség van. Bizonyos esetekben azonban több alkalmas teszt is használható. Például, ha két lehetséges teszt létezik, akkor az egyiknek az az előnye, hogy kevesebb feltételezést kell tennie az adatokkal kapcsolatban (pl. Normál eloszlás), a másiknak pedig az az előnye, hogy jobban felismeri a tényleges hatást.

Ebben a táblázatban olyan teszteket gyűjtöttem össze, amelyek véleményem szerint vagy a legegyszerűbbek, vagy a legjobb megoldást jelentik egy adott adathalmazra - fontos szem előtt tartani, hogy ez nem jelenti azt, hogy más tesztek automatikusan tévesek vagy rosszabbak lennének.

A táblázat magyarázata

Számos olyan vizsgálati eljárás létezik, amelyek első pillantásra elsöprőnek tűnhetnek. Az adott helyzetben kiválasztandó pontos teszt számos kérdéstől függ, amelyekre minden helyzetben újból választ kell adni.

A "mely statisztikai teszt" vagy "melyik statisztikai teszt" Google keresése sok különböző diagramot tartalmaz, amelyek különböző részletességgel és másként kezdődnek. Néhányan célorientáltak, vagyis az első kérdés a „Mit akarok elérni?” És a lehetséges célok például: „Hasonlítson össze egy átlagot egy hipotetikus értékkel”. Más diagramok az adatok tulajdonságain alapulnak. Itt kezdjük azzal a kérdéssel, hogy "Mi a célváltozó?", Legyen az például nominális vagy folyamatos. Véleményem szerint ez eleinte könnyebb, ezért tesszük fel magunknak ezt a két kérdést:

1.) Mekkora a célméret? -->

A célváltozó az a jellemző, amely a befolyásoló változók hatása miatt megváltozik. A befolyásoló tényezőktől függ. Például, ha be akarom bizonyítani egy új gyógyszer vérnyomáscsökkentő hatását, akkor a célváltozóm a vérnyomás, a befolyásoló változó pedig a gyógyszer (például két csoportja lenne: egy személy gyógyszer nélkül és egy személy gyógyszerrel).

Most határozza meg, hogy melyik típus (mely skála szint) a célmérete:

2.) Milyen befolyásoló tényezők vannak?

--> Másodszor meg kell határoznunk, hogy van-e egyáltalán befolyásoló változónk, és ha igen, milyen típusú skálával rendelkezik.

Fontos: Nem mindegy, hogy a befolyásoló változók milyen eloszlásúak. Tehát az, hogy egy befolyásoló változó normál eloszlású-e vagy sem, a vizsgálati eljárás szempontjából lényegtelen.

feladatok

Az alábbi esetek mindegyikéhez határozza meg, hogy melyik vizsgálat megfelelő. Először azonosítsa a cél méretét és határozza meg annak típusát (névleges, sorszám stb.). Ezután határozza meg, hogy van-e egy vagy több befolyásoló változó és milyen típusúak. Ezután a táblázat segítségével keresse meg a megfelelő tesztet.

(Hacsak a gyakorlatban nincs külön megemlítve, nem feltételezhetjük a változók normál eloszlását.)

  • 1a) A célérték itt a napi cigaretta száma. Ezek számláló adatok, ezért a célméret rendesen méretezésre kerül (úgy is tekinthetjük, hogy intervallum méretezésű). A befolyásoló tényező az időpont (előtte/utána), vagyis egy névleges változó két csoporttal. A két csoport párosul, mert a mérések összefüggenek: ugyanazokat az embereket kérdezték meg a terápia előtt és után. A táblázat szerint itt van a megfelelő teszt Wilcoxon aláírta a rangtesztet.
    • 1b) Az 1a) ponthoz képest itt csak az változik, hogy a befolyásoló változónak már nem csak két, hanem több csoportja van. Tehát a táblázat szerint most a Friedman teszt.
  • 2a) Itt egy egyszerű alkatrészt szeretne tesztelni. Van nominális kétcsoportos eredmény, és nincs előrejelző. Itt van egy Binomiális teszt az igazit.
    • 2b) Most még mindig nincs befolyásoló változó, de a célváltozónak több csoportja van. Itt használ egyet Chi-négyzet alakú illeszkedési teszt.
  • 3a) Itt van egy nominális célváltozó, két kategóriával és több befolyásoló változóval, folyamatos és kategorikus. A logisztikus regresszió itt megfelelő.
    • 3b) Az eredmény folyamatos, de nem normálisan oszlik meg. A befolyásoló tényező két csoporttal kategorikus. Mivel a két csoport (férfiak és nők) nincsenek párosítva (mint például a csoportok előtti/utáni helyzet esetén), a legjobb itt Wilcoxon-Mann-Whitney U teszt.
    • 3c) Ha kettőnél több csoport van, akkor a Wilcoxon-Mann-Whitney U teszt helyett használja Kruskal-Wallis teszt.
  • 4) Két folytonos vagy normálisan elosztott változóval kiszámítható a korreláció közöttük és a között Pearson-korrelációs teszt végrehajtani. Alternatív megoldásként az is lehetséges lineáris modell (azaz lineáris regresszió).
  • 5) Az eredmény általában megoszlik, és a befolyásoló tényező két csoportra kategorikus. Ide illik Kétmintás t-teszt.
  • 6) A célváltozó a választott fél, vagyis egy kategorikus változó, több csoporttal. A befolyásoló tényező, az iskolai végzettség is kategorikus. Ezért ide illik Chi-négyzet teszt. A Fisher teszt szintén alternatíva. Olyan esetekben használják, ahol kevesebb adat van, például kevesebb, mint 1000 megfigyelés, vagy ha a kereszttábla egyik sejtjének legalább 5 megfigyelése van.
  • 7a) Itt megvizsgáljuk egy kategorikus befolyásoló változó hatását egy normálisan elosztott célváltozóra. A ANOVA a megfelelő eszköz ehhez, alternatíva is lehetséges lenne lineáris regressziós modell.
    • 7b) Ha több befolyásoló tényező van, akkor az egyik a többszörös lineáris regresszió ki.
  • 8a) Itt tesztel egy rendes célváltozót (a változók befolyásolása nélkül) a mediánon. A Jel teszt tesztelni tudja.
    • 8b) A célváltozó még mindig ordinális, de most van egy állandó befolyásoló változó. Kiszámítható ennek a két változónak a Spearman-fokozatú korrelációja, majd a Spearman teszt futtasson korrelációt tesztelni.
  • 9a) Ez egy kategorikus célváltozó, két csoporttal (magas vérnyomás igen/nem). A befolyásoló változónak két csoportja is van, és párosítva van, mert ugyanazokat az embereket mérik a csoportban „előtte” és „utána”. Tehát ott van a McNemar teszt nál nél.
    • 9b) Ha a célméretet általában kategorikus helyett osztják el, akkor te vezetsz egyet páros t teszt ki.

3 gondolat arról, hogy „melyik statisztikai tesztet válasszam? "

Összezavarodik a változók állandó befolyásoló példája vagy az 1. feladat: „A kapcsolótáblára irányuló hívások száma” és a „napi cigaretta” diszkrét értékek, miért jelennek meg itt folytonosként vagy sorszámként?