0773-974.482 contact@analize-statistice.eu

Testarea normalităţii distribuţiei datelor

Cei care citiţi aceste rânduri, cred că ştiţi deja că SPSS (numit iniţial Statistical Package for the Social Sciences, apoi transformat în Statistical Product and Service Solutions) este o aplicaţie puternică, care permite utilizatorilor să efectueze anchete, analize complexe şi teste statistice. În cazul în care doriţi să efectuaţi teste statistice, va trebui să testaţi mai întâi datele pentru a stabili dacă acestea sunt normal distribuite. Din fericire, SPSS conţine opţiuni pe care le puteţi accesa pentru a determina dacă datele dumneavoastră sunt distribuite în mod normal. Acest scurt ghid vă va ajuta să faceţi acest lucru. Abordările pot fi împărţite în două: una bazată pe teste statistice şi una bazată pe inspecţie vizuală. Testele statistice au avantajul de a face o apreciere obiectivă de normalitate, dar au dezavantajul, uneori, de a nu fi suficient de sensibile la eşantioane de dimensiuni mici sau prea sensibile la eşantioane mari. Ca atare, unii statisticieni preferă să folosească experienţa lor pentru a face o judecată subiectivă cu privire la datele afişate grafic. Interpretarea grafică are avantajul de a permite o judecată corectă pentru a evalua normalitatea în situaţiile în care testele numerice ar putea fi prea puţin sau prea sensibile, dar metoda grafică, aşa cum am mai spus, poate fi subiectivă. Dacă nu aveţi o mare experienţă in interpretarea normalităţii folosind metoda grafică, cel mai bine e să vă bazaţi pe metodele numerice.

Instrucţiuni

  1. Deschideţi fişierul SPSS ce conţine datele pe care doriţi să le testaţi, apoi faceţi clic pe „Analyze” din bara de meniu.
  2. Selectaţi „Descriptive Services” din meniul drop-down, apoi selectaţi „Explore”, ducând la deschiderea ferestrei „Explore”.
  3. Faceţi clic pe variabila pe care doriţi să o testaţi pentru normalitate în caseta din partea stângă a ferestrei, apoi glisaţi-o în „Dependent List” de pe partea dreapta.
  4. Faceţi clic pe butonul „Statistics” din colţul din dreapta sus al ferestrei pentru a deschide fereastra „Statistics”. Nu faceţi nici o modificare la opţiunile afişate şi daţi clic pe butonul „Continue”.
  5. Faceţi clic pe butonul „Plots” din fereastra „Explore”. Se deschide fereastra „Plots”. Selectaţi „None” în secţiunea „Boxplots” şi deselectaţi toate opţiunile din secţiunea „Descriptive”.
  6. Selectaţi caseta „Normality plots with tests”, apoi faceţi clic pe „Continue”. Clic pe „OK” şi fereastra „Output” se deschide automat. Fereastra „Output” afişează rezultatele.
  7. Examinaţi rezultatele din tabelul „Tests of Normality” pentru a determina dacă datele sunt distribuite în mod normal. Tabelul afişează rezultatele de la două teste: testul Kolmogorov-Smirnov şi testul Shapiro-Wilk. Testul Kolmogorov-Smirnov este utilizat pentru a testa seturi mari de date în timp ce testul Shapiro-Wilk este mai potrivit pentru un eşantion mai mic, cum ar fi de 50 de numere sau mai mic. În cazul în care coloana „Sig” pentru oricare dintre teste este peste 0.05, datele sunt normal distribuite.

3 responses on “Testarea normalităţii distribuţiei datelor

  1. Ionel

    Ce înseamnă (sau cum interpretăm) dacă aceeași variabilă are 0.000 la Kolmogorov-Smirnov și 0.014 la Shapiro-Wilk? Dar dacă e invers? Adică 0.001 la K-S și 0.007 la S-W? (adică în unul din cazuri peste normalul 0.005).
    Mulțumesc.

    1. gabidanea Post author

      Pentru testarea normalitatii distributiei nu e necesar sa luati in considerare rezultatele la ambele teste, ci doar unul, cel de la testul care se preteaza cel mai bine marimii esantionului Dvs. Testul Kolmogorov-Smirnov este utilizat pentru a testa seturi mari de date în timp ce testul Shapiro-Wilk este mai potrivit pentru un eşantion mai mic, cum ar fi de 50 de numere sau mai mic. Rezultatele se interpreteaza in functie de semnificatia statistica. In cazul Dvs., daca vorbim de valori ale semnificatiei testului, ambele valori sunt sub 0.05 si nu 0.005 (Cel mai frecvent prag ales în testarea ipotezei nule este de .05, valoare stipulată inițial de Fisher, părintele statisticii moderne), prin urmare variabilele NU sunt normal distribuite.

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *