Po co nam statystyka, skoro w życiu wystarczy mi tylko średnia?
To nie do końca tak.
Przykładowo większość ludzi ma dwie nogi, a ktoś ma tylko jedną nogę. Gdy zrobimy średnią liczby nóg wszystkich ludzi, to nam wyjdzie, że większość ludzi ma ponadprzeciętną liczbę nóg (średnia jest mniejsza niż 2, ponieważ nikt nie ma trzech nóg).
Dla tego przypadku warto zastosować inny sposób obliczenia wartości średniej.
Oprócz średniej arytmetycznej, nazywanej powszechnie średnią, znamy jeszcze dwie często używane wartości średnie. DOMINANTĘ i MEDIANĘ.
Co to jest ŚREDNIA?
To suma wszystkich wartości podzielona przez ich liczbę.
Co to jest MEDIANA?
By sprawdzić jej wartość, należy wartości uporządkować od najmniejszej do największej – wartość w środku to mediana. To najlepszy sposób sprawdzenia wartości średniej, gdy jedna wartość w całości jest o wiele wyższa lub niższa od pozostałych wartości.
Co to jest DOMINANTA?
To wartość występująca w danym zbiorze najczęściej. W pewnych przypadkach może być bardziej przydatna niż średnia lub mediana. Przykładowo, jeżeli chcesz się dowiedzieć, którego ciasta najwięcej się sprzedaje.
ROZKŁAD NORMALNY, ROZKŁAD GAUSSA
To najważniejszy rozkład prawdopodobieństwa i najczęściej występujący w przyrodzie, społeczeństwie itp.
Jeżeli zapytasz o wzrost 200 przypadkowych ludzi, podzielisz ich do grup 120-130, 130-140, 140-150 cm, …. i dla każdej grupy obliczysz liczbę osób, możesz to przedstawić na takim wykresie (HISTOGRAM).
Jeżeli powstanie górka, oznacza to, że dane te mają rozkład normalny. Odkryjesz to w wielu zwykłych (normalnych) przypadkach, które potrafisz mierzyć (wzrost, waga, IQ, wyniki klasówki), ale nie dla danych, które tylko ot tak wymyślisz. Oznacza to, że wokół średniej jest najwięcej przypadków i im bardziej się od niej oddalasz (w prawo lub w lewo), tym jest ich mniej.
A dlaczego nazywany jest normalnym? Ponieważ to jest w przyrodzie normalne.
Najczęściej występujący rozkład
Rozkład normalny
Mniej znany rozkład
Rozkład paranormalny