Wskaźniki dyspersji w statystyce

Czas Czytania ~5 Min.
Wskaźniki rozproszenia są ważne, ponieważ opisują zmienność występującą w danej populacji lub próbie. Oto jak z nich korzystać.

W dystrybucji danych bardzo ważną rolę odgrywają wskaźniki dyspersji. Pomiary te uzupełniają pomiary tzw. pozycji centralnej, charakteryzując zmienność danych.

The wskaźniki dyspersji uzupełniają te o tendencji centralnej. Są również niezbędne w dystrybucji danych. Charakteryzują się bowiem jej zmiennością. Ich znaczenie w szkoleniu statystycznym podkreślili Wild i Pfannkuch (1999).

Postrzeganie zmienności danych jest jednym z podstawowych elementów myślenia statystycznego, ponieważ dostarcza nam informacji o rozproszeniu danych względem średniej.

Interpretacja średniej

The średnia arytmetyczna jest szeroko stosowany w praktyce, ale często może być błędnie interpretowany. Dzieje się tak, gdy wartości zmiennych są bardzo rzadkie. W takich przypadkach konieczne jest dołączenie średnich wskaźników dyspersji (2).

Wskaźniki dyspersji mają trzy ważne składniki związane ze zmiennością losową (2):

  • Postrzeganie jego wszechobecności w otaczającym nas świecie.
  • Konkurs na jego wyjaśnienie.
  • Umiejętność jego kwantyfikacji (co implikuje zrozumienie i umiejętność stosowania koncepcji dyspersji).

Do czego służą wskaźniki dyspersji?

Kiedy konieczne jest uogólnienie danych próbki populacji wskaźniki dyspersji są bardzo ważne, ponieważ bezpośrednio wpływają na błąd, z którym pracujemy . Im więcej rozproszenia zbierzemy w próbce, tym większy rozmiar musimy zastosować, aby pracować z tym samym błędem.

Z drugiej strony wskaźniki te pomagają nam określić, czy nasze dane są dalekie od wartości centralnej. Mówią nam, czy ta centralna wartość jest odpowiednia do reprezentowania badanej populacji. Jest to bardzo przydatne do porównywania rozkładów i zrozumieć ryzyka w procesie decyzyjnym (1).

Współczynniki te są bardzo przydatne do porównywania rozkładów i zrozumienia ryzyka w procesie decyzyjnym. Im większe rozproszenie, tym mniej reprezentatywna jest wartość centralna .

Najczęściej używane to:

Funkcje wskaźników dyspersji

Zakres

Ranga służy do podstawowego porównania. W ten sposób uwzględnia tylko dwie skrajne obserwacje . Dlatego zaleca się go tylko w przypadku małych próbek (1). Definiuje się ją jako różnicę pomiędzy ostatnią wartością zmiennej a pierwszą (3).

Odchylenie statystyczne

Średnie odchylenie wskazuje, gdzie byłyby skoncentrowane dane, gdyby wszyscy znajdowali się w tej samej odległości od średniej arytmetycznej (1). Za odchylenie wartości zmiennej uznajemy różnicę wartości bezwzględnej między wartością tej zmiennej a średnią arytmetyczną szeregu. Dlatego też uważa się ją za średnią arytmetyczną odchyleń (3).

Zmienność

Wariancja jest funkcją algebraiczną wszystkich wartości odpowiednie do zadań statystycznych z wnioskowaniem (1). Można to zdefiniować jako odchylenie kwadratowe (3).

Odchylenie standardowe lub typowe

W przypadku próbek pobranych z tej samej populacji odchylenie standardowe jest jednym z najczęściej stosowanych (1). Jest to pierwiastek kwadratowy wariancji (3).

Współczynnik zmienności

Jest to miara używana głównie do porównywania zmian pomiędzy dwoma zestawami danych mierzonych w różnych jednostkach I. Na przykład wzrost i waga grupa uczniów w próbie. Służy do określenia, w którym rozkładzie dane są najbardziej skupione, a średnia jest najbardziej reprezentatywna (1).

Współczynnik zmienności jest bardziej reprezentatywnym wskaźnikiem rozproszenia niż poprzednie, ponieważ jest liczbą abstrakcyjną. Innymi słowy to jest niezależne według jednostek, w jakich występują wartości zmiennych. Ogólnie rzecz biorąc, współczynnik zmienności wyraża się w procentach (3).

Wnioski dotyczące wskaźników dyspersji

Indeksy rozproszenia wskazują z jednej strony stopień zmienności próbki. Z drugiej strony reprezentatywność wartości centralnej ponieważ jeśli otrzymasz niską wartość, oznacza to, że wartości są skoncentrowane wokół tego środka. Oznaczałoby to, że zmienność danych jest niewielka, a środek dobrze to wszystko reprezentuje.

I odwrotnie, jeśli uzyskasz wysoką wartość, oznacza to, że wartości nie są skoncentrowane, ale rozproszone. Oznacza to, że istnieje duża zmienność i centrum nie będzie zbyt reprezentatywne. Z drugiej strony, wyciągając wnioski, będziemy potrzebować większej próby, jeśli chcemy zmniejszyć błąd wzrosła właśnie ze względu na wzrost zmienności.

Popularne Wiadomości