STATYSTYKA- ściąga.doc

(158 KB) Pobierz
Miary średnie

Statystyka-nauka o metodach wykrywania i badania prawidłowości występujących w zjawiskach masowych.

-opisowa-opis statystyczny badanej zbiorowości

-matematyczna- wnioskowanie statystyczne

OPIS STATYSTYCZNY- dotyczy tylko zbiorowości statystycznej, jego przedmiotem są obserwacje badania pełnego, dokonuje się go za pomocą narzędzi tj, średnia arytm, odchylenie stand itp.

WNIOSKOWANIE SATYSTYCZNE – ma miejsce gdy badanie jest reprezentacyjne (próba losowa), a jego wyniki są uogólniane na cała populację generalną z której pochodzi próba

ZBIOROWOŚĆ STATYSTYCZNA –(populacja) zbiór dowolnych elementów podobnych , ale nie identycznych pod względem właściwości objętych badaniem. Wyróżniamy zbiorowość jednowymiarową (jednocechową) i wielowymiarową (wielocechową )

JEDNOSTKA STATYSTYCZNA – elementy składowe zbiorowości poddane obserwacji, w tej samej zbiorowości mogą wystąpić różne jednostki statystyczne

CECHY STATYSTYCZNE – właściwości jednostek statystycznych

Wyróżniamy cechy

1)stałe ( rzeczowe, czasowe, przestrzenne)

2)zmienne – właściwości różnicujące poszczególne elementy zbiorowości

a)niemierzalne (jakościowe)- określane słownie , np. płeć

b)mierzalne(ilościowe) – wyrażane za pomoca licz o różnych mianach (cm,lata,zł)

-           quasi-ilosciowe (porządkowe) określają natężenie badanej właściwości w sposób opisowy, np. oceny z egzaminu

-           skokowe (dyskretne)– może być wyrażona wyłącznie liczbami zmieniającymi się skokowo, bez wartości pośrednich(lp osób w grupie)

-           ciagłe – może przyjmować każda wartość z okresonego przedziału liczbowego , np. wzrost, waga, powierzchnia mieszkania, czas dojazdu do pracy,dochody przedś.

POMIAR – proces okreslający wielkość (nasilenie) badanej cechy

Skale pomiarowe

1)         nominalna – pomiar polega na przypisaniu jednostki do określonej kategorii; stwierdzić tylko można że 2 jednostki sa takie same lub inne, dotyczy cech jakościowych, dot takich cech, jak płeć, stan cywilny, status zawodowy, religia), skala slaba

2)         porządkowa(rangowa)- pozwala na uporządkowanie elementów w zależności o ich znaczenia lub rozmiarów (rosnąco, malejąco), dot. cech jakościowych, np. miejsca zajęte przez zawodników, klasy społeczne, wykształcenie, status zawodowy,, sila reakcji na bodźce), s. slaba

3)         przedziałowa(interwałowa)- określa nie tylko kolejność jednostek , ale również różnice między nimi., np. lata kalendarzowetemperatura, rok urodzenia, wartość zero jest umowna – zero nie oznacza że nie ma takiej wartość (0s C), dot cech ilościowych, s. mocna

4)         ilorazowa (stosunkowa) pozwala określić zarówno różnice jak i ilorazy (stosunki) danych, występuje zero absolutne tj zero znaczy że cecha nie występuje,

       Np. wieku(wlatach), wagi,

        płac, dochodów, cen towarów,

       czas dostawy, dot. Cech  

        ilościowych, s. silna

SZEREGI STATYSTYCZNE

Po sklasyfikowaniu danych statystycznych według jakiegoś kryterium otrzymujemy szereg statystyczny.

Szeregi statystyczne dzielimy na:

a)          szczegółowe

b)         rozdzielcze

c)          czasowe

d)         przestrzenne

Szczegółowe – najczęściej stosowany jest wtedy, gdy liczba jednostek objętych badaniem jest mała (10, 20 osób)

Rozdzielcze – stanowi zbiorowość statystyczną podzieloną na klasy wg określonej cechy jakościowej lub ilościowej z podaniem liczebności każdej z klas. Jeden z szeregów statystycznych przedstawiający budowę (strukturę ) zbiorowości, czyli jej podział na części z

określonego, rzeczowego punku widzenia. Cecha statystyczna na podstawie której dokonuje się podziału zbiorowości

na mniejsze części, może być cechą niemierzalną lub mierzalną. W szeregu rozdzielczym w jednej kolumnie w sposób

uporządkowany przedstawiony jest wykaz klasyfikacyjny, czyli warianty badanej cechy, a w drugiej kolumnie

przedstawione są liczebności odpowiadające poszczególnym klasom z wykazu. Jest to więc uporządkowany i

pogrupowany zbiór informacji dotyczących badanej cechy określonej zbiorowości

Szeregi rozdzielcze dzielimy na: punktowe i przedziałowe.

Punktowy szereg rozdzielczy – buduje się wówczas, gdy liczba wariantów badanej cechy niewielka, a każdy z tych wariantów występuje kilka razy w badanej zbiorowości.

Szereg rozdzielczy przedziałowy – stanowi zbiorowość statystyczną podzieloną na klasy wg określonej cechy jakościowej lub ilościowej z podaniem liczebności każdej z klas.

Konstrukcja szeregu rozdzielczego z przedziałami klasowymi.

1)         określenie empirycznego obszaru zmienności (rozstępu) cechy

2)         ustalenie liczby przedziałów klasowych (k) i ich długości (h) najczęściej wg wzoru:

zaś

                                     

Uwaga!!! Istotne jest ustalenie granic poszczególnych klas.

 

Prezentacja pierwszej klasy. Jej granice dolne to z reguły minimalna wartość liczby lub cechy.

 

Prezentacja graficzna szeregów statystycznych.

WYKRESY STATYSTYCZNE- graficzna forma prezentacji danych oraz prezentacja i analiza uogólnionych informacji statystycznych. Każdy wykres powinien zawierać tytuł, żródło danych i legendę..

Najczęściej stosuje się wykresy:

a)liniowe (diagramy i krzywe liczebności)

b)powierzchniowe(wykresy słupkowe i kołowe)

c)pasmowe, d)bryłowe, e)punktowe,

f)mapowe, g) kombinowane

HISTOGRAM –(liczebności, częstości, l. i cz. skumulowanej) Rodzaj wykresu słupkowego oparty na prostokątnym układzie współrzędnych; Histogram składa się z pionowych

przylegających do siebie prostokątów (słupków). Długości podstaw tych prostokątów są proporcjonalne do rozpiętości

przedziałów klasowych, a wysokość do ich liczebności na jednostkę rozpiętości. Zwykle histogram służy do przedstawiania struktury szeregów rozdzielczych o równych przedziałach klasowych i wówczas wysokość prostokąta jest proporcjonalna do liczebności. Budując histogram na podstawie szeregu o nierównych przedziałach klasowych, należy uprzednio obliczyć liczebności przypadające w danym przedziale na jednostkę jego rozpiętości. Histogram umożliwia poznanie typu rozkładu zbiorowości statystycznych wg badanej cechy

MIARY ŚREDNIE

Miary klasyczneobliczane są one na podstawie wszystkich danych

Średnia aryt. – to suma wartości zmiennnej wszystkich jednostek badanej zbiorowości podzielonej przez liczbę tych jednostek; średnia wartość cechy

Średnia harmoniczna – jest odwrotnością średniej arytmetycznej z odwrotnością wartości zmiennych stosuje się ją jeśli cecha wyrażona jest w przeliczeniu na jednostke innej cechy, np., gęstość zaludnienia (osoba/km2), dochód na osobę (zł/os), cena (zł/kg), prędkość (km/godź0

Średnia geometryczna  - stosuje się ją trzeba zgadać tempo zmian zjawiska, przy analizie szeregów czasowych.

Miary pozycyjne-do ich wyznaczenia stosuje się tylko niektóre wartości cechy, wybrane ze względu na pozycję, jaką zajmują w uporządkowanym zbiorze danych.

Mediana (Q2) –dzieli zbiorowość w stosunku2:2, interp: wartość cechy środkowej jednostki. 50% jednostek ma wartość cechy nie wiekszą, 50% nie mniejszą,

Dominanta –, mówi o tym która wartość cechy występuje najczęściej. największa liczba jednostek posiada określona wartość cechy

Q2 –  dzieli zbiorowość w stosunku 1:4, Interp:25 % jednostek ma co najwyżej...,

A 75% co najmniej

Q3 – 75% jednostem ma co najwyżej .., a 25% co najmniej

Procedura wyznaczania kwartyli:

1)uporządkować dane, 2) wyznaczyć pozycje poszukiwanych kwartyli, 3)obliczyć lub odszukać wartość kwartyli

Wzajemne relacje między średnią, medianą i dominant - za ich pomocą najłatwiej określić asymetrie rozkładu:

1) x=Do=Mewszystkie 3 miary średnie są równe to  rozkładem symetrycznym.

2)x>Me >D Wartość średniej jest większa niż wartość mediany i wartość mediany jest większa od wartości dominanty tj. - oznacza że wartość cechy większości jednostek statystycznych jest niższa od średniej arytmetycznej. Taki rozkład nosi nazwę rozkładu o asymetrii prawostronnej. (dodatniej)

3)  x< Me<D- Wartość średniej jest mniejsza niż wartość mediany i wartość mediany jest mniejsza od wartości dominanty. Oznacza że wartość cechy większości jednostek statystycznych jest wyższa od średniej arytmetycznej. Jest to rozkład o asymetrii lewostronnej.

Równanie Pearsona (zależność między średnią, medianą i dominantą) Do=3Me-2x

Miary zróżnicowania

Rozstęp – jest różnicą między największą i najmniejszą wartością zmiennej w badanej zbiorowości  Interp: wartość cechy zawiera się w przedziale

Rozstęp międzykwartylowy (RQ) –jest to różnica między kwarylem 1 a 3.  Interp: dla 50 % środkowych jednostek różnica między największa a najmniejszą wartością cechy wynosi..

Odchylenie ćwiartkowe (Q)– jest to połowa zakresu zmienności 50% środkowych jednostek:  Interp: przeciętne odchylenie 50 % środkowych jednostek od mediany

Odchylenie przeciętne (d) – jest średnią arytmetyczną bezwzględnych wartości (modułów) odchyleń wartości cechy od jej  średniej arytmetycznej, okresla o ile wszystkie jednostki danej zbiorowości różnią się średnio ze zwględu na wartość zmiennej od średniej arytmetycznej. 

Interp.:średni rozrzut pomiarów wokół średniej

Wariancja – jest to średnia wartość podniesionych do kwadratu odchyleń od średniej.(podniesiona do kw żeby pozbyć się minusów) Interp: średni kwadrat odchylenia wartości cechy od średniej ..( do kwadratu)

Odchylenie standardowe – określa o ile wszystkie jednostki zbiorowości różnią się od średniej arytmetycznej badanej zmiennej. Jest pierwiastkiem z wariancji Interp: wartość cechy poszczególnych jednostek różni się przeciętnie od średniej

Współczynnik zmienności (Vs)– to iloraz odchylenia standardowego i średniej w danym rozkładzie, wyrażony w procentach. Mówi o tym jaki procent średniej aryt stanowi odchylenie standardowe.

Informuje o sile dyspersji. 0-20% zroż c. -słabe, 20-40%-umiarkowane, 40-60%-silne, 60 % i powyżej-bardzo silne. Gdy silne i bardzo silne to zbiorowość niejednorodna

Interp; Odchylenie standardowe liczby napraw stanowi ..% średniej wartości cechy

Typowy obszar zmienności-  typowe jednostki to takie które mieszczą się w przedziale (x-s;x+s), różnią się od średniej mniej niż o odchylenie Interp: liczba napraw typowego urządzenia.....

Pozycyjny współczynnik zmienności (Vq) – odchylenie standardowe podzielone przez medianę razy 100%, info jaki procent mediany stanowi odchylenie ćwiartkowe, przedziały analogicznie jak w Vs

Miary asymetrii (skośności)

Współczynnik Pearsona (Ap) – pozwala określić kierunek i siłę asymetrii; jego wartość jest liczbą z przedziału [-1,1], gdy Ap> 0 a. prawostronna(dodatnia), Ap<0 lewostronna  ujemna, Ap=0 symetria.

Przedziały określające siłę asymetrii: 0-02 a. rozkładu bardzo słaba, 0,2-0,4 –słaba, 0,4-0,6 umiarkowana, 0,6-0,8silna, powyżej 0,8 bardzo silna

Pozycyjny współczynnik asymetrii (Aq) określa kierunek i siłę asymetrii jedynie w centralnej części rozkładu, mierzy asymetrię Interp: 50% środkowych jednostek, kierunek i siła określana jak z Ap

Klasyczny współczynnik asymetrii (As)- najbardziej precyzyjna miara asymetrii rozkładu, przyjmuje wartości z przedziału

[-2,2], również określa kierunek (lewo, prawo), i siłę asymetrii: 0-0,4 a. roz bardzo słaba, 0,4-0,8 słaba, 0,8-1,2 umiarkowana, 1,2-1,6 silna, powyżej 1,6 bardzo silna

Zmienna losowa i jej rozkłady

Zmienna losowa- funkcja przyporządkowująca każdemu zdarzeniu elementarnemu wartość liczbową, oznacza się ją jako X,Y.

Zmienna losowa skokowa to zmienna, która przyjmuje niektóre wartości, np.liczba osób w grupie studenckiej.

Zmienna losowa ciągła to zmienna, która przyjmuje wszystkie wartości z pewnego przedziału liczbowego, np. wzrost, waga.

...

Zgłoś jeśli naruszono regulamin