On-line učionica

7. novembar 2011.

Opisivanje podataka: numeričke deskriptivne mere – vežbe

Filed under: Sistemi za obradu podataka,Vežbe — jelena100janovic @ 9:08 am

Vežba 1: (sredina, medijana i mod)

Elektrodistribucija je izabrala 20 potrošača građana. Slede iznosi, zaokruženi na 50 dinara, korisničkih računa za struju prošlog meseca:

2700    2400    2900    2500    1250    2350    3750    2300    3000    3500    3350    3400    1950    1750    2800    3300    1650    3100    3250    3350

Koliki su sredina, medijana i mod ovih iznosa?

Rešenje: Sredina je 2727,5. Medijana je 2850. (Budući da je paran broj podataka ne postoji jedan srednji broj. Medijana je prosek dva srednja broja, 2700 i 3000). Mod je 3350.

Ako mod ne postoji, Excel će prikazati #N/A u toj ćeliji. Ako postoji više od jednog moda Excel će prikazati onaj koji se prvi pojavljuje u nizu podataka.

Uputstvo…

Vežba 2: (geometrijska sredina)

Profit koji je ostvarila jedna građevinska firma na četiri skorašnja projekta su bili 3 procenta, 2 procenta, 4 procenta i 6 procenata. Kolika je geometrijska sredina profita?

Rešenje: 3%.

Uputstvo…

Vežba 3: (korišćenje geometrijske sredine za nalaženje prosečnog procentualnog porasta tokom vremenskog perioda)

Tokom 1990-ih, Beograd je bio jedan od najbrže rastućih gradskih područja u Srbiji. Broj stanovnika je porastao sa 852.737 1990. godine na 1.563.282 2000. godine. Ovo je povećanje od 710.545 ljudi ili 83-procentno povećanja tokom 10-godišnjeg perioda. Koliko je prosečno godišnje povećanje?

Formula za nalaženje prosečnog procentualnog povećanja tokom vremenskog perioda je:

 

Rešenje: Populacija Beograda se povećala prosečno 6,25 procenata godišnje od 1990. godine do 2000. godine.

Uputstvo…

Vežba 4: (ponderisana sredina)

Jedna građevinska kompanija plaća svoje najamne radnike 1150 dinara, 1350 dinara, ili 1550 dinara po satu. Ima 26 najamnih radnika, 14 su plaćeni po ceni od 1150 dinara, 10 po ceni od 1350 dinara i 2 po ceni od 1550 dinara. Kolika je ponderisana sredina nadničke plate ovih 26 radnika?

Rešenje: Ponderisana sredina nadničke plate je 1257,69 dinara.

Uputstvo…

Excel-ov Descriptive Statistics Analysis ToolPak Vam omogućava da nađete sredinu, standardnu grešku, medijanu, mod, standardnu devijaciju, varijansu uzorka, spljoštenost, asimetrije, interval, minimum, maksimum, sumu, broj, najveći broj po poziciji, najmanji broj po poziciji i nivo poverenja jednostavno unoseći numeričke podatke. Ako se Analysis alatke ne pojavljuju u Add-Ins spisku, možda ćete  morati da dodate Analysis ToolPak koristeći custom instalaciju Microsoft Excel-a.

Vežba 5: Jedna privatna firma ugrađuje automatska garažna vrata. Sledeći niz pokazuje koliko je minuta potrebno za instalaciju vrata na uzorku od 10 vrata: 28, 32, 24, 46, 44, 40, 54, 38, 32 i 42. Izračunajte deskriptivnu statistiku.

Rešenje: Nakon što dobijete svoje rezultate, proverite šta piše pod count u dobijenoj tabeli da biste bili sigurni da imate tačan broj ulaznih stavki.

Tema ove lekcije su pozicione mere (ili mere centralne tendencije) i disperzije ali s obzirom da dobijena tabela prikazuje dodatne pojmove koje ćemo koristiti u budućim lekcijama, iskoristićemo ovu priliku da objasnimo šta Excel prikazuje.

Excel-ova Descriptive Statistics izlazna tabela sadrži tri pozicione mere: sredinu, medijanu i mod. Sredina (38) se računa tako što se suma (380) deli sa brojem stavki (10).

Medijana (39) je poziciona mera u sortiranom skupu podataka. To je srednji broj u skupu podataka sa neparnim brojem vrednosti. U parnom skupu brojeva, to je vrednost između dve srednje vrednosti.

Mod (32) je mera frekvencije, to je najčešće pojavljivana vrednost. Kada postoje dve ili više vrednosti koje se pojavljuju isti broj puta (višestruki modovi), Excel prikazuje vrednost koja se prva pojavljuje u skupu podataka. U nekim skupovima podataka, svaka vrednost je jedinstvena pa Excel prikazuje „#N/A“. Mod se često koristi kod grupisanih podataka. Raspodela frekvencija sa najvećim brojem pojavljivanja se zove modalni interval.

Izlazna tabela sadrži nekoliko mera varijacije. Interval (30) je jednak maksimalnoj vrednosti (54) minus minimalna vrednost (24). Zapamtite, kod nekih skupova podataka interval može biti varljiva mera varijacije s obzirom da sadrži samo dve ekstremne vrednosti.

Standardna devijacija (9,092) je najčešća mera varijacije ili disperzije. U normalnom ili simetričnom skupu podataka oko 68 procenata će biti u plus minus jednoj standardnoj devijaciji sredine (28,908 – 47,092), 95 procenata će biti u plus ili minus dve standardne devijacije sredine (19,816 – 56,184) i skoro svi podaci (99,7 procenata) će biti u plus ili minus tri standardne devijacije sredine (10,724 – 65,276).

Varijansa je kvadrat standardne devijacije. Excel-ova izlazna tabela prikazuje standardnu devijaciju i varijansu uzorka računate korišćenjem n-1 u imeniocu. Da biste našli standardnu devijaciju populacije i varijansu populacije, računate korišćenjem n kao imenioca, koristite STDEVP i VARP funkcije.

Najveća (2) i najmanja (2) vrednost u Excel-ovoj izlaznoj tabeli su drugo najduže (46) i drugo najkraće (28) instalaciono vreme. Ove vrednosti se mogu koristiti da bi se uklonili ekstremi. Oni se takođe mogu koristiti da bi se odredili kvartili u podacima sa velikim brojem frekvencija. Na primer ako ste imali 1600 u svom skupu podataka, podelili biste broj (1600) sa 4 i uneli 400 kao parametar za najveću i najmanju vrednost. Izlazna tabela bi onda pokazala približno treći i prvi kvartil.

Standardna greška (2,875) prikazana u izlaznoj tabeli će se koristiti više u našim kasnijim vežbama. Standardna greška je standardna devijacija podeljena sa kvadratnim korenom veličine uzorka. To je mera nesigurnosti oko sredine i koristi se za statistička predviđanja (intervali poverenja, regresiona analiza i testovi hipoteza.)

Nivo poverenja (90,0%) (5,271) je polovina 90%-nog intervala poverenja za sredinu. U ovom merenju možemo biti 90% sigurni da će interval, 32,729 minuta do 43,271 minuta, sadržati populacijski parametar ili pravu sredinu vremena instalacije.

Spljoštenost (-0,436) meri stepen zašiljenosti u simetričnim raspodelama. Ako je simetrična raspodela zašiljenija od normalneraspodele, to jest, ako ima manje vrednosti na krajevima, mera spljoštenosti je negativna. Ako je raspodela ravnija od normalne raspodele, to jest ako ima više vrednosti na krajevima od odgovarajuće normalne raspodele, mera spljoštenosti je pozitivna. (Za više detalja o tome kako Excel računa spljoštenost pretražite Help za „KURT function“).

Asimetričnost (0,133) je mera nedostatka simetrije u raspodeli. Ako postoji nekoliko ekstremno malih vrednosti i kraj raspodele vuče na levo kažemo da je raspodela negativno asimetrična i naša vrednost asimetričnosti bi bila negativna. Ako postoji nekoliko ekstremno velikih vrednosti na kraju raspodele koji vuče na desno, kažemo da je raspodela pozitivno asimetrična i vrednost asimetričnosti bi bila pozitivna. Formula za nalaženje asimetričnosti koju koristi Excel se razlikuje od Pearson-ovog koeficijenta asimetričnosti koji ćete učiti na teorijskim časovima (Excel računa vrednost asimetričnosti koristeći treći stepen odstupanja od sredine. Za više detalja o tome kako Excel računa asimetričnost pretražite Help za „SKEW function“).

Uputstvo…

6 komentara »

  1. Samo bih pohvalio Vas trud i rad. iskreno se nadam da i Vasi ucenici rado citaju ovo stivo. Sa nadom da ce Vas entuzijazam dugo drzati srdacno Vas pozdravljam!

    Komentar od Djole — 9. novembar 2011. @ 12:15 pm | Odgovor

  2. Useful content and awesome design you got here! I want to thank you for sharing your solutions and taking the time into the stuff you publish! Sublime work!

    Komentar od Family Vacation Ideas — 16. novembar 2011. @ 7:46 am | Odgovor

  3. Poštovana, ne bih da ovako „javno“ komentarišem, jer je komentar em dugačak, em nerazumljiv za većinu „posetilaca“, em može da bude „neprijatan“, zbog grešaka koje su, pretpostavljam, posledica „prekucavanja“ umesto korišćenja najbolje metode koja postoji u modernim operativnim sistemima (nadaleko „čuvena“ „Copy/Paste“, hajde neka to neko pokuša pre …. godina pod MS/DOS-om, ako ste ga ikada koristili znate, a ako niste niste BogZnaŠta ni izgubili). Svoju elektronsku adresu Vam ostavljam „na volju“. Pošto ćirilica „nije popularna“ koristim latinicu ali ne „осисану“.
    Ненад

    Komentar od Nenad — 11. jul 2014. @ 6:16 pm | Odgovor

    • Mogli ste i ovde. Ja biram da li ću ga objaviti, ili ne. Pretpostavljam da imam neko neslaganje između rezultata u tekstu i u uputstvu za rešavanje… Ako stignem, proveriću, mada ne garantujem da će to biti skoro🙂

      Komentar od jelena100janovic — 11. jul 2014. @ 8:01 pm | Odgovor


RSS feed for comments on this post. TrackBack URI

Ostavite odgovor

Popunite detalje ispod ili pritisnite na ikonicu da biste se prijavili:

WordPress.com logo

Komentarišet koristeći svoj WordPress.com nalog. Odjavite se / Promeni )

Slika na Tviteru

Komentarišet koristeći svoj Twitter nalog. Odjavite se / Promeni )

Fejsbukova fotografija

Komentarišet koristeći svoj Facebook nalog. Odjavite se / Promeni )

Google+ photo

Komentarišet koristeći svoj Google+ nalog. Odjavite se / Promeni )

Povezivanje sa %s

Blog na WordPress.com.

%d bloggers like this: