Video: Statistikk med R, Beskrive data (Kapittel 4) 2025
GED Science-testen vil stille spørsmål knyttet til beskrivende statistikk. Du kan ofte oppsummere en samling data (fra et eksperiment, observasjoner eller undersøkelser, for eksempel) ved å bruke beskrivende statistikk, tall som brukes til å oppsummere og analysere dataene og trekke konklusjoner fra det. Beskrivende statistikk for en samling av data inkluderer følgende:
-
Frekvens: Antallet personer i en gruppe eller antall ganger en verdi oppstår i et datasett. For eksempel, i et fellesskap på 360 barn, har 240 av dem brunt, krøllet hår, så frekvensen er 240.
-
Relativ frekvens: Antallet personer i en gruppe eller antall ganger en verdi oppstår i et datasett i forhold til totalt antall individer i gruppen eller totalt antall verdier i datasettet. For eksempel vil den relative frekvensen av barn med brunt, krøllet hår fra den forrige kule være 240/360 = 2/3.
-
Kumulativ frekvens: Den totale frekvensen av frekvenser, som ofte representeres i en lineær graf. Hvis du for eksempel sporer utseendet på en fullmåne, har du en forekomst omtrent hver 29. 5 dager, så på slutten av 29. 5 dager vil den kumulative frekvensen være 1. På slutten av 59 dager, det ville være 2; på slutten av 88. 5 dager ville det være 3; og så videre.
-
-
Midler: Midtpunktet av datasettet, som kan være noe av følgende:
-
Midlere er gjennomsnittet . For å beregne gjennomsnittet, sum verdiene og divider med antall verdier; For eksempel er gjennomsnittet av 3, 4 og 5 (3 + 4 + 5) ÷ 3 = 12 ÷ 3 = 4.
-
Median den midlere verdien i settet når verdiene er ordnet i rekkefølge. Halvparten av tallene i et datasett ligger under median og halvløg over medianen. Hvis et datasett inneholder et jevnt antall verdier, gjennomsnitt de to i midten for å finne medianen. For eksempel er medianen 3, 4, 5 og 6 (4 + 5) ÷ 2 = 9 ÷ 2 = 4. 5.
-
Modus er verdien som vises oftest i settet.
-
-
Spredningens målinger: Hvor spredt verdiene er i et datasett, som inkluderer følgende:
-
Område: Forskjellen mellom høyeste og laveste verdi i datasettet.
-
Interkvartileområde: Utvalget av de midterste 50 prosent av verdiene i datasettet. Tenk på dette som midtlinjen.
-
Her er noen eksempler på spørsmål som hjelper deg med å varme opp for statistiske spørsmål du sannsynligvis vil oppleve på GED Science-testen.
Forskere testet jordprøver for å beregne nivåene av jordkomprimering på en gård. Dataene vises i følgende tabell. For å svare på spørsmålene, merk at densitet = masse / volum.
Eksempel | Jordmasse (gram) | Jordvolum (cm 3 ) |
---|---|---|
1 | 8. 9 | 15. 9 |
2 | 7. 4 | 11. 54 |
3 | 12. 2 | 20. 3 |
4 | 11. 7 | 19. 7 |
5 | 9. 3 | 16. 5 |
-
Den gjennomsnittlige jordtettheten for alle prøvene er nærmest hvilken av følgende?
-
(A) (5.9
-
(B) 0. 06
-
(C) 0. 59
-
(D) 1. 696
-
-
Medianjordensiteten for alle prøvene er nærmest Hvilket av følgende (avrundet til 2 desimaler)?
-
(A) 0. 59
-
(B) 0. 594
-
(C) 0. 564
-
(D) 0. 6 < Jordens tetthet er nærmest hvilket av følgende?
-
-
(A) 0. 814
-
(B) 8. 76
-
(C) 4. 8
-
(D) 0. 081
-
Kontroller nå svarene dine:
-
For å beregne gjennomsnittlig jordtetthet, total masse for alle jordprøver, totalt volumet av alle jordprøver, og divider deretter massetallet med volumetallet:
-
som runder opp til 0. 59, svar på valg (C). En annen måte å finne svaret på er å beregne tettheten til hver jordprøve og deretter beregne gjennomsnittet av disse tetthetene.
For å finne middelgrunnens tetthet, beregne jorda tetthet for hver prøve, ordne jordens tettheter fra minste til største, og velg den i midten, Valg (B), 0. 594.
-
Jordens tetthet er forskjellen mellom den største a nd minste jordens tetthet, så beregne jordens tetthet for hver prøve og trekk den minste fra den største til å få 0. 081, Valg (D).
-
Grafer, spesielt linjediagrammer og bargrafer, brukes ofte til å vise data grafisk. I de fleste tilfeller, når du ser et spørsmål med en graf, har oppgaven med å beskrive dataene statistisk blitt gjort for deg. Grafen viser dataene i et meningsfylt format, slik at du kan visualisere gjennomsnittet, medianen, modusen og distribusjonen av data. Men selv om et spørsmål inneholder en graf, kan du bli bedt om å identifisere et statistisk aspekt av dataene som vises.
For å svare på slike spørsmål, må du kanskje konvertere visuelle data til en faktisk verdi. Her er et par spørsmål til praksis.
Sentrene for sykdomskontroll (CDC) ga ut grafen som er vist her:
-
Kreditt: Kildemateriale med høyden til sentre for sykdomskontroll
Hvilke av de følgende setningene oppsummerer best dataene som vises i grafen?(A) Rabies i vaskebjørn er et voksende problem.
-
(B) Heller av rabies generelt har gått ned siden 1993.
-
(C) Vaskebjørn er primært ansvarlig for å smitte mennesker med rabies.
-
(D) Bats utgjør den største rabiesrisikoen for mennesker.
-
Hvilken av plantene i den følgende grafen vokser best med en gjennomsnittlig solstråle?
-
-
(A) geranium
-
(B) fuchsia
-
(C) impatiens
-
(D) trillium
-
Kontroller svarene dine:
-
Du kan utelukke Valg (C) og (D) fordi grafen ikke viser noen sammenheng mellom rabies hos dyr og mennesker. Du kan utelukke Choice (A) fordi forekomsten av rabies i vaskebjørn faktisk gikk ned fra 1993 til 2010, hvilket også er grunnen til at Choice (B) er det riktige svaret.
-
Gjennomsnittlig (gjennomsnittlig) mengde solskinn er mellom Full Sun og Full Shade, som er merket Partial Shade på grafen. Planten viste seg å vokse best i delvis skygge, er impatiens, Choice (C).
