Opgaver i Beskrivende Statistik

Fag: Matematik C


Opgave 1: Middelværdi, median og typetal

Beskrivende statistik handler om at opsummere et datasæt, så man hurtigt kan få overblik over de vigtigste egenskaber. De tre mest brugte mål for datasættets midte er middelværdi, median og typetal.

En gruppe HTX-elever har målt styrken af 7 forskellige betonprøver (målt i MPa): $$22, \quad 25, \quad 25, \quad 28, \quad 30, \quad 32, \quad 45$$

  • Opgave a: Beregn middelværdien (gennemsnittet) for betonstyrken.
  • Opgave b: Find medianen og typetallet for datasættet.
  • Opgave c: Forklar kort forskellen på middelværdi og median. Hvis den stærkeste prøve i stedet havde været 100 MPa, hvilken af de to værdier ville så ændre sig mest?

Opgave 2: Spredningsmål og kvartiler

For at forstå et datasæt er det ikke nok at kende midten; vi skal også vide, hvor meget observationerne spreder sig. Her bruger vi kvartilsæt, variationsbredde og spredning (standardafvigelse).

En maskine producerer metalbolte. En kontrolmåling af 11 boltes diameter (i mm) har givet følgende sorterede data: $$10.0, \quad 10.1, \quad 10.1, \quad 10.2, \quad 10.2, \quad 10.3, \quad 10.4, \quad 10.5, \quad 10.6, \quad 10.8, \quad 12.0$$

  • Opgave a: Bestem variationsbredden og find kvartilsættet ($Q_1$, median, $Q_3$).
  • Opgave b: Beregn kvartilbredden ($IQR = Q_3 – Q_1$). Hvad fortæller dette tal om de midterste 50% af boltene?
  • Opgave c: Brug et it-værktøj til at finde spredningen (standardafvigelse, $\sigma$). Redegør for, hvorfor en lille spredning er vigtig i en industriel produktion.

Opgave 3: Identifikation af outliers

En “outlier” er en observation, der ligger så langt væk fra de andre, at den mistænkes for at være en målefejl eller et helt ekstremt særtilfælde. En almindelig metode til at identificere outliers er at se, om en værdi ligger mere end $1{,}5 \cdot IQR$ væk fra kvartilerne.

Vi betragter et datasæt over strømforbruget (i kWh) i en række små virksomheder: $$40, \quad 42, \quad 45, \quad 47, \quad 48, \quad 50, \quad 52, \quad 55, \quad 95$$

  • Opgave a: Find kvartilsættet og beregn kvartilbredden ($IQR$).

  • Opgave b: Benyt reglen om outliers:

    • En observation er en outlier, hvis den er større end $Q_3 + 1{,}5 \cdot IQR$
    • Eller hvis den er mindre end $Q_1 – 1{,}5 \cdot IQR$

    Vurder ved beregning, om værdien $95$ er en outlier i dette datasæt.

  • Opgave c: Diskuter kritisk, hvad man bør gøre med en outlier i en teknisk rapport. Skal man altid slette den, eller kan den indeholde vigtig information om systemet? Giv et eksempel på en situation, hvor en outlier er vigtig at beholde.