Opgaver i Lineær regression
Fag: Matematik C
Opgave 1: Regression vha. it-værktøj
I denne opgave skal du bruge et matematikprogram (f.eks. GeoGebra, TI-Nspire eller Excel) til at finde den bedste rette linje gennem et sæt målepunkter. Vi har følgende data:
| $x$ | 1 | 2 | 4 | 5 | 7 |
|---|---|---|---|---|---|
| $y$ | 3 | 5 | 8 | 11 | 15 |
- Opgave a: Indtast tallene i dit it-værktøj og udfør en lineær regression. Angiv forskriften på formen $f(x) = ax + b$.
- Opgave b: Identificer hældningskoefficienten $a$ og begyndelsesværdien $b$ ud fra din fundne forskrift.
- Opgave c: Brug din model til at beregne (forudsige), hvad $y$ er, når $x = 10$.
Opgave 2: Forklaringsgrad
En gymnasie-elev har målt sammenhængen mellem vægten af en beholder og mængden af vand i den. Data er vist her:
| Liter vand ($x$) | 0,5 | 1,0 | 1,5 | 2,0 | 2,5 |
|---|---|---|---|---|---|
| Samlet vægt i kg ($y$) | 1,21 | 1,69 | 2,22 | 2,71 | 3,18 |
- Opgave a: Bestem forskriften for den lineære model $f(x)$ ved hjælp af lineær regression og angiv forklaringsgraden $R^2$.
- Opgave b: Forklar den fysiske betydning af tallene $a$ og $b$ i denne specifikke kontekst (hvad repræsenterer de i forhold til vandet og beholderen?).
- Opgave c: Vurder modellens pålidelighed ud fra værdien af $R^2$. Hvor tæt ligger målepunkterne på den rette linje?
Opgave 3: Vurdering af model og fremskrivning
En teknisk virksomhed har opsamlet data for strømforbruget i en maskine som funktion af driftstiden i timer.
| Tid i timer ($x$) | 10 | 20 | 30 | 40 | 50 |
|---|---|---|---|---|---|
| Forbrug i kWh ($y$) | 45 | 88 | 135 | 178 | 250 |
- Opgave a: Gennemfør en lineær regression og angiv forskriften samt $R^2$.
- Opgave b: Virksomheden vil bruge modellen til at forudsige forbruget efter 500 timer. Diskuter de sikkerhedsmæssige og økonomiske risici ved at stole blindt på en lineær model, når man bevæger sig langt uden for det målte interval.
- Opgave c: Man vurderer, at datapunktet $(50, 250)$ er en målefejl. Prøv at lave regressionen igen uden dette punkt. Hvilken betydning har dette haft for $R^2$-værdien? Hvordan har det ændret den forudsagte værdi for forbrug efter 500 timer?