TENTAMEN: Statistisk modellering för I3, TMS161, lördagen den 22
Oktober kl 8.30-11.30 på V. Jour: John Gustafsson, ankn. 5316.
Hjälpmedel: På hemsidan tillgänglig ordlista och formelsamling med
tabeller, BETA samt typgodkänd räknedosa.
Poängberäkning: Uppgifterna är av ervalstyp, där endast ett alternativ
är rätt. Korrekt besvarad uppgift ger 2 poäng, obesvarad uppgift (vet inte
eller alternativ f) ger 0 poäng och felaktigt besvarad uppgift ger -0.5 poäng
(era ifyllda alternativ ger automatiskt -1/2 poäng). Inlämnade lösningar
kommer ej tas hänsyn till vid rättningen. Fyll i och lämna in denna sida.
Svar: Läggs efter tentamens slut ut på hemsidan:
http://www.math.chalmers.se/∼anders.sjogren/StatMod/
1 För att studera kostnaden för olika utbildningar åren 1988-1990, sam-
lade man in data från 5 olika utbildningar under de tre åren. Vid en
tvåsidig variansanalys av de observerade kostnaderna ck man följande
DF Sum of squares Mean square F Stat Prob > F
Vid test på 5% signikansnivå kan vi därmed dra följande slutsats:
Både typen av utbildning och vilket år man undersöker har
eekt på kostnaden, och någon eller några av åren har olika eekt
på kostnaden beroende på vilken utbildning man tittar på.
Både typen av utbildning och vilket år man undersöker har
betydelse, men det nns ingen signikant skillnad mellan årskost-
nadseekten för olika typer av utbildningar.
De olika åren har olika eekt på kostnaden, men kostnaden
skiljer sig inte signkant åt för olika utbildningar.
De olika utbildningarna har olika eekt på kostnaden, men kost-
naden skiljer sig inte signkant åt för olika år.
2 En auktionsrma vill beskriva hur åldern och antalet budgivare på en
klocka påverkar priset på klockan. Man bestämmer sig för följande mod-
Y = β0 + β1X1 + β2X2 + β3X3 + , där är N(0, σ). X1 = Z1X2 = Z2X3 = Z1Z2
där Z1 är antalet budgivare och Z2 är klockans ålder. Ovan syns en
scatterplot över resultaten. En Minitab-utskrift och frågeställningen
följer på nästa sida. (Bidders står för budgivare, age står för ålder och
Regression Analysis: price versus age; bidders; bidders*age
price = 320 + 0.88 age - 93.3 bidders + 1.30 bidders*age
1 I exemplet ovan verkar multikolinearitet vara ett problem. 2 Multikolinearitet innebär att det nns (starka) korrelationer mel-
lan två eller era av regressorerna.
3 Multikolinearitet innebär att responsvariabeln är korrelerad med
3 Ovan visas fyra olika spridningsdiagram (scatter plots). I vilken eller
vilka av dessa ger Pearsons korrelationskoecient ett bra mått på as-
Endast Figur 1, Figur 3 och Figur 4.
4 Man vill avgöra om män i högre utsträckning än kvinnor röstar bor-
gligt. Man tog ett stickprov av röstberättigade män och kvinnor och
frågade dem: Röstar du borgligt? Hur ska man på bästa sätt analysera
Med χ2-test för oberoende i tvåsidig tabell för kategorisk data.
Med ensidig variansanalys utan blockning.
Med ensidig variansanalys med blockning.
5 Du vill undersöka vem av fem tyngdlyftare som är starkast, genom att
observera den tyngsta vikt de kan lyfta i sex olika grenar. Du har fått
reda på att skillnaden mellan olika lyftare kan anses vara multiplikativ,
vilket t.ex. innebär att en lyftare i grunden kan lyfta 10% mer än en an-
nan, oberoende av vilken gren det gäller. Vi låter Yij vara vikten lyftarei lyfter i gren j och vi vill analysera försöket med ensidig variansanalys
med blockning. Om ovanstående information tyder på att transformation av Yij bör
göras innan vidare analys utförs, vilken transformation är det då?
Informationen ovan tyder inte på att någon transformation be-
6 Tabellen nedan visar ANOVA-tabellen för en tvåsidig variansanalys.
Source DF Sum of squares Mean square F Stat
Värdena i några av fälten saknas och är markerade med (*). Från de
givna sirorna kan man ändå beräkna hur många nivåer som man an-
vänt sig av på varje faktor och hur många observationer som har gjorts
per cell, d.v.s. per kombination av nivåerna i A och B. De är:
Faktor A: 2 nivåer, faktor B: 4 nivåer, antal observationer per
Faktor A: 3 nivåer, faktor B: 5 nivåer, antal observationer per
Faktor A: 2 nivåer, faktor B: 4 nivåer, antal observationer per
Faktor A: 3 nivåer, faktor B: 5 nivåer, antal observationer per
7 En enkel linjär regressionsmodell har anpassats till data från 27 mätvär-
den. Man vill nu testa om β1 är signikant d.v.s. skild från noll. Man
H0 : β1 = 0Ha : β1 = 0
Man har under sina beräkningar fått ut att ˆβ1 = 0.64, MSE = 0.31
X)2 = 4.21. Vilket av följande interval hamnar p-värdet
8 För att ta reda på hur mycket avverkningsbar skog en bonde har på
sin mark fälldes 30 fullvuxna granar. Diametern på varje träd mättes
1 meter ovanför marken i enheten centimeter och volymen timmer per
träd mättes i enheten m3. Låt Xi vara diametern på träd i och Yi vara
volymen timmer som man får ut från träd i. Det visar sig att man för de
data man har samlat in kan anpassa en enkel linjär regressionsmodell.
Skattningen av medelresponsen för denna modell blir:
Y = −0.994. + 0.015 · X
Modellen är ej relevant för X nära 0.
2: Om diametern på trädet ökar 1 cm ökar volymen timmer med i
3: Om diametern på trädet ökar 1 cm ökar volymen timmer med i
Vilket eller vilka av dessa påståenden är korrekt/korrekta?
Påstående 2 är sant, men inte de andra.
Påstående 1 och 2 är sanna, men inte 3.
Påstående 1 är sant, men inte de andra.
Påstående 3 är sant, men inte de andra.
9 Vid en studie av bensinförbrukning är 4 olika bilar och 5 olika förare
involverade. Alla förare kör en och samma runda. Varje förare kör alla
bilarna på en egen dag. Under den dagen kör föraren i fråga rundan
en gång per bil, i slumpvis ordning och under liknande trakförhål-
landen. Bensinförbrukningen under varje runda antecknas sedan. Man
observerar för övrigt att trakförhållandena under de olika dagarna är
något olika. Man vill nu ha ut mest möjliga information ur försöket. Om man an-
tar att övriga modellantaganden stämmer, kan/bör man då baserat på
Analysera eekten av bil med ett χ2-test.
Analysera eekten av bil med en ensidig variansanalys med
Analysera eekten av både bil och förare med en tvåsidig vari-
Analysera eekten av både bil och förare med ett χ2-test.
Inget av ovanstående är korrekt, eftersom förarna körde under
olika dagar vilka hade olika trak-förutsättningar.
10 Ett distributionsföretag vill beräkna kostnaderna för att frakta ett
paket. I en multipel regressionsmodell vill man använda prediktorernaZ1 = paketets vikt (i kg) och Z2 = hur långt paketet fraktas (i km).
Svarsvariabeln Y är kostnaden for frakten (i SEK).
Man beslutar sig för att använda en modell med följande regressor-
er:X1 = Z1X2 = Z2X3 = Z1Z2
Y = β0 + β1X1 + β2X2 + β3X3 + , där är N(0, σ).
Vad säger denna modell om den skattade förväntade förändringen av
kostnaden Y, då distansen Z2 ökar 1 km och vikten Z1 hålls konstant
Den skattade förväntade förändringen är +0.052 SEK
Den skattade förväntade förändringen är +0.41 + 0.052 SEK
Den skattade förväntade förändringen är +0.052 + 2*0.105 SEK
Den skattade förväntade förändringen är +0.41 + 0.052 + 0.105
11 I ett test vill man undersöka hur livslängden på ett batteri påverkas av
två faktorer: materialtypen och temperatur. Temperaturfaktorn sätts
till nivåerna −10oC, 25oC och 50oC och man testar tre olika material-
Resultatet visas i tabellen nedan. Man vet att där är fyra observationer
i varje cell, d.v.s. i varje kombination av temperaturer och material.
F-statistikan för test av hypotesen att det inte nns något samspel mel-
12 Bensinförbrukning för 4 typer av bilar undersöks. Ett slumpvis stick-
prov tas med 3 bilar av varje typ och 12 olika förare. Förarna tilldelas
sedan en bil på måfå och ordningen i vilken de kör en och samma
bestämda tur väljs på måfå. Varje bil blir alltså körd rundan en gång,
varefter bensinförbrukningen antecknas. Hur ska man på bästa sätt
Med 2-test för oberoende i tvåsidig tabell för kategoriska data.
Med ensidig variansanalys utan blockning.
Med ensidag variansanalys med blockning.
13 Efter injektion av ett antibiotikum i blodet binds en viss del av den
injicerade mängden till serumproteiner. Detta fenomen har stor far-
makologisk betydelse, eftersom det påverkar hur eektiv antibiotikan
ifråga blir mot infektioner. I en studie ville man undersöka hur stor
del av fem olika antibiotikatyper som bands. Varje medel injicerades
på fyra olika individer. De tjugo frivilliga försökspersonerna tilldelades
genom lottning en av de fem antibiotikatyperna.
Detta analyserades först med en ensidig variansanalys, varvid det visades
att skillnader mellan antibiotikumen nns. Man vill nu förutsättningslöst
utföra test för att se vilka antibiotikum som skiljer sig åt sinsemellan. Vilken av följande metoder är dels korrekt och dels mest eektiv om
man vill utföra de testen med en total signikansnivå på 5%?
Parvisa t-test på 5%-nivån.
14 För att kontrollera att de modellantaganden som man gör i regression-
sanalys är gilitiga konstrueras grafer där man plottar residualerna mot
olika variabler som de antas vara oberoende av.
Vilken av följande variabler ska man INTE plotta residualerna mot?
Det går bra att plotta residualerna mot alla dessa alternativ.
15 I en tvåvägstabell med c kolumner och r rader har teststatistikan X2
approximativt en χ2-fördelning med (c − 1)(r − 1) frihetsgrader.
För att besvara frågan om 17 till 19-åriga ungdomars användande av
cigaretter påverkas av om föräldrarna röker gjordes insamling av data
Vad kan man säga om nollhypotesen "17-19 åriga ungdomars använ-
dande av cigaretter är oberoende av om någon av föräldrarna röker"?
Vi kan förkasta nollhypotesen om oberoende mellan A och B
på signikansnivå 10%, men inte på 5%.
Vi kan förkasta nollhypotesen om oberoende mellan A och B
på signikansnivå 5%, men inte på 2,5%.
Vi kan förkasta nollhypotesen om oberoende mellan A och B
på signikansnivå 2,5%, men inte på 1%.
Vi kan förkasta nollhypotesen om oberoende mellan A och B
C h ild h o o d H e a d a c h e s D o n 't Tak e T h e m L ig h tly B y D r. B ria n A b e ls o n D .C . R N C . Headaches during childhood should be taken seriously. There is a growing body of evidenceshowing that headaches that occur during childhood can set a pattern for headache relateddysfunction throughout a person's adult life. In the United States, it is estimated that more than 45m
CURRICULUM VITAE 1. BASIC INFORMATION Full name: Petri Hyytiä Date and place of birth: 6th of August, 1956, Kuusamo, Finland Home address: Present work address: Citizenship: Finland Language skills: Education and degrees: Docent, Faculty of Biosciences, University of Helsinki Ph.D., Department of Genetics, University of Helsinki (Dissertation: “Alco