# MS0065 HT2018 Datalab Uppgifter uwe.menzel@slu.se uwe.menzel@matstat.de # skriv era namn här! ( 2 studenter per fil ) # <-- lines starting with this symbol are comments # Quick-R: https://www.statmethods.net/ # R homepage: https://www.r-project.org/ The R Project for Statistical Computing # CRAN: https://cran.r-project.org/ # Stackoverflow [r] https://stackoverflow.com/questions/tagged/r # kurs: www.matstat.org # OBS: alla uppgifter ska lösas med hjälp av R # ============================================ # 1. Beräkna medelvärdet för följande vektor: 3, 4, 5, 6, 8, 10 (använd lämplig R-funktion) # 2. Beräkna väntevärdet, varians och standardavvikelse för följande diskret slumpvariabel. # (använd definitionen för väntevärde, varians och standardavvikelse) # utfall: 3, 4, 5, 6, 8, 10 # sannolikheter 0.13, 0.3, 0.23, 0.05, 0.15, 0.14 # 3. Rita ett stolpdiagram för sannolikhetsfunktionen från uppgift 2 (tips: plot(...., type = "h") # 4. I stolpdiagrammet från uppgift 3, rita ett lodrätt linje för att visa var väntevärdet ligger. # Välj en annan färg. # 5. Ange R-kod: Kasta tre gånger med en vanlig tärning # 6. Ange P(X=k) för Bin(20, 0.4) med hjälp av en vektor # 7. Verifiera att normeringen i uppgift 6 stämmer # 8. Rita sannolikhetsfunktionen för uppgift 6, markera väntevärdets position (t.ex. som lodrätt linje) # 9. Beräkna med hjälp av fördelningsfunktionen P(2 < X <= 8) för X ~ Bin(20, 0.4) : # 10. En slumpvariabel X är poissonfördelad med väntevärdet 3 per sekund. # Beräkna sannolikheten att det blir fler än 3, men inte fler än 8 händelser inom 4 sekunder # 11. Generera ett stickprov med n = 10000 från en Poisson-fördelning med mu = 12. # Rita ett histogram över fördelningen du fick från stickprovet # lägg till den teoretiska fördelningen till ritningen (t. ex. genom att använda funktionen "lines") # 12. Rita täthetsfunktioner för X ~ Exp(lambda) för lambda = 6, 4 och 2 i en bild, från x=0 till x=2 # (börja med lambda = 6, annars blir y-axeln inte stort nog) # lägg till en rubrik och ange koden för att spara bilden på hårddisken som png file # 13. Rita även fördelningsfunktionerna för uppgift 12. # 14. Använd funktionen "integrate" för att visa att arean under täthetsfunktionen för X ~ Exp(5) är ett. # frivilligt: Visa genom integration att väntevärdet och standardavvikelsen är 1/5 # 15. Lös uppgift 6 a) i tenta 1 med hjälp av R: # 16. Lös uppgift 7 i tenta 1 med hjälp av R genom att ange nedre och övre konfidensgräns # Börja dock med stickprovsvärdena, utan att använda det givna värden för medelvärde och varians! # (använd formelsamlingen: http://matstat.de/Formelsamling_MS0065.pdf ) # OBS!: vid beräkningen av kvantilen: akta på parametern "lower.tail" # 17. Lös uppgift 8 i tenta 1 med hjälp av R genom att ange nedre och övre konfidensgräns # Svara också på deluppgift b) med en kort mening. # (använd formelsamlingen: http://matstat.de/Formelsamling_MS0065.pdf ) # 18. Linjär regression: # följande mätvärden är givna: x = 1:20 y = 1 + 3*x + rnorm(20, mean = 0, sd = 5) # a) Plotta för att kolla om y kan vara en linjär funktion av x! # b) Beräkna en skattning för lutningen och för interceptet # Du kan använda formlerna i formelsamlingen men enklare är det naturligtvis att använda den inbyggda funktionen i R. # Tänk på att skapa en "data.frame" om du använder den inbyggda funktionen. # c) Plotta igen och lägg till regressionslinjen # d) ange 99% konfidensintervaller för lutningen och interceptet # e) extrahera bruset och plotta det över x # 19. Ange båda ensidiga 95% konfidensintervaller för väntevärdet i en normalfördelning # för följande mätvärden: # (2.19, 4.75, 3.01, 3.83, 6.29, 2.36, 7.95, 0.22, 4.37, 5.41, 0.93) # OBS!: vid beräkningen av kvantilen: akta på parametern "lower.tail" # a) KI med nedre begränsning: # b) KI med övre begränsning: # c) På vilken sida av medelvärdet ligger konfidensgränserna? # 20. Lös uppgift 7 i tenta 4 med hjälp av R genom att ange nedre och övre konfidensgräns # (använd formelsamlingen: http://matstat.de/Formelsamling_MS0065.pdf ) # OBS!: vid beräkningen av kvantilen: akta på parametern "lower.tail" # a) # b) # 21. Lös del b) och c) för uppgift 7 i tenta 3 med hjälp av R genom att ange nedre och övre konfidensgräns # (använd formelsamlingen: http://matstat.de/Formelsamling_MS0065.pdf ) # OBS!: vid beräkningen av kvantilen: akta på parametern "lower.tail" # a) # b) # 22. Lös uppgift 8 i tenta 3 med hjälp av R # Börja dock med stickprovsvärdena, utan att använda det givna värden för medelvärde och varians! # (18.1, 18.3, 18.5, 18.2, 18.2, 18.0, 18.1, 18.3, 18.4, 18.1) # (använd formelsamlingen: http://matstat.de/Formelsamling_MS0065.pdf ) # OBS!: vid beräkningen av kvantilen: akta på parametern "lower.tail" # formulera ett svar! # 23. T-test # ladda ner pop1.data och pop2.data från www.matstat.de (stickprov från normalfördelade populationer) x = scan(file = "pop1.data") # läs data y = scan(file = "pop2.data") boxplot(x, y, col="green", names = c("x", "y")) # ser inte ut som om det var något sign. skillnad # utför ett T-test för att testa om det finns en signifikant skillnad mellan väntevärdena för x och y # (vi kan inte anta att båda populationer har samma standardavvikelse) # tyda resultatet: finns det en signifikant skillnad mellan väntevärdena för x och Y på 95% signifikansnivå? # gör samma test en gång till, men antar att det är känt att båda populationer har samma standardavvikelse # ytterligare två stickprov från normalfördelade populationer: x = scan(file = "popa.data") # läs data y = scan(file = "popb.data") boxplot(x, y, col="green", names = c("pop1", "pop2")) # ser ut som om det fanns någon sign. skillnad # utför ett T-test för att testa om det finns en signifikant skillnad mellan väntevärdena för x och y # (vi kan inte anta att båda populationer har samma standardavvikelse) # tyda resultatet: finns det en signifikant skillnad mellan väntevärdena för x och Y på 99% signifikansnivå? ## Skicka den här filen till uwe.menzel@slu.se # glöm inte era namn (högst upp!!)