################################################################################ ### DATEN EINLESEN fuel = read.table("cars.txt", header=T) attach(fuel) names(fuel) # [1] "PRICE" "WEIGHT" "CITYMPG" "HWYMPG" "DISP" "COMP" "HP" # [8] "TORQUE" "AUTO" "CYLIN" "COUNTRY" ################################################################################ ### UMRECHNUNG DER DATEN IN EUROPÄISCHE EINHEITEN # Umrechnen von Meilen pro Gallone in Liter pro 100 km # 1 Meile = 1.609344 km # 1 Gallone = 3.785412 Liter HWYLPK = 100/(HWYMPG*1.609344)*3.785412 # Umrechnen von Pfund in kg # 1 Pfund = 0.453592 kg WEIGHT2 = WEIGHT * 0.453592 ################################################################################ ### EIN ERSTES LINEARES MODELL FÜR VERBRAUCH AUF 100 km GEGEN GEWICHT UND PS fit1 = lm(HWYLPK~WEIGHT2+HP) summary(fit1) # Call: # lm(formula = HWYLPK ~ WEIGHT2 + HP) # # Residuals: # Min 1Q Median 3Q Max # -1.70257 -0.43936 0.03178 0.49258 2.15776 # # Coefficients: # Estimate Std. Error t value Pr(>|t|) # (Intercept) 4.2277560 0.3802245 11.12 <2e-16 *** # WEIGHT2 0.0008859 0.0003543 2.50 0.014 * # HP 0.0181969 0.0012873 14.14 <2e-16 *** ################################################################################ ### ERST EINMAL LINEARITÄT DER ZUSAMMENHÄNGE ÜBERPRÜFEN pairs(HWYLPK~WEIGHT2+HP) ## beide Zusammenhänge (HWYLPK,WEIGHT2), (HWYLPK,HP) ## einigermassen linear pairs(HWYLPK~DISP+COMP) ## DISP einigermassen linear, zu COMP vermutlich kaum ## Zusammenhang feststellbar fit2 = lm(HWYLPK~WEIGHT2+HP+DISP+COMP) summary(fit2) # Call: # lm(formula = HWYLPK ~ WEIGHT2 + HP + DISP + COMP) # # Residuals: # Min 1Q Median 3Q Max # -1.8858 -0.4588 0.0539 0.4691 2.1249 # # Coefficients: # Estimate Std. Error t value Pr(>|t|) # (Intercept) 3.8485245 1.2183845 3.159 0.002085 ** # WEIGHT2 0.0014653 0.0004161 3.522 0.000643 *** # HP 0.0204308 0.0016461 12.411 < 2e-16 *** # DISP -0.0002952 0.0001167 -2.530 0.012941 * # COMP 0.0041175 0.1324585 0.031 0.975262 fit3 = lm(HWYLPK~COMP) summary(fit3) # Call: # lm(formula = HWYLPK ~ COMP) # # Residuals: # Min 1Q Median 3Q Max # -3.1655 -1.0623 -0.1402 0.7169 7.5245 # # Coefficients: # Estimate Std. Error t value Pr(>|t|) # (Intercept) -3.5420 2.4712 -1.433 0.155 # COMP 1.2819 0.2591 4.948 2.87e-06 *** pairs(HWYLPK~TORQUE+CYLIN) ## Zusammenhänge jeweils einigermassen linear pairs(HWYLPK~AUTO+COUNTRY) ## Linearität spielt hier keine Rolle! ## NOMINALE MERKMALE!!! ################################################################################ ### NUN SUCHE NACH EINEM GUTEN MODELL fit4 = lm(HWYLPK~WEIGHT2+HP+DISP+COMP+TORQUE+CYLIN+AUTO) summary(fit4) ### AUTO raus fit5 = lm(HWYLPK~WEIGHT2+HP+DISP+COMP+TORQUE+CYLIN) summary(fit5) ### DISP raus fit6 = lm(HWYLPK~WEIGHT2+HP+COMP+TORQUE+CYLIN) summary(fit6) ### COMP raus fit7 = lm(HWYLPK~WEIGHT2+HP+TORQUE+CYLIN) summary(fit7) ### schönes Modell ### jetzt zusätzlich noch Herkunftsland mit einbeziehen ### ACHTUNG: NOMINALES MERKMAL!!! fit8 = lm(HWYLPK~WEIGHT2+HP+TORQUE+CYLIN+factor(COUNTRY)) summary(fit8) # Call: # lm(formula = HWYLPK ~ WEIGHT2 + HP + TORQUE + CYLIN + factor(COUNTRY)) # # Residuals: # Min 1Q Median 3Q Max # -1.39638 -0.45648 0.01308 0.43335 1.71978 # # Coefficients: # Estimate Std. Error t value Pr(>|t|) # (Intercept) 3.3153187 0.3975807 8.339 5.09e-13 *** # WEIGHT2 0.0015540 0.0003999 3.886 0.000187 *** # HP 0.0164540 0.0032896 5.002 2.53e-06 *** # TORQUE -0.0072671 0.0037876 -1.919 0.057966 . # CYLIN 0.3138251 0.1051835 2.984 0.003604 ** # factor(COUNTRY)2 -0.4786688 0.1872247 -2.557 0.012119 * # factor(COUNTRY)3 0.4056115 0.3035109 1.336 0.184545 # factor(COUNTRY)4 0.4492040 0.2791960 1.609 0.110884 # factor(COUNTRY)5 0.1395721 0.4484689 0.311 0.756302 # factor(COUNTRY)6 0.1719383 0.2255281 0.762 0.447683 ################################################################################ ### RESIDUENANALYSE plot(fit8$residuals~WEIGHT2) plot(fit8$residuals~HP) plot(fit8$residuals~TORQUE) plot(fit8$residuals~CYLIN) ### es sind jeweils keine Strukturen erkennbar sum(fit8$residuals) ### zur Kontrolle: Summe der Residuen ergibt 0 ################################################################################ ### VORHERSAGE predict.lm(fit8,data.frame(WEIGHT2=1000,HP=100,TORQUE=100,CYLIN=6,COUNTRY=2)) ### 1 ### 7.192306 ### also ca. 7.2 l/100km für ein Auto mit 1000kg, 100PS, ### Drehmoment 100Nm, 6 Zylinder-Motor, Herstellungsland USA ### zum Überprüfen selber nachrechnen: 3.3153187+1000*0.0015540+100*0.0164540+100*(-0.0072671)+6*0.3138251-0.4786688 ### [1] 7.19229 ################################################################################