################################################################################ ### FORTSETZUNG VON LineareModelleR.txt fit8 = lm(HWYLPK~WEIGHT2+HP+TORQUE+CYLIN+factor(COUNTRY)) summary(fit8) ### ### Adjusted R-squared: 0.8735 ### nun COUNTRY-Codierung ändern: nur Unterschied zwischen USA und "sonst" USA = (COUNTRY==2) USA fit9 = lm(HWYLPK~WEIGHT2+HP+TORQUE+CYLIN+USA) summary(fit9) ### ### Adjusted R-squared: 0.8732 ### etwas kleiner, aber alle Kovariablen signifikant ################################################################################ ### TESTHALBER EIN PAAR TRANSFORMATIONEN LWEIGHT2 = log(WEIGHT2) ### Gewicht logarithmieren fit10 = lm(HWYLPK~LWEIGHT2+HP+TORQUE+CYLIN+USA) summary(fit10) ### ### Adjusted R-squared: 0.8815 LHP = log(HP) ### zusätzlich Leistung (PS) logarithmieren fit11 = lm(HWYLPK~LWEIGHT2+LHP+TORQUE+CYLIN+USA) summary(fit11) ### ### Adjusted R-squared: 0.8602 ### also schlechter als fit10!!! WWEIGHT2 = WEIGHT2^2 ### Gewicht quadrieren statt logarithmieren fit12 = lm(HWYLPK~WWEIGHT2+HP+TORQUE+CYLIN+USA) summary(fit12) ### ### Adjusted R-squared: 0.8650 ### auch nicht so gut wie fit10 ################################################################################ ### AUSPROBIEREN: INTERAKTIONSEFFEKTE (ACHTUNG: VIELE MÖGLICHKEITEN!) ### logarithmiertes Gewicht * Leistung in PS fit13 = lm(HWYLPK~LWEIGHT2+HP+TORQUE+CYLIN+USA+LWEIGHT2*HP) summary(fit13) ### ### Adjusted R-squared: 0.8856 ### also Verbesserung gegenüber fit10 ### andere Variante: USA (Herkunftsland) * Leistung in PS fit14 = lm(HWYLPK~LWEIGHT2+HP+TORQUE+CYLIN+USA+USA*HP) summary(fit14) ### ### TORQUE nicht mehr signifikant -> raus fit15 = lm(HWYLPK~LWEIGHT2+HP+CYLIN+USA+USA*HP) summary(fit15) ### ### Adjusted R-squared: 0.9079 ### der beste Wert bisher!!! ### Nun wieder eine andere Variante: AUTO doch mit ins Modell ### zusätzlich die Interaktion AUTO * HP fit16 = lm(HWYLPK~LWEIGHT2+HP+CYLIN+USA+AUTO+AUTO*HP) summary(fit16) ### ### AUTO hier signifikant! ### Adjusted R-squared: 0.8943 ### etwas kleiner als bei fit15, das Modell ist aber ### sehr gut interpretierbar! ### z.B. Mehrverbrauch bei Automatik-Getriebe (siehe ### Schätzwert bei AUTO), aber geringere Steigung bzgl. HP ### als bei Schaltgetriebe (vgl. Schätzwert bei HP:AUTO)