Zitat:
Die multiple Regressionsanalyse ist das flexibelste und in der Praxis sowohl in der Markt- als auch in der Sozialforschung am häufigsten eingesetzte multivariate Analyseverfahren. Sie dient der Untersuchung der Beziehung zwischen einer abhängigen und einer oder mehrerer unabhängigen Variablen. Die Regressionsanalyse kann unter anderem in der Ursachenanalyse (Darstellung und Quantifizierung von Wirkungszusammenhängen) und in der Prognostik (Prognose der Werte der abhängigen Variablen) zum Einsatz kommen.
Ein einfaches Beispiel: Wie verändert sich die Absatzmenge eines Konsumguts (abhängige Variable) bei Veränderungen am Produktpreis, an den Werbeausgaben oder der Anzahl der Vertreterbesuche pro potentiellem Kunden (unabhängige Variablen)? Sind lineare Zusammenhänge zu vermuten, dann ist eine multiple Regressionsanalyse hier das Idealverfahren zur Untersuchung des Sachverhalts.
Ein Ergebnis einer Regressionsanalyse ist stets die Regressionsfunktion:
Y = f(x) >> einfache Regression (eine abhängige und eine unabhängige Variable)
Y = f(x1, x2, x3, .... xn) >> multiple Regression (eine abhängige und mehrere unabhängige Variablen)
Da der Informationswert eines multiplen Regressionsmodells sehr hoch ist, bringt die Regressionsanalyse unter allen den multivariaten Analyseverfahren die meisten und detailliertesten Voraussetzungen mit sich. Nur selten lassen sich diese in der Praxis vollständig erfüllen und häufig liegt es in der Verantwortung des Marktforschers, auf der Basis seiner Erfahrungen und seiner Methodenkenntnisse eine Entscheidung über Abbruch oder Fortsetzung des Verfahrens zu treffen.
Einen besonderen Problemfall stellen die sogenannten interdependenten Beziehungen dar. So ist beispielsweise bei einer Untersuchung von Bekanntheitsgrad und Absatzmenge eines Produkts nicht unbedingt klar, ob der Bekanntheitsgrad die Absatzmenge beeinflusst (bekannte Produkte werden häufiger gekauft) oder umgekehrt (Produkte, die zu großen Stückzahlen im Umlauf sind, sind auch bekannter). Solche interdependenten Systeme lassen sich nicht in einer einzigen Regressionsfunktion erfassen, sondern nur in Mehrgleichungsmodellen.
Okay, einwenig viel Text, aber um es simpel auszudrücken: Ich möchte den KALORIENVERBRAUCH (zu erklärende Variable, also das Y) versuchen mit Hilfe von anderen unabhängigigen Variablen wie Schlafdauer, Schrittzahl, Aktivitätslevel und ggf. auch mit Hilfe einiger Dummy-Variablen zu schätzen.