Log Transformation Von Daten In Stata Forex
Für schnelle Fragen email dataprinceton. edu. Keine appts. Notwendig während der begehbaren Stunden. Hinweis: Das DSS-Labor ist geöffnet, solange Firestone geöffnet ist, keine Termine erforderlich, um die Labor-Computer für Ihre eigene Analyse zu verwenden. Protokolltransformationen Wenn die Verteilung einer Variablen einen positiven Schiefeffekt aufweist, hilft ein natürlicher Logarithmus der Variablen manchmal, die Variable in ein Modell zu integrieren. Log-Transformationen machen eine positiv geneigte Verteilung normaler. Wenn eine Änderung der abhängigen Variablen mit einer prozentualen Änderung in einer unabhängigen Variablen oder umgekehrt zusammenhängt, wird die Beziehung besser modelliert, indem das natürliche Protokoll von einer oder beiden Variablen genommen wird. Zum Beispiel schätze ich, dass Personen auf Grund von Bildung, Erfahrung und Region des Wohnsitzes anhand von Statas-Stichprobendaten nlsw88, einem Auszug aus 1988 National Logitudinal Study of Young Women, schätzen. Es sieht ok aus, aber wenn ich mir die Verteilung des Besitzes anschaue, sieht es etwas schief aus. So berechne ich ein natürliches Protokoll der Amtszeit. Es scheint ein wenig übersprungen zu sein, sieht aber etwas normal aus. Ich versuche eine Regression mit dem angemeldeten tenure. Der R-squared hat ein wenig höher, so dass die natürlichen Logarithmus zu haben scheint geholfen, um es das Modell besser passen. Wenn die unabhängige Variable, aber nicht die abhängige Variable protokolliert wird, wird eine prozentuale Änderung der unabhängigen Variablen dem 1100-fachen der Koeffizientenänderung in der abhängigen Variablen zugeordnet. Vorhergesagter Lohn -1.6390.681GRADE0.774LNTENURE-1.134SOUTH So ein Prozent Zunahme der Amtszeit ist mit einem Anstieg des Lohnes von 0,01 x 0,774 oder etwa 0,0077 verbunden. Jetzt untersuche ich den Lohn und finde, daß er sehr schief ist. So nehme ich ein natürliches Protokoll des Lohnes, und betrachten Sie die Verteilung der eingelösten Lohn. Die Verteilung sieht viel normaler aus. Nun führe ich die gleiche Regression mit dem geloggen Lohn als abhängige Variable. Wenn die abhängige Variable, aber keine unabhängige Variable protokolliert wird, wird eine einheitliche Änderung in der unabhängigen Variablen mit einem 100-fachen der Koeffizientenprozentänderung in der abhängigen Variablen assoziiert. In diesen Daten, tenure ist in Jahren gemessen: so, erhöht ein Jahr Erhöhung der Besitz erhöht den Lohn um 100x0.026 oder etwa 2,6. Wenn wir sowohl die abhängigen als auch die unabhängigen Variablen loggen, dann suchen wir die Elastizität: Prozentuale Veränderung in X ergibt eine prozentuale Veränderung in Y. vorhergesagte lnwage 0.659 0.084GRADE0.136LNTENURE-0.151SOUTH Ein Prozent Anstieg der Tenure wird geschätzt, um etwa zu ergeben 0.136 Erhöhung des Lohnes. Kopie 2007 Die Truestees der Princeton Universität. Alle Rechte vorbehalten. Dataprinceton. edu Diese Seite wurde zuletzt am 28. August 20082.10 aktualisiert. Transformation der Daten Wir betrachten nun, was zu tun ist, wenn die im vorherigen Abschnitt erläuterte Regressionsdiagnose anzeigt, dass das Modell nicht ausreichend ist. Die üblichen Lösungen umfassen die Transformation der Antwort, die Transformation der Prädiktoren oder beides. 2.10.1 Umwandlung der Antwort Die Antwort wird oftmals umgesetzt, um Linearität und Homosedastizität oder konstante Varianz zu erreichen. Beispiele für Varianzstabilisierungstransformationen sind die Quadratwurzel, die dazu neigt, gut für die Zählungen zu arbeiten, und die Bogen-Sinus-Transformation, die oft geeignet ist, wenn die Antwort ein Verhältnis ist. Diese beiden Lösungen sind aus der Mode gefallen, da generalisierte lineare Modelle, die speziell entwickelt wurden, um mit Zählungen und Proportionen umzugehen, in der Popularität zunehmen. Meine Empfehlung in diesen beiden Fällen ist es, das lineare Modell zugunsten der besseren Alternativen wie Poisson-Regression und logistische Regression aufzugeben. Transformationen zur Erzielung von Linearität oder linearisierende Transformationen sind noch nützlich. Der populärste von ihnen ist der Logarithmus, der besonders nützlich ist, wenn man erwartet, dass die Effekte proportional zur Reaktion sind. Zur Lösung von Vorstellungen wird ein Modell mit einem einzigen Prädiktor (x) betrachtet, und es wird angenommen, daß die Antwort (100rho) Prozent für jeden Punkt der Zunahme in (x) ansteigt. Es sei ferner angenommen, daß der mit (U) bezeichnete Fehlerterm multiplikativ ist. Das Modell kann dann als Y gamma (1rho) x U geschrieben werden. Auf beiden Seiten der Gleichung wird ein lineares Modell für das transformierte Antwortprotokoll Y alpha beta x epsilon, wobei die Konstante (alpha loggamma) ist, erhalten Steigung (betalog (1rho)) und der Fehlerterm (epsilonlog U). Die übliche Annahme normaler Fehler ist äquivalent zu der Annahme, daß (U) eine log-Normalverteilung hat. In diesem Beispiel hat das Protokollieren ein relativ kompliziertes multiplikatives Modell in eine vertraute lineare Form umgewandelt. Diese Entwicklung zeigt übrigens, wie die Steilheit in einem linearen Regressionsmodell interpretiert werden kann, wenn die Antwort in der logarithmischen Skala liegt. Für (rho) in Betracht von (Beta) zu sehen, sehen wir, dass eine Einheitszunahme in (x) mit einer Zunahme von (100 (ebeta-1)) Prozent in (y) einhergeht. Ist (beta) klein, (ebeta-1 ca. beta), so kann der Koeffizient direkt als relativer Effekt interpretiert werden. Für (Beta-Kopie 2017 Germaacuten Rodriacuteguez, Princeton University
Comments
Post a Comment