HINWEIS: Die IDRE Statistische Beratungsgruppe wird die Website im Februar auf das WordPress CMS migrieren, um die Wartung und Erstellung neuer Inhalte zu erleichtern. Einige unserer älteren Seiten werden entfernt oder archiviert, so dass sie nicht länger erhalten bleiben. Wir werden versuchen, die Weiterleitungen so zu halten, dass die alten URLs weiterhin so gut funktionieren, wie wir können. Willkommen beim Institut für digitale Forschung und Bildung Hilfe der Stat Consulting Group durch ein Geschenk Stata Annotated Output Regressionsanalyse Diese Seite zeigt eine Beispiel-Regressionsanalyse mit Fußnoten, die die Ausgabe erklären. Diese Daten wurden auf 200 Schülerinnen und Schülern gesammelt und sind Partituren zu verschiedenen Tests, darunter Wissenschaft, Mathematik, Lesen und Sozialwissenschaften (socst). Die Variable weiblich ist eine dichotome Variable codiert 1, wenn der Schüler war weiblich und 0 wenn männlich. Anova Tisch a. Quelle - Betrachtet man den Abbau der Varianz in der Ergebnisvariable, das sind die Kategorien, die wir untersuchen werden: Modell, Residual und Total. Die Gesamtvarianz ist in die Varianz partitioniert, die durch die unabhängigen Variablen (Modell) und die Varianz erklärt werden kann, die nicht durch die unabhängigen Variablen (Residual, manchmal auch Error) erklärt wird. B. SS - Dies sind die Summe der Quadrate, die mit den drei Variantenquellen, Total, Model und Residual verbunden sind. C. Df - Das sind die Freiheitsgrade, die mit den Quellen der Abweichung verbunden sind. Die Gesamtvarianz hat N-1 Freiheitsgrade. Die Modellfreiheitsgrade entsprechen der Anzahl der geschätzten Koeffizienten minus 1. Inklusive des Abschnitts gibt es 5 Koeffizienten, so dass das Modell 5-14 Freiheitsgrade hat. Die restlichen Freiheitsgrade sind die DF-Summe minus dem DF-Modell, 199 - 4 195. d. MS - das sind die mittleren Quadrate, die Summe der Quadrate, dividiert durch ihre jeweilige DF. Gesamtmodell Fit e. Anzahl der obs - Dies ist die Anzahl der Beobachtungen, die in der Regressionsanalyse verwendet werden. F. F (4, 195) - Dies ist die F-Statistik ist das Mean Square Model (2385.93019) geteilt durch den Mean Square Residual (51.0963039), was F46.69 ergibt. Die Zahlen in Klammern sind das Modell und Residual Freiheitsgrade sind aus der ANOVA Tabelle oben. G. Prob gt F - Dies ist der p-Wert, der mit der obigen F-Statistik verbunden ist. Es wird beim Testen der Nullhypothese verwendet, dass alle Modellkoeffizienten 0. h sind. R-squared - R-Squared ist der Anteil der Varianz in der abhängigen Variablen (Wissenschaft), die durch die unabhängigen Variablen (Mathematik, weiblich, socst und read) erklärt werden kann. Dies ist ein Gesamtmaß für die Stärke der Assoziation und spiegelt nicht das Ausmaß, in dem eine bestimmte unabhängige Variable mit der abhängigen Variablen assoziiert ist. ich. Adj R-squared - Dies ist eine Anpassung der R-squared, die die Hinzufügung von Fremdprädiktoren zum Modell bestraft. Adjusted R-squared wird unter Verwendung der Formel 1 - ((1 - Rsq) ((N - 1) (N - k - 1)) berechnet, wobei k die Anzahl der Prädiktoren ist. J. Root MSE - Root MSE ist die Standardabweichung Des Fehlerbegriffs und ist die Quadratwurzel des Mean Square Residual (oder Error) Parameter Schätzungen k. Wissenschaft - Diese Spalte zeigt die abhängige Variable an der Spitze (Wissenschaft) mit den darunter liegenden Prädiktorvariablen (Mathematik, weiblich Es gibt die Werte für die Regressionsgleichung zur Vorhersage der abhängigen Variablen aus der unabhängigen Variablen Die Regressionsgleichung wird auf vielfältige Weise dargestellt , Zum Beispiel: Ypredicted b0 b1x1 b2x2 b3x3 b4x4 Die Spalte der Schätzungen liefert die Werte für b0, b1, b2, b3 und b4 für diese Gleichung. Mathematik - Der Koeffizient ist .3893102. Also für jede Einheitszunahme in Mathematik a .3893102 Einheitssteigerung in der Wissenschaft wird vorhergesagt, alle anderen Variablen konstant gehalten. Weiblich - Für jede Einheitszunahme in weiblich. Wir erwarten eine 2.009765 Einheit Abnahme in der Wissenschaft Punktzahl, halten alle anderen Variablen konstant. Da weiblich codiert ist, ist die Interpretation einfacher: Für Frauen ist die vorhergesagte Science-Score 2 Punkte niedriger als bei Männern. Socst - Der Koeffizient für socst ist .0498443. Also für jede Einheitssteigerung in der Gesellschaft. Wir erwarten eine etwa 0,08-Punkte-Zunahme der wissenschaftlichen Punktzahl und halten alle anderen Variablen konstant. Lesen - Der Koeffizient für das Lesen ist .3352998. Also für jede Einheit erhöhen in lesen. Wir erwarten, dass ein .34 Punkt Anstieg der Wissenschaft Punktzahl. M. Std. Err. - Dies sind die Standardfehler, die mit den Koeffizienten verbunden sind. N. T - Dies sind die t-Statistiken, die beim Testen verwendet werden, ob ein gegebener Koeffizient signifikant von Null verschieden ist. O. Pgtt - Diese Spalte zeigt die 2-tailed p-Werte, die beim Testen der Nullhypothese verwendet werden, dass der Koeffizient (Parameter) 0 ist. Mit einem Alpha von 0,05: Der Koeffizient für Mathematik unterscheidet sich deutlich von 0, weil sein p-Wert 0.000 ist, Die kleiner als 0,05 ist. Der Koeffizient für weiblich (-2.01) ist auf dem 0,05-Niveau nicht statisch signifikant, da der p-Wert größer als 0,05 ist. Der Koeffizient für socst (.0498443) unterscheidet sich nicht statistisch signifikant von 0, weil sein p-Wert definitiv größer als 0,05 ist. Der Lesekoeffizient (.3352998) ist statistisch signifikant, weil sein p-Wert von 0,000 kleiner als 0,05 ist. Die Konstante (Nachteile) unterscheidet sich deutlich von 0 auf dem 0,05 Alpha-Niveau. P. 95 Konf. Intervall - das sind die 95 Konfidenzintervalle für die Koeffizienten. Die Konfidenzintervalle beziehen sich auf die p-Werte, so dass der Koeffizient bei alpha 00 nicht statistisch signifikant ist, wenn das 95-Konfidenzintervall Null enthält. Diese Konfidenzintervalle können Ihnen helfen, die Schätzung aus dem Koeffizienten in die Perspektive zu bringen, indem sie sehen, wie viel der Wert variieren könnte. Der Inhalt dieser Website sollte nicht als eine Bestätigung einer bestimmten Website, Buch oder Software-Produkt von der University of California ausgelegt werden. NOTICE: Die IDRE Statistische Beratungsgruppe wird die Website migrieren die Website auf die WordPress CMS im Februar zu erleichtern Wartung und Erstellung neuer Inhalte. Einige unserer älteren Seiten werden entfernt oder archiviert, so dass sie nicht länger erhalten bleiben. Wir werden versuchen, die Weiterleitungen so zu halten, dass die alten URLs weiterhin so gut funktionieren, wie wir können. Willkommen beim Institut für Digitale Forschung und Bildung Helfen Sie der Stat Consulting Group, indem Sie ein Geschenk eingeben Stata FAQ Wie kann ich auf Informationen zugreifen, die gespeichert werden, nachdem ich einen Befehl in Stata ausgeführt habe (zurückgegebene Ergebnisse) Zusätzlich zu der Ausgabe im dargestellten Ergebnisfenster, Viele von Statas-Befehlen speichern Informationen über den Befehl und seine Ergebnisse im Speicher. Dies ermöglicht dem Benutzer, sowie andere Stata-Befehle, diese Informationen einfach zu nutzen. Stata ruft diese zurückgegebenen Ergebnisse auf. Zurückgegebene Ergebnisse können sehr nützlich sein, wenn Sie Informationen verwenden möchten, die von einem Stata-Befehl erzeugt werden, um etwas anderes in Stata zu tun. Zum Beispiel, wenn Sie möchten, dass Zentrum eine Variable, können Sie zusammenfassen, um den Mittelwert zu berechnen, dann verwenden Sie den Wert des Mittels berechnet durch zusammenfassen, um die Variable zu zentrieren. Die Verwendung der zurückgegebenen Ergebnisse beseitigt die Notwendigkeit, den Wert des Mittelwerts neu zu schreiben oder zu schneiden und einzufügen. Ein weiteres Beispiel dafür, wie zurückgegebene Ergebnisse nützlich sein können, ist, wenn Sie vorhergesagte Werte der Ergebnisvariablen generieren möchten, wenn die Prädiktorvariablen sich auf einen bestimmten Satz von Werten befinden, können Sie hier wieder die Koeffizienten eingeben oder die Schnitt - und Einfügen verwenden, aber die Ergebnisse zurückgeben Machen die Aufgabe viel einfacher. Der beste Weg, um ein Gefühl, wie zurückgegeben Ergebnisse Arbeit ist, um direkt zu springen und beginnen zu betrachten und mit ihnen. Der untenstehende Code öffnet einen Beispiel-Dataset und verwendet zusammenfassen (abgekürzte Summe), um beschreibende Statistiken für die Variable zu erzeugen. Dies erzeugt die erwartete Ausgabe, aber vor allem für unsere Zwecke, Stata hat nun Ergebnisse aus dem zusammengefassten Befehl im Speicher gespeichert. Aber wie wissen Sie, welche Informationen gespeichert wurden Eine Auflistung der Informationen, die von jedem Befehl gespeichert werden, ist in der Hilfedatei und dem gedruckten Handbuch enthalten, also könnte ich dort hinschauen, aber ich kann auch nur die Rücksendeliste eingeben. Die alle zurückgegebenen Ergebnisse im Speicher auflisten wird. Oben ist eine Liste der zurückgegebenen Ergebnisse, wie Sie sehen können, jedes Ergebnis ist von der Form r (.), Wo die Ellipsen (quot. Quot) ein kurzes Label ist. Wir konnten die Hilfedatei für den Zusammenfassungsbefehl sehen, um herauszufinden, was jedes Element auf der Liste ist, aber es ist oft einfach, herauszufinden, welcher Wert dem Ergebnis zugeordnet ist, z. B. r (Mittelwert). Nicht überraschend den Mittelwert des Lesens enthält (man kann das gegen die Ausgabe überprüfen), aber andere sind nicht so offensichtlich, zB r (sumw). Für diese, müssen Sie möglicherweise das Handbuch zu konsultieren, wenn Sie denken, Sie könnten sie verwenden möchten. Die meiste Zeit wird der Prozess relativ einfach sein, weil du weißt, welches Ergebnis du dir zugreifen möchtest, du wirst die Liste anschauen, um herauszufinden, welchen Namen es sich befindet, anstatt die Liste zu betrachten und zu versuchen, herauszufinden, was jeder ist Artikel ist. Wie Sie sich vorstellen können, speichern verschiedene Befehle und sogar der gleiche Befehl mit verschiedenen Optionen unterschiedliche Ergebnisse. Im Folgenden fassen wir die Variable wieder ein, aber fügen Sie die Detailoption hinzu. Dann verwenden wir die Rücksendeliste, um die Liste der zurückgegebenen Ergebnisse zu erhalten. So wie die Detailoption zusätzliche Informationen zur Ausgabe hinzufügt, führt dies auch zu zusätzlichen Informationen, die in den zurückgegebenen Ergebnissen gespeichert sind. Die neue Liste enthält alle Informationen, die durch den Summenbefehl oben, plus Schiefe Kurtosis und eine Anzahl von Perzentilen, einschließlich der 1. (r (p25)) und 3. (r (p75)) Quartile und der Median (r (p50) ). Nun, da wir einen Sinn haben, welche Ergebnisse vom Befehl summarize zurückgegeben werden, können wir die zurückgegebenen Ergebnisse nutzen. Nachfolgend mit einem der oben genannten Beispiele werden wir das Zentrum der Variablen lesen. Unter der Annahme, dass der letzte Befehl, den wir liefen, der oben beschriebene Befehl war, erzeugt der nachfolgende Code eine neue Variable, die die mittleren zentrierten Werte des Lesens enthält. Beachten Sie, dass statt der Verwendung des Istwertes des Mittelwerts in diesem Befehl den Namen des zurückgegebenen Ergebnisses verwendet hat (dh r (Mittelwert)), weiß Stata, wann er r (Mittelwert) sieht, dass wir eigentlich den Wert, der gespeichert ist, Diese Systemvariable In der nächsten Zeile fassen wir die neue Variable Cread zusammen. Während der Mittelwert nicht genau gleich Null ist, ist er innerhalb des Rundungsfehlers von null, also wissen wir, dass wir richtig mittlere zentriert die Variable gelesen haben. Wie der oben genannte Code vorschlägt, können wir die zurückgegebenen Ergebnisse so ziemlich verwenden, wie wir eine tatsächliche Nummer verwenden würden. Dies ist, weil Stata die r (.) Als Platzhalter für einen realen Wert verwendet. Für ein anderes Beispiel von diesem, sagen wir, dass wir die Varianz des Lesens von seiner Standardabweichung berechnen wollen (ignorieren die Tatsache, dass zusammenfassen, gibt die Varianz in r (Var) zurück). Wir können dies im laufenden Betrieb mit dem Display-Befehl als Taschenrechner machen. Die zweite Zeile des Codes unten tut dies. Wir können das Ergebnis sogar durch Ausschneiden und Einfügen des Wertes der Standardabweichung vom Ausgang überprüfen, was im dritten Befehl unten erfolgt. Die Ergebnisse sind grundsätzlich gleich, die sehr geringe Differenz ist Rundungsfehler, da die gespeicherte Schätzung r (sd) mehr Ziffern der Genauigkeit enthält als der Wert der im Ausgang angezeigten Standardabweichung. Typen von zurückgegebenen Ergebnissen, R-Klasse und E-Klasse Nun, da Sie ein wenig über die zurückgegebenen Ergebnisse wissen und wie sie arbeiten, sind Sie bereit für ein wenig mehr Informationen über sie. Die zurückgegebenen Ergebnisse kommen in zwei Haupttypen, r-class und e-class (es gibt auch s-class und c-class resultsvariables, aber wir werden hier nicht diskutieren). Befehle, die eine Schätzung durchführen, z. B. Regressionen aller Typen, Faktorenanalyse und Anova sind e-Klasse-Befehle. Andere Befehle, zum Beispiel zusammenfassen, korrelieren und nachschätzen Befehle, sind R-Klasse Befehle. Die Unterscheidung zwischen r-Klasse und e-Klasse Befehle ist wichtig, weil Stata speichert Ergebnisse von e-Klasse und r-Klasse Befehle in verschiedenen quotplaces. quot Dies hat zwei Verzweigungen für Sie als Benutzer. Zuerst müssen Sie wissen, ob die Ergebnisse in r () oder e () gespeichert sind (sowie den Namen des Ergebnisses), um sie zu nutzen. Wenn Sie nicht sicher sind, welche Klasse ein Befehl youve run ist, können Sie entweder in der Hilfedatei nachschlagen oder quadratisch an einem Ort (mit dem entsprechenden Befehl, um Ergebnisse aufzulisten), wenn die Ergebnisse dort nicht gespeichert sind, sind sie wahrscheinlich in das andere. Eine potenziell wichtigere Verzweigung der Differenz, wie die Ergebnisse von R-Klasse und e-Klasse Befehle zurückgegeben werden, ist, dass zurückgegebene Ergebnisse im Speicher nur gehalten werden, bis ein anderer Befehl der gleichen Klasse ausgeführt wird. Das heißt, die zurückgegebenen Ergebnisse der vorherigen Befehle werden durch nachfolgende Befehle derselben Klasse ersetzt. Im Gegensatz dazu wird das Ausführen eines Befehls einer anderen Klasse keine Auswirkungen auf die zurückgegebenen Ergebnisse. Zum Beispiel, wenn ich eine Regression ausführe und dann eine zweite Regression, werden die Ergebnisse der ersten Regression (gespeichert in e ()) durch die für die zweite Regression (auch in e () gespeichert) ersetzt. Wenn jedoch statt einer zweiten Regression ich einen Nachschätzungsbefehl durchlaufen hätte, würden die Ergebnisse aus der Regression in e () bleiben, während die Ergebnisse aus dem Nachschätzungsbefehl in r () platziert würden. Während es zwischen den beiden unterscheidet, ist die tatsächliche Verwendung von Ergebnissen aus r-Klasse und e-Klasse Befehle sehr ähnlich. Für die Starter sind die Befehle parallel, um die im Speicher gespeicherten Ergebnisse der R-Klasse aufzulisten. Der Befehl ist die Rücksendeliste. Um das gleiche für e-Klasse Ergebnisse der Befehl ereturn Liste zu tun. Mit Ausnahme des Unterschieds in den Namenskonventionen (r () vs. e ()) wird auf die gleiche Weise auf die Ergebnisse zugegriffen. Das Beispiel unten zeigt dies, zuerst regressieren wir schreiben auf weiblich und lesen. Und dann die Eröffnungsliste verwenden, um die zurückgegebenen Ergebnisse zu betrachten. Die Liste der zurückgegebenen Ergebnisse für den Regress umfasst mehrere Arten von zurückgegebenen Ergebnissen, die unter den Überschriften Skalaren, Makros, Matrizen und Funktionen aufgelistet sind. Wir werden die Art der zurückgegebenen Ergebnisse unten diskutieren, aber jetzt werden wir zeigen, wie Sie die Skalar zurückgegeben Ergebnisse Ergebnisse auf die gleiche Weise, dass wir die zurückgegebenen Ergebnisse aus zusammengefasst verwenden. Zum Beispiel ist eine Möglichkeit, die Varianz der Fehler nach einer Regression zu berechnen, die verbleibende Summe der Quadrate durch die Gesamtfreiheitsgrade (d. h. n-1) zu teilen. Die verbleibende Summe der Quadrate wird in e (rss) gespeichert und das n für die Analyse wird in e (N) gespeichert. Im Folgenden verwenden wir den Anzeigebefehl als Taschenrechner, zusammen mit den zurückgegebenen Ergebnissen, um die Varianz der Fehler zu berechnen. Wie die Ergebnisse zurückgegeben werden: Skalare, Strings, Matrizen und Funktionen Wie oben erwähnt, gibt es für beide R-Klasse - und E-Class-Befehle mehrere Arten von zurückgegebenen Ergebnissen, einschließlich Skalaren, Strings, Matrizen und Funktionen. In den Listen der zurückgegebenen Ergebnisse wird jeder Typ unter seiner eigenen Überschrift aufgelistet. Die Ergebnisse unter der Überschrift quotscalarsquot sind genau das, ein einzelner numerischer Wert. Ihr Gebrauch wird oben besprochen, also sagen wir nicht mehr über sie in diesem Abschnitt. Zurückgegebene Ergebnisse, die unter quotmacrosquot aufgeführt werden, sind in der Regel Zeichenfolgen, die Informationen über den Befehl geben, der ausgeführt wurde. Beispielsweise enthält e (cmdline) in den zurückgegebenen Ergebnissen der oben gezeigten Regression den Befehl, den der Benutzer ausgestellt hat (ohne Abkürzungen). Diese werden in der Regel bei der Programmierung von Stata verwendet. Die unter quotmatricesquot aufgeführten Ergebnisse sind, wie man erwarten würde, Matrizen. Während die Liste der Ergebnisse, die von der Rückkehrliste und der erturn-Liste zurückgegeben werden, die von den meisten der zurückgegebenen Ergebnisse übernommenen Werte zeigt, ist dies bei Matrizen nicht praktisch, stattdessen werden die Dimensionen der Matrizen aufgelistet. Um den Inhalt von Matrizen zu sehen, musst du sie mit Matrixbefehlen anzeigen. Wir tun dies unten mit der Matrix der Koeffizienten (e (b)) unter Verwendung der Befehlsmatrixliste e (b). (Beachten Sie, dass es einen anderen Weg gibt, auf Koeffizienten und ihre Standardfehler zuzugreifen, nachdem Sie ein Modell passen, dies wird unten diskutiert.) Wenn wir Matrixoperationen auf zurückgegebenen Matrizen durchführen oder auf einzelne Elemente der Matrix zugreifen möchten, können wir Verschieben Sie die als zurückgegebene Folge gespeicherte Matrix zu einer normalen Stata-Matrix. Dies geschieht in der letzten Zeile der Syntax unten. Schließlich enthalten die Ergebnisse unter der Überschrift quotfunctionsquot Funktionen, die in ähnlicher Weise wie andere Stata-Funktionen verwendet werden können. Die häufigste Funktion, die von Stata-Schätzbefehlen zurückgegeben wird, ist wahrscheinlich e (Sample). Diese Funktion markiert die Stichprobe, die bei der Schätzung der letzten Analyse verwendet wird, dies ist nützlich, da Datensätze oft fehlende Werte enthalten, was dazu führt, dass nicht alle Fälle in dem Datensatz in einer gegebenen Analyse verwendet werden. Unter der Annahme, dass der letzte Schätzbefehlslauf die Regression des Schreibens auf die weibliche und die oben gezeigte Lesung war, verwendet die erste Zeile des Codes unten e (Stichprobe), um den Mittelwert des Lesens unter den im Modell verwendeten Fällen zu finden. Die zweite Codezeile verwendet e (Sample), um eine neue Variable namens Flag zu erstellen, die gleich 1 für Fälle ist, die in der Analyse verwendet wurden, und null sonst. (Hinweis, da das Beispiel-Dataset keine fehlenden Daten enthält, sind alle Fälle in die Analyse einbezogen, und das Flag ist eine Konstante gleich Eins.) Koeffizienten und ihre Standardfehler Wie oben diskutiert, nachdem man ein Modell, Koeffizienten und ihren Standard passt Fehler werden in e () in Matrixform gespeichert. Diese Matrizen erlauben dem Benutzer den Zugriff auf die Koeffizienten, aber Stata gibt Ihnen einen noch einfacheren Weg, um auf diese Informationen zuzugreifen, indem Sie sie in den Systemvariablen b und se speichern. Um auf den Wert eines Regressionskoeffizienten nach einer Regression zuzugreifen, muss man nur den Typ bvarname eingeben, wobei varname der Name der Prädiktorvariable ist, deren Koeffizient Sie untersuchen möchten. Um auf den Standardfehler zuzugreifen, kannst du einfach sevarname eingeben. Um auf den Koeffizienten und den Standardfehler der Konstanten zuzugreifen, verwenden wir bcons und secons. Unten laufen wir das gleiche Regressionsmodell, das wir oben liefen (Auslassen der Ausgabe), mit weiblichen und lesen, um zu schreiben, schreiben. Sobald wir das Modell geschätzt haben, verwenden wir den Display-Befehl, um zu zeigen, dass die Werte in b gleich unseren Regressionskoeffizienten sind. Schließlich berechnen wir den vorhergesagten Wert des Schreibens, wenn ein weiblicher (weiblicher 1) Schüler eine Lesebewertung von 52 hat. Der Inhalt dieser Website sollte nicht als eine Bestätigung einer bestimmten Website, eines Buches oder eines Softwareprodukts von der Universität von Kalifornien.
Comments
Post a Comment