Πολλαπλή γραμμική παλινδρόμηση με χρήση excel 2003. Θεωρία και παραδείγματα. Γκούμας Στράτος. Πτυχιούχος Οικονομολόγος. MSc ‘Εφαρμοσμένη Οικονομική και Χρηματοοικονομική (Ε.Κ.Π.Α./ Τμήμα Οικονομικών)’ e-mail: s_4goum@yahoo.com, My Blog 29/1/2011
ΕΙΣΑΓΩΓΗ Τα μαθηματικά είναι επιστημονικός κλάδος όπου οι εφαρμογές τους αποτελούν αναπόσπαστο τμήμα σε πλήθος άλλων επιστημών και αντιμετώπισης ζητημάτων, όπως η έρευνα, η διοίκηση, η οικονομία, η αστρονομία, η φυσική κτλ. Στην εργασία αυτή θα ασχοληθούμε με ένα τμήμα των μαθηματικών όπου αφορά την ποσοτικοποίηση των οικονομικών μεγεθών. Το αντικείμενο αυτό ονομάζεται οικονομετρία και εφαρμόζεται σε πληθώρα οικονομικών ζητημάτων, επιχειρησιακής ερευνάς και διοίκησης. Η οικονομετρία προσπαθεί να δώσει υπόσταση και να αναπτύξει τις σχέσεις της οικονομικής θεωρίας. Η μαθηματική, στατιστική και οικονομική ανάλυση συνδυάζονται με σκοπό την εκτίμηση των οικονομικών σχέσεων. Όπως γνωρίζουμε, όλες οι επιστήμες διέπονται από θεωρίες, ωστόσο μια θεωρία, δεν μπορεί να σταθεί αν δεν υπάρξει η επαλήθευσή της και ο έλεγχος. Σκοποί της οικονομετρίας είναι οι εξής 1 . 1) Εμπειρική επαλήθευση ή έλεγχος μιας θεωρίας. 2) Άσκηση οικονομικής πολίτικης 3) Πρόβλεψη οικονομικών μεγεθών. Τα στάδια της οικονομετρικής αναλύσεως συνοψίζονται κατά σειρά στα εξής: Στάδιο 1- Οικονομική Θεωρία. Στάδιο 2- Οικονομικό υπόδειγμα. Στάδιο 3- Οικονομετρικό υπόδειγμα. Στάδιο 4- Εκτίμηση του υποδείγματος (Δεδομένα και Οικονομετρικές Μέθοδοι). Στάδιο 5- Έλεγχος υποδείγματος. Στάδιο 6- Χρήση υποδείγματος (Προβλέψεις, Οικονομική Πολιτική, Έλεγχος Θεωρίας).
1
Βλ. ‘’Εισαγωγή στην Οικονομετρία’’ Γ.Κ. Χρήστου
1
ΠΕΡΙΛΗΨΗ Στην εργασία αυτή θα μελετήσουμε και θα παρουσιάσουμε την πολλαπλή γραμμική παλινδρόμηση, η οποία αποτελεί μια από της βασικές μεθόδους εκτίμησης στην οικονομετρία. Η πολλαπλή παλινδρόμηση αποτελεί μια σχέση/ εξάρτηση μεταξύ πολλών μεταβλητών. Δεν θα σταθούμε τόσο στην ανάπτυξη της θεωρίας και την θεμελίωση των μαθηματικών τεχνικών όσο στην παρουσίαση της μεθόδου υπολογισμού και εκτίμησης των σχέσεων. Αυτό που θα χρειαστούμε είναι το excel 2003 (ή 2007) και ένα βιβλίο οικονομετρίας στο οποίο θα μπορούμε να ανατρέξουμε για την ορθή τεκμηρίωση των αποτελεσμάτων μας. Έχουμε επιλέξει τρεις χρηματιστηριακούς δείκτες, FTSE-100 (Αγγλία), DowJones (ΗΠΑ) και Xerta-DAX (Γερμανία) και υπολογίσαμε την μέση εβδομαδιαία απόδοση για το διάστημα 1/1/2009 έως 1/12/2010. Θα επιχειρήσουμε να εξετάσουμε την επίδραση στο χρηματιστήριο της Γερμανίας από τα άλλα δυο χρηματιστήρια. Με τη χρήση του excel θα εκτιμήσουμε ένα πολλαπλό γραμμικό υπόδειγμα της μορφής Yt= b0+b1*X1t+b2*X2t+ut. Όπου ΥÆΑπόδοση Γερμανίας, Χ1ÆΑπόδοση Αγγλίας και Χ2ÆΑπόδοση ΗΠΑ. (Σημ: ΥÆεξαρτημένη μεταβλητή. Χ1,Χ2Æανεξάρτητες-ερμηνευτικές μεταβλητές)
ΣΧΟΛΙΑ
Οι λόγοι οι οποίοι επιλέξαμε τις μέσες εβδομαδιαίες αποδόσεις είναι οι εξής: 1) Επειδή τα χρηματιστήρια που επιλέξαμε δεν κλείνουν την ίδια ώρα, θα είχαμε σοβαρό και ουσιαστικό πρόβλημα για τον προσδιορισμό των τιμών και των αποδόσεων. Για να λάβουμε τις ημερήσιες τιμές θα πρέπει να χρηματιστήρια να κλείνουν την ίδια ή περίπου την ίδια ώρα. Στην περίπτωσή μας, οι αγορές που επιλέχθηκαν έχουν μεγάλη διαφορά στην ώρα κλεισίματος, οπότε δεν είναι ούτε εφικτό ούτε ευνόητο να χρησιμοποιήσουμε τις ημερήσιες τιμές κλεισίματος. 2) Στις ημερήσιες χρηματιστηριακές τιμές παρουσιάζεται έντονη διακύμανση, ως εκ τούτου τα γραμμικά μοντέλα δεν είναι κατάλληλα για την εκτίμηση των δεδομένων, διότι δεν έχουν την δυνατότητα να ‘’συλλάβουν’’ αυτή την έντονη μεταβλητότητα. Έχει αποδειχτεί από αναλυτές-ερευνητές ότι τα οικονομετρικά γραμμικά μοντέλα με χρήση ημερήσιων τιμών αποτυγχάνουν τόσο στην εκτίμηση των ερμηνευτικών μεταβλητών όσο και στις προβλέψεις,. Ωστόσο, ένα γραμμικό μοντέλο μπορεί να αποδειχτεί χρήσιμο όταν λαμβάνουμε λιγότερο συχνές παρατηρήσεις (π.χ. 2
εβδομαδιαίες, μηνιαίες), η εκτίμηση του οποίου θα μας εξηγήσει την γενικότερη πορεία της αγοράς. Αντιθέτως, οι ημερήσιες τιμές προσφέρονται για τεχνική ανάλυση (technical analysis), με την οποία έχουμε την δυνατότητα να προβλέψουμε την εξέλιξη ενός δείκτη/ μιας μετοχής για πολύ βραχυχρόνιο και βραχυχρόνιο ορίζοντα. Στις μεθόδους τεχνικής ανάλυσης συγκαταλέγονται τα εξής: 1) Κινητοί Μέσοι Όροι (Moving Average), Τάση (Trend), Ζώνες Bollinger (Bollinger Bands), Ταλαντωτές (Oscillators),
Όγκος Συναλλαγών (Volume),
Δείκτης Σύγκλισης-Απόκλισης
(MACD), Σχηματισμοί (Patterns) κτλ.
ΘΕΩΡΙΑ Αρχικά θα αναφερθούμε στην απλή γραμμική παλινδρόμηση η οποία αποτελεί σχέση μεταξύ δυο μεταβλητών. Σκοπός μας είναι να αναπτύξουμε το βασικό θεωρητικό υπόβαθρο και να παρουσιάσουμε μερικά παράδειγμα με τη χρήση του excel. Για περεταίρω ανάλυση σε θεωρητική βάση, ο αναγνώστης μπορεί να συμβουλευτεί κάποιο βιβλίο οικονομετρίας. 1) Απλή Γραμμική Παλινδρόμηση: Yt=a+b*Xt+ut. XÆ Ανεξάρτητη μεταβλητή, ΥÆΕξαρτημένη μεταβλητή, uÆ Κατάλοιπα (σφάλμα). Παράδειγμα: Έστω ότι θέλουμε να εξετάσουμε την επίδραση του Επιτοκίου (r) στην Προσφορά Χρήματος (Μ). Αφού λάβουμε τις τιμές σχηματίζουμε το υπόδειγμα Mt=a+b*rt+ut. Με κατάλληλες μεθόδους (π.χ. μέθοδο ελάχιστων τετραγώνων OLS) εκτιμούμε τους συντελεστές a,b. Όπως είναι φυσικό τα ζεύγη τιμών (Χ,Υ) δεν θα ταυτίζονται επακριβώς με την γραμμή της παλινδρόμησης (μερικές τιμές θα είναι πάνω στην γραμμή, ενώ μερικές άλλες θα είναι εκτός της γραμμής 2 ), με αποτέλεσμα να υπάρχει πάντοτε σφάλμα (u). 2) Πολλαπλή Γραμμική Παλινδρόμηση:Yt=b0+b1*X1t+b2*X2t+b3*X3t+.+ bn*Xnt+ut. XiÆ Ανεξάρτητες (ερμηνευτικές) μεταβλητές, ΥÆΕξαρτημένη μεταβλητή, uÆ Κατάλοιπα (σφάλμα).
2
Βλέπε παρακάτω, Γράφημα 1
3
Παράδειγμα: Έστω ότι θέλουμε να εκτιμήσουμε την επίδραση στην τιμή (Ρ) ενός προϊόντος από τους Μισθούς (I) και το Κόστος Πρώτων Υλών (C). Αν υποθέσουμε ότι υπάρχει γραμμική σχέση μεταξύ αυτών των μεταβλητών, τo υπόδειγμα θα έχει την εξής μορφή: Ρt= b0+b1*Ιt+b2*Ct +ut. Βασικό συστατικό για να λάβουμε ορθές εκτιμήσεις είναι τα κατάλοιπα να ακολουθούν την κανονική κατανομή, με μέσο μηδέν και σταθερή διακύμανση u~N(0,σ2), να μην συσχετίζονται (δηλαδή το ut να μην εμφανίζει σχέση με το us άρα E(utus)=0 για t≠s) καθώς επίσης να μην υπάρχουν ακριβείς γραμμικές σχέσεις (συγγραμικότητα) μεταξύ των ερμηνευτικών μεταβλητών (Xi). Ωστόσο, επειδή στην πράξη οι υποθέσεις αυτές συμβαίνουν σπάνια, αν τα κατάλοιπα ακολουθούν μια κατανομή που να προσεγγίζει ικανοποιητικά την κανονική κατανομή, υποθέτουμε ότι η κατανομή είναι η κανονική συνεχίζοντας την διαδικασία και
στο τέλος
διορθώνουμε τους συντελεστές μας. Στην περίπτωση που τα κατάλοιπα ακολουθούν μια κατανομή η οποία δεν είναι η κανονική ούτε την προσεγγίζει, τότε καταφεύγουμε σε άλλες τεχνικές ανάλυσης. Όσο αφορά την γραμμική σχέση μεταξύ των ερμηνευτικών μεταβλητών προσπαθούμε να ελέγξουμε για την ύπαρξη έντονης συσχέτισης μεταξύ τους. Η ύπαρξη γραμμικών σχέσεων, θα οδηγήσει σε λανθασμένα αποτελέσματα, συνεπώς οφείλουμε να αναδιαρθρώσουμε το μοντέλο μας.
ΓΡΑΦΙΚΗ ΑΠΕΙΚΟΝΙΣΗ ΑΠΛΗΣ ΠΑΛΙΝΔΡΟΜΗΣΗΣ ME TO EXCEL 2003 3 .
Στο παρακάτω γράφημα (Γράφημα 1) έχουμε απεικονίσει την απλή γραμμική παλινδρόμηση Yt=a+b*Xt+ut. Η κατασκευή του γραφήματος στο excel 2003 έγινε ως εξής Αρχικά εισάγουμε τα δεδομένα μας στο φύλλο excel. Από το ΜενούÆΕισαγωγήÆΓράφημαÆ Διασπορά (ΧΥ) 4 . Στο παράθυρο που εμφανίζεται εισάγουμε τα δεδομένα μας στην ‘’Περιοχή Δεδομένων‘’. Πατώντας ‘’Επόμενο….’’ κατασκευάζουμε το διάγραμμα διασποράς των ζευγών (Χ,Υ). Εν συνεχεία θα προσθέσουμε στο γράφημα την γραμμή παλινδρόμησης. Επιλέγοντας τα σημεία (Χ,Υ) του γραφήματος και με δεξί κλικ εμφανίζεται ένα νέο παράθυρο. Επιλεγούμε το ‘’Προσθήκη Γραμμής Τάσης’’. Στην καρτέλα ‘’Τύπος’’ , 3 4
Βλ. Φύλλο ‘’rates’’ του excel. Επιλεγούμε το πρώτο γράφημα που έχει μόνο τα σημεία
4
επιλεγούμε ‘’Γραμμικός’’ ενώ στην καρτέλα ‘’Επιλογές’’ επιλεγούμε τα ‘’Προβολή εξίσωσης στο γράφημα’’ και ‘’Προβολή τιμής R-τετράγωνο’’ ΓΡΑΦΗΜΑ 1. y = 0,7041x + 0,0003 2 R = 0,8169
0,06 0,04 0,02 Y
0 -0,1
-0,05
-0,02
Σειρά1 0
0,05
0,1
Γραμμική (Σειρά1)
-0,04 -0,06 -0,08 X
Από το γράφημα παρατηρούμε ότι τα πραγματικά δεδομένα δεν ταυτίζονται επακριβώς με την γραμμή παλινδρόμησης, ωστόσο η προσέγγιση επιτυγχάνεται σε ικανοποιητικό βαθμό. Η γραμμή η οποία διέρχεται από τα ζεύγη τιμών (Χ,Υ) ονομάζεται γραμμή παλινδρόμησης (regression line). Το ερώτημα που ανακύπτει είναι αν αυτή η γραμμή είναι η βέλτιστη ή θα μπορούσαν να υπάρξουν και επιπλέον γραμμές οι οποίες θα ερμήνευαν ικανοποιητικά τα δεδομένα μας. Η ιδιότητα η οποία διέπει την απλή γραμμική παλινδρόμηση είναι ότι η τεχνική που συνηθίζεται να χρησιμοποιείται είναι η μέθοδος ελάχιστων τετραγώνων (OLS), η οποία αναπτύχτηκε από τους Gauss-Markov και ελαχιστοποιεί το άθροισμα των τετραγώνων των καταλοίπων (SSE). Ελάχιστο άθροισμα καταλοίπων συνεπάγεται καλύτερη ερμηνευτικότητα στο υπόδειγμα. Συμπεραίνουμε λοιπόν ότι η γραμμική αυτή σχέση, με την μέθοδο OLS, είναι η καλύτερη που θα μπορούσε να εξευρεθεί. Εναλλακτικές μέθοδοι οι οποίες χρησιμοποιήθηκαν μετέπειτα και βασιστήκαν στην OLS είναι η γενικευμένη μέθοδος ελάχιστων τετραγώνων (GLS), η μέθοδος μέγιστης πιθανοφάνειας (Maximum Likelihood), η ραχοειδής παλινδρόμησης (Ridge Regression), η σταθμική μέθοδος ελαχίστων τετραγώνων (Weighted Least Square) κ.α. 5
Τελειώνοντας, να αναφέρουμε ότι εκτός των γραμμικών τεχνικών υπάρχουν βεβαίως και οι μη-γραμμικές τεχνικές, με τις οποίες δεν θα ασχοληθούμε στην παρούσα ενότητα, όπως η μη γραμμική μέθοδος ελαχίστων τετραγώνων, η μαθηματική βελτιστοποίηση, η μη-παραμετρική παλινδρόμηση, ο τετραγωνικός προγραμματισμός κ.α.
ΠΑΛΙΝΔΡΟΜΗΣΗ ΜΕ EXCEL (Για να κατεβάσετε το αρχείο excel πιεστέ εδώ) Στο αρχείο excel έχουμε τρία φύλλα εργασίας. (rates, regression,stats) Η διαδικασία της παλινδρόμησης στο excel 2003 έχει ως εξής (με παρόμοιο τρόπο γίνεται και στο excel 2007)
--------ΣΤΑΔΙΟ Α (Φύλλο excel ‘’rates’’)
1) Εισαγωγή δεδομένων (Φύλλο ‘’rates’’). Στην πρώτη γραμμή έχουμε τις κεφαλίδες των σειρών. 2) Από το μενού ‘’Εργαλεία’’Æ ‘’Πρόσθετα’’ Æ Επιλογή το ‘’Πακέτο Εργαλείων Ανάλυσης’’. Προσθέσαμε ένα νέο πακέτο εργαλείων. 3) Από το μενού ‘’Εργαλεία’’Æ ‘’Ανάλυση Δεδομένων’’ÆΕπιλογή την ‘’Παλινδρόμηση’’. 4) Στο παράθυρο της παλινδρόμησης που εμφανίζεται εισάγουμε τα εξής:
(Προσοχή! Στην πρώτη γραμμή έχουμε τις κεφαλίδες των σειρών) α) Περιοχή Εισόδου ΥÆ Επιλεγούμε την περιοχή κελίων με τα δεδομένα του δείκτης της Γερμανίας (Α1:A99). β) Περιοχή Εισόδου ΧÆ Επιλεγούμε τα δεδομένα των δεικτών της Αγγλίας και των ΗΠΑ (B1:C99). γ) Επιλεγούμε επίσης τα ‘’Ετικέτες’’ και ‘’Βαθμός Εμπιστοσύνης 95%’’. δ) Επιλεγούμε το ‘’Νέο Φύλλο Εργασίας’’ και το ‘’Υπόλοιπα’’. Με την επιλογή ‘’Υπόλοιπα’’ θα εκτιμήσουμε τα σφάλματα (u) της παλίνδρομης, ∧
όπου u = Y − Y , τα οποία παρουσιάζονται στην περιοχή ‘’Έξοδος Υπολοίπων/ Φύλλο excel regression’’. 6
Πατάμε το ΟΚ και σε ένα νέο φύλλο εργασίας (Φύλλο ‘’regression’’) υπολογίζονται τα στοιχεία της παλινδρόμησης τα οποία παρουσιάζονται στους παρακάτω πίνακες. (βλ. Πίνακες 1,2,3)
--------ΣΤΑΔΙΟ Β (Φύλλο excel ‘’regression’’)
Από τα δεδομένα των Υπολοίπων (Έξοδος Υπολοίπων) θα κατασκευάσουμε ένα τυπικό γράφημα της κατανομής που ακολουθούν. 1)
Από
το
μενού
‘’Εργαλεία’’Æ’’Ανάλυση
Δεδομένων’’ÆΕπιλέγω
το
‘’Ιστόγραμμα’’. (βλ. παρακάτω, Γράφημα 2) 2) Στην ‘’Περιοχή Εισόδου’’, εισάγω τα δεδομένα των υπολοίπων (Φύλλο excel ‘’regression’’/ C50:C147). Επιλέγω επίσης και το ‘’Ετικέτες’’. 3) Στην ‘’Περιοχή Εξόδου’’, επιλέγω μια κενή περιοχή κελιών (έστω 4x4). Επιλεγώ επίσης τα ‘’Αθροιστική Σχετική Συχνότητα’’ και το ‘’Έξοδος Γραφήματος’’. Πατάμε ΟΚ και κατασκευάζουμε το διάγραμμα κατανομής των υπολοίπων, το οποίο παρατηρούμε ότι προσεγγίζει την κανονική κατανομή (βλ. Γράφημα ‘’Ιστόγραμμα’’/ Φύλλο excel ‘’regression’’).
Τέλος από το μενού ’’Εισαγωγή’’Æ ‘’Γράφημα (γραμμές)’’. Πιέζουμε το ‘’Επόμενο’’ και στην ‘’Περιοχή Δεδομένων’’ επιλέγω τα δεδομένα των υπολοίπων (Φύλλο ‘’regression’’/ C50:C147) και το ‘’Σειρά σε Στήλες’’. Πατώντας ‘’Επόμενο…’’ φτάνω μέχρι το τέλος και κατασκευάζω το γράφημα των υπολοίπων (βλ. ‘’Γράφημα Υπολοίπων’’/ Φύλλο excel ‘’regression’’). .
7
----ΣΤΑΔΙΟ Γ (Φύλλο excel ‘’stats’’). Περιγραφικά στατιστικά των δεδομένων μας.
1)
Από
το
μενού
‘’Εργαλεία’’Æ’’Ανάλυση
Δεδομένων’’ÆΕπιλέγω
το
‘’Περιγραφικά Στατιστικά’’. 2) Στην ‘’Περιοχή Εισόδου’’ επιλέγω τα δεδομένα των υπολοίπων (‘’Φύλλο regression’’/ C50:C147), καθώς επίσης και το ‘’Νέο Φύλλο’’, ‘’Περιληπτικά Στατιστικά’’. 3) Πιέζοντας το ΟΚ, εμφανίζονται τα περιγραφικά στατιστικά του Φύλλου ‘’stats’’. Η ιδία διαδικασία ισχύει για την εύρεση των περιγραφικών στατιστικών των αποδόσεων των δεικτών (Φύλλο ‘’rates’’/ Α2:A99, B2:B99, C2:C99). Στο φύλλο excel ‘’stats’’ έχουμε υπολογίσει τα περιγραφικά στατιστικά (μέση τιμή, διακύμανση, κύρτωση κτλ) τόσο των δεικτών όσο και των σφαλμάτων.
ΦΥΛΛΟ EXCEL ‘’regression’’ (Ανάλυση Παλινδρόμησης) Στον πρώτο πίνακα παρουσιάζονται τα γενικά στατιστικά της παλινδρόμησης, στον δεύτερο η ανάλυση διακύμανσης, ενώ στον τρίτο τα στατιστικά των συντελεστών.
ΠΙΝΑΚΑΣ 1. (ΣΤΑΤΙΣΤΙΚΑ ΠΑΛΙΝΔΡΟΜΗΣΗΣ) Στατιστικά παλινδρόμησης Πολλαπλό R R Τετράγωνο Προσαρμοσμένο R Τετράγωνο Τυπικό σφάλμα Μέγεθος δείγματος
0,903435424 0,816195565 0,812325998 0,012336364 98
8
ΠΙΝΑΚΑΣ 2. (ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ) Παλινδρόμηση Υπόλοιπο Σύνολο
βαθμοί ελευθερίας 2 95 97
SS 0,064200174 0,014457659 0,078657833
MS 0,032100087 0,000152186
F 210,9268438
Σημαντικότητα F 1,14001E-35
ΠΙΝΑΚΑΣ 3. (ΣΥΝΤΕΛΕΣΤΕΣ)
Τεταγμένη επί την αρχή (b0) FTSE-100 (b1) Dow Jones (b2)
Συντελεστές
Τυπικό σφάλμα
t
τιμή-P
Κατώτερο 95%
Υψηλότερο 95%
Κατώτερο 95,0%
Υψηλότερο 95,0%
0,000767503 0,622396658
0,001251986 0,125692912
0,61302813 4,9517244
0,5413226 3,188E-06
-0,001718 0,3728647
0,00325301 0,87192863
-0,001718 0,372865
0,00325301 0,87192863
0,492589505
0,125888417
3,91290571
0,0001713
0,2426694
0,74250961
0,242669
0,74250961
ΚΑΤΑΝΟΜΗ ΚΑΤΑΛΟΙΠΩΝ ΓΡΑΦΗΜΑ 2.
9
ΣΤΑΤΙΣΤΙΚΟΙ ΕΛΕΓΧΟΙ: t-stat, F-stat, Jarque-Bera. (Φύλλο excel ‘regression’)
Από την οικονομετρία γνωρίζουμε μερικούς ελέγχους τους οποίους διεξάγουμε για να αποφανθούμε για την στατιστική σημαντικότητα τόσο των συντελεστών όσο και της παλινδρόμησης. Η
παλινδρόμηση,
όπως
ήδη
έχουμε
αναφέρει,
έχει
την
μορφή
Yt=b0+b1*X1t+b2*X2t. Στον ‘’Πίνακα 3/ Στήλη Συντελεστές’’ (βλ. παραπάνω), έχουν εκτιμηθεί οι συντελεστές της παλινδρόμησης, οπότε καταλήγουμε στην μορφή Yt=0,00076+0,622*X1t+0,492*X2t. (Δεν έχουμε γράψει τα τελευταία δεκαδικά ψηφιά για λόγους κομψότητας….).
Όλοι οι έλεγχοι έγιναν σε επίπεδο σημαντικότητας α=5%. Το μέγεθος του δείγματος είναι Τ=98 παρατηρήσεις, ενώ ο αριθμός των συντελεστών του υποδείγματός μας είναι k=2 (b1, b2). Οι έλεγχοι που έχουμε διενεργήσει είναι οι εξής: (Στο αρχείο excel παρουσιάζεται η διαδικασία αναλυτικά, με τις αντίστοιχες συναρτήσεις) 1) Έλεγχος σημαντικότητας των συντελεστών (t-statistic). H0: bi=0 H1: bi<>0 Aν | t − statistic (bi ) | > | t
a / 2, T − k − 1
| τότε απορρίπτω την H0, άρα ο συντελεστής
είναι στατιστικά σημαντικός. Για την τιμή t-statistic των συντελεστών θα ανατρέξουμε στον Πίνακα 3/ Στήλη t 2) Έλεγχος σημαντικότητας της παλινδρόμησης (F-statistic). H0: Παλινδρόμηση μη σημαντική H1: Παλινδρόμηση σημαντική Aν F − statistic(regression) > F
a, k , T − k − 1
τότε απορρίπτω την H0, άρα η
παλινδρόμηση είναι στατιστικά σημαντική. Για την τιμή F-statistic της παλινδρόμησης θα ανατρέξουμε στον Πίνακα 2/ Στήλη F. 10
3) Έλεγχος κανονικότητας διαταρακτικού όρου (X2). H0: u~N(0,σ2) H1: u<>N(0,σ2) Aν Jarque − Bera _ statistic 5 > X 2 τότε απορρίπτω την H0, άρα τα κατάλοιπα δεν a,2
ακολουθούν την κανονική κατανομή. Οι συναρτήσεις του excel που έχουμε χρησιμοποιήσει για τις κρίσιμες τιμές των στατιστικών ελέγχων είναι οι κάτωθι. 1) TINVÆ t
a / 2, T − k − 1
2) FIVNÆ F a, k , T − k − 1 3) CHIINVÆ X 2
a,T
ΑΝΑΛΥΣΗ ΠΑΛΙΝΔΡΟΜΗΣΗΣ (βλ. παραπάνω Πίνακες 1,2,3 και Φύλλο excel ‘’regression’’)
Το κυριότερο που μας ενδιαφέρει από τα στοιχεία της παλινδρόμησης Yt=b0+b1*X1t+b2*X2t. είναι η στατιστική σημαντικότητά της (F-statistic), η σημαντικότητα
των
συντελεστών
(t-statistic)
καθώς
και
ο
συντελεστής
προσδιορισμού R2. Το R2 δείχνει το βαθμό προσαρμογής της γραμμής της παλινδρόμησης στα δεδομένα μας. Οι τιμές που λαμβάνει είναι στο διάστημα (0,1). Όσο πλησιάζουμε προς την μονάδα τόσο καλύτερη είναι η παλινδρόμηση. Στην περίπτωσή μας από το Φύλλο ‘’regression’’/ Έξοδος Συμπεράσματος το R2=0.816, οπότε αντιλαμβανόμαστε ότι η ερμηνευτικότητα της παλινδρόμηση είναι ικανοποιητική 6 . Το προσαρμοσμένο R2 είναι μια βελτιωμένη εκδοχή του απλού R2. Παρατηρούμε επίσης ότι οι συντελεστές b1 και b2 είναι στατιστικά σημαντικοί, ενώ αντιθέτως ο σταθερός όρος b0 δεν είναι στατιστικά σημαντικός (βλ. Φύλλο excel ‘’regression’’/ Στατιστικοί Έλεγχοι). Βέβαια, εκείνο που μας ενδιαφέρει κυρίως S 2 (k − 3) 2 + ), όπου 6 24 ΤÆΜέγεθος Δείγματος SÆΤιμή Ασυμμετρίας [κατάλοιπα (u)], kÆΤιμή Κύρτωσης [κατάλοιπα (u)].
5
Jarque − Bera = T * (
6
Οι εμπειρικές μελέτες έχουν δείξει ότι για την ικανοποιητική ερμηνεία των χρονολογικών σειρών το R2 της παλινδρόμησης θα πρέπει υπερβαίνει το 0.8, ενώ για διαστρωματικά δεδομένα το R2 θα πρέπει να είναι μεγαλύτερο το 0.6.
11
είναι η στατιστική σημαντικότητα των ερμηνευτικών μεταβλητών (b1 ,b2) και όχι τόσο του σταθερού όρου (b0). Να προσθέσουμε επίσης ότι οι συντελεστές b1, b2 δείχνουν την ποσοστιαία μεταβολή της εξαρτημένης μεταβλητής (Υ), όταν οι ανεξάρτητες (Χ1, Χ2) μεταβάλλονται κατά 1%. Άρα, όταν η απόδοση της Αγγλίας (Χ1) μεταβάλλεται κατά 1%, η μεταβολή του δείκτη της Γερμανίας είναι b1=0,6223%, ενώ όταν μεταβάλλεται ο δείκτης των ΗΠΑ (Χ2) κατά 1% τότε η
επίδραση στην απόδοση της Γερμανίας είναι b2=0,4925% (βλ Πίνακα 3/ Στήλη Συντελεστές). Επιπλέον διαπιστώνουμε ότι η τιμή F-statistic της παλινδρόμησης (βλ. Φύλλο excel ‘’regression’’/ Στατιστικοί Έλεγχοι) είναι πολύ υψηλή, γεγονός που δείχνει το
υπόδειγμα είναι στατιστικά σημαντικό. Τέλος, εστιάζοντας στην τιμή Jarque-Bera, εξακριβώνουμε ότι τα κατάλοιπα ακολουθούν την κανονική κατανομή.
ΓΕΩΜΕΤΡΙΚΗ ΕΡΜΗΝΕΙΑ.
Όπως γνωρίζουμε από την γεωμετρία, κάθε συνάρτηση της μορφής Y= b0+b1*X1+b2*X2 παριστάνει ένα επίπεδο στο χώρο. Είναι λοιπόν κατανοητό ότι η
σχέση που έχει εκτιμηθεί μεταξύ των δεικτών παριστάνει ένα επίπεδο. Στο παρακάτω γράφημα έχουμε σχεδιάσει την γραφική παράσταση με τη βοήθεια του MatLab. Δυστυχώς οι δυνατότητες του excel είναι πολύ περιορισμένες στα γραφήματα, ωστόσο παρέχει τη δυνατότητα απεικόνισης διμεταβλητής συνάρτησης με τη χρήση των γραφημάτων ‘’Επιφάνεια’’.
12
ΣΥΝΟΨΗ ΣΥΝΑΡΤΗΣΕΩΝ EXCEL
Οι συναρτήσεις που χρησιμοποιήσαμε για να εκτιμήσουμε την παλινδρόμηση Y= b0+b1*X1+b2*X2 και για να διενεργήσουμε τους στατιστικούς ελέγχους ήταν οι εξής: Μενού ΕργαλείαÆΑνάλυση ΔεδομένωνÆΠαλινδρόμηση Μενού ΕργαλείαÆ Ανάλυση Δεδομένων ÆΙστόγραμμα Μενού ΕργαλείαÆ Ανάλυση Δεδομένων ÆΠεριγραφικά Στατιστικά TINVÆ t
a / 2, T − k − 1
(κρίσιμη τιμή t -κατανομής)
FIVNÆ F a, k , T − k − 1
(κρίσιμη τιμή F -κατανομής)
CHIINVÆ X 2
a,T
(κρίσιμη τιμή X2 -κατανομής)
ΓραφήματαÆ Διασπορά (ΧΥ) και Προσθήκη Γραμμής Τάσης ΓραφήματαÆ Γραμμή 13