Γενικευμένα Γραμμικά Μοντέλα

Ioannidis Evagelos

Περιγραφή
Στο μάθημα γενικεύουμε τα μοντέλα παλινδρόμησης και ανάλυσης με κανονικές ομοσκεδαστικές απαντητικές μεταβλητές, έτσι ώστε η απαντητική μεταβλητή να ανήκει σε μία γενικότερη οικογένεια, την εκθετική. Σε αυτή την οικογένεια ανήκουν η Γάμμα, η Poisson και η δυωνυμική κατανομή. Η οικογένεια αυτή επίσης επιτρέπει κάποιας μορφής ετεροσκεδαστικότητα. Κυρίως όμως μας επιτρέπει να αναλύσουμε δεδομένα που η εξαρτημένη μεταβλητή δεν είναι συνεχής, αλλά κατηγορική.
Στο πρώτο μισό του μαθήματος παρουσιάζεται η γενική θεωρία του γενικευμένου γραμμικού μοντέλου και της ανάλυσης της πιθανοφάνειάς του, και συζητιούνται διεξοδικά η θεωρία της εκτίμησης παραμέτρων, ελέγχου υποθέσεων και διαγνωστικών ελέγχων σε αυτά τα μοντέλα. Στο δεύτερο μισό του μαθήματος παρουσιάζονται αναλυτικά με τη βοήθεια παραδειγμάτων με πραγματικά δεδομένα, τρεις ειδικές περιπτώσεις των μοντέλων αυτών: η λογιστική παλινδρόμηση, μοντέλα Poisson και log-linear και τέλος η εφαρμογή των τελευταίων στην ανάλυση πινάκων συνάφειας, κα
Περισσότερα  
Περιεχόμενο Μαθήματος
1. Θεωρία ΓΓΜ
Πίνακας συνδιακύμανσης και έλεγχος του Wald, συνάρτηση πιθανοφάνειας, εκτίμηση μέγιστης πιθανοφάνειας, τα scores και η κατανομή τους, πληροφορία του Fisher, ιδιότητες εκτιμητριών μεγ. πιθανοφ., Έλεγχος λόγου πιθανοφανειών, Η εκθετική οικογένεια κατανομών, Ανάλυση πιθανοφάνειας του γενικευμένου γραμμικού μοντέλου, Εκτίμηση μεγ. πιθαν. στο γεν. γραμ. μοντέλο, αλγόριθμος Newton-Raphson, σχέση με σταθμισμένα ελάχ. τετρ., συμπερασματολογία για συντελεστές, Απόκλιση από το κορεσμένο μοντέλο, Μοντέλα με άγνωστο φ, Κατάλοιπα.
2. Εφαρμογές-Παραδείγματα
Διωνυμικά δεδομένα: Συναρτήσεις σύνδεσμοι, ερμηνεία συντελεστών, συμπερασματολογία, αραιότητα πινάκων, overdispersion. Ανάλυση κατά ένα παράγοντα (κατηγορικό ή συνεχή), κατά δύο ή περισσότερες παράγοντες, με και χωρίς αλληλεπιδράσεις: παραμετροποιήσεις, πίνακες σχεδιασμού, ερμηνεία συντελεστών.
Μοντέλα Poisson και log-linear, Πίνακες συνάφειας: πολυωνυμική και γινόμενο πολυωνυμικών, ισοδυναμία με log-linear, σχέση με λογιστική παλινδρόμηση, ανεξαρτησία, ανεξαρτησία κατά ομάδες, δεσμευμένη ανεξαρτησία, ομοιόμορφη εξάρτηση.


ΑΤΖΕΝΤΑ ΜΑΘΗΜΑΤΟΣ

1η Εβδομάδα
1. Εισαγωγή-εργαλεία: 1.1 Κατασκευή μοντέλων, 1.2 Η «γενίκευση» των ΓΓΜ, 1.3 Πίνακες συνδιακύμανσης και έλεγχος του Wald, 1.4 Συνάρτηση πιθανοφάνειας, 1.5 Εκτίμηση μέγιστης πιθανοφάνειας.
2η Εβδομάδα
1. Εισαγωγή-εργαλεία (συνέχεια): τα scores, 1.6 Πληροφορία του Fisher, 1.7 Στατιστικές ιδιότητες των εκτιμητριών μέγιστης πιθανοφάνειας, 1.8 Σύγκριση μοντέλων: έλεγχος λόγου πιθανοφανειών, απλή και σύνθετη μηδενική και εναλλακτική.
3η Εβδομάδα
1. Εισαγωγή-εργαλεία (συνέχεια): 1.9 Κατανομή λόγου πιθανοφανειών υπό τη μηδενική, γραμμικό μοντέλο (με γνωστή και άγνωστη διακύμανση) γεωμετρική ερμηνεία, 1.10 Η εκθετική οικογένεια κατανομών.
4η Εβδομάδα
2. Το γενικευμένο γραμμικό μοντέλο: 2.1 Οι συνιστώσες του ΓΓΜ, ανάλυση πιθανοφάνειας του ΓΓΜ, 2.2 Εκτίμηση μέγιστης πιθανοφάνειας των συντελεστών του ΓΓΜ, σχέση με σταθμισμένα ελάχ. τετρ., υπολογισμός των scores και αλγόριθμος Newton-Raphson, υπολογισμός πληροφορίας του Fisher, 2.3 Συμπερασματολογία για συντελεστές.
5η Εβδομάδα
2. Το γενικευμένο γραμμικό μοντέλο (συνέχεια): 2.4 Απόκλιση από το κορεσμένο μοντέλο (Deviance), απόκλιση του Pearson, 2.5 Μοντέλα με άγνωστη διακύμναση, 2.6 Κατάλοιπα (απόκλισης και Pearson).
6η Εβδομάδα
3. Δυωνυμική απαντητική μεταβλητή: 3.1 Εισαγωγή, 3.2 Συναρτήσεις σύνδεσμοι, ερμηνεία συντελεστών, γραφικός έλεγχος για σύνδεσμο, 3.3 Συμπερασματολογία, Απόκλιση, Αραιότητα πινάκων.

7η Εβδομάδα
3. Δυωνυμική απαντητική μεταβλητή (συνέχεια): 3.3 Συμπερασματολογία (συνέχεια): Overdispersion, 3.4 Το παράδειγμα των δεδομένων χρήσης αντισύλληψης, 3.4.1 Ανάλυση κατά ένα κατηγορικό παράγοντα, ομαδοποιημένα/αναλυτικά δεδομένα, άλλες παραμετροποιήσεις και πίνακες σχεδιασμού, 3.4.2 Ανάλυση με ένα συνεχή παράγοντα, ομαδοποιημένα/αναλυτικά δεδομένα και πίνακες σχεδιασμού.
8η Εβδομάδα
3. Δυωνυμική απαντητική μεταβλητή (συνέχεια): 3.4.3 Ανάλυση με ένα συνεχή και ένα κατηγορικό παράγοντα, αλληλεπιδράσεις, διαφορετικές παραμετροποιήσεις και πίνακες σχεδιασμού, 3.4.4 Ανάλυση με δύο κατηγορικές μεταβλητές, αθροιστικό μοντέλο, παραμετροποιήσεις, πίνακες σχεδιασμού, μοντέλο με αλληλεπιδράσεις, παραμετροποιήσεις, πίνακες σχεδιασμού
9η Εβδομάδα
3. Δυωνυμική απαντητική μεταβλητή (συνέχεια): 3.4.4 Ανάλυση με δύο κατηγορικές μεταβλητές (συνέχεια): παράδειγμα, γραφική ερμηνεία αλληλεπιδράσεων. Επιλογή μοντέλου με διαδοχικούς ελέγχους, παραδείγματα ελέγχων, προοπτικές/αναδρομικές μελέτες με logit σύνδεσμο.
4. Μοντέλα Poisson και log-linear: διακριτή απαντητική. Παράδειγμα δεδομένων: Αριθμός παιδιών ανά γυναίκα, Log σύνδεσμος, ερμηνεία συντελεστών, συμπερασματολογία, ομαδοποιημένα/αναλυτικά δεδομένα.
10η Εβδομάδα
4. Μοντέλα Poisson και log-linear (συνέχεια): παράδειγμα ανάλυσης δεδομένων και ελέγχων.
5. Πίνακες συνάφειας και log-linear μοντέλα: 5.1 Εισαγωγή-Πaραδείγματα, Δισδιάστατοι πίνακες, πίνακες περισσοτέρων διαστάσεων, 5.2 Μοντέλο πολυωνυμικό και ισοδυναμία με Poisson/log-linear

11η Εβδομάδα
5. Πίνακες συνάφειας και log-linear μοντέλα (συνέχεια): 5.3 Γινόμενο πολυωνυμικών και ισοδυναμία με Poisson/log-linear, 5.4 Σχέση log-linear μοντέλων και λογιστικής παλινδρόμησης, 5.5 Εξαρτήσεις μεταξύ μεταβλητών και log-linear μοντέλα, 5.5.1 Δισδιάστατοι πίνακες: αθροιστικό μοντέλο, απουσία κύριας επίδρασης, εκτίμηση έλεγχος ανεξαρτησίας
12η Εβδομάδα
Πίνακες συνάφειας και log-linear μοντέλα (συνέχεια): 5.5.2 Τρεις- και πολύ-διάστατοι πίνακες, το παράδειγμα δεδομένων «Σχέδια τελειόφοιτων για κολέγιο», πλήρης ανεξαρτησία, Ανεξαρτησία κατά ομάδες, Δεσμευμένη ανεξαρτησία Ι, Δεσμευμένη ανεξαρτησία ΙΙ: το παράδειγμα δεδομένων «Ανταπόκριση λυμφώματος σε θεραπεία»
13η Εβδομάδα
Πίνακες συνάφειας και log-linear μοντέλα (συνέχεια): 5.5.2 (συνέχεια): Δεσμευμένη ανεξαρτησία ΙΙΙ: το παράδοξο του Simpson, Ομοιόμορφη εξάρτηση, 5.6 Γραφήματα αλληλεπιδράσεων, 5.7 Σχέση log-linear μοντέλων και λογιστικής παλινδρόμησης στο παράδειγμα των δεδομένων «Σχέδια τελειόφοιτων για κολέγιο».
Βοηθήματα

Σημειώσεις

Foster, J. , Generalized Linear Models
Rodriguez, J. (2000), Generalized Linear Models.

Βιβλία

Agresti, A. (2015), Foundations of Linear and Generalized Linear Models, Wiley Series in Probability and Statistics
Agresti, A. (2012), Categorical Data Analysis, 3rd edition, Wiley Series in Probability and Statistics
Dobson, A. and Barnett, A. (2018), An Introduction to Generalized Linear Models, Chapmann & Hall.
Fox (2008), Applied Regression Analysis and Generalized Linear Models, Kindle
Hosmer, D.W. and Lemeshow, S. (1989, 2000), Applied Logistic Regression. New York: Wiley.
McGullagh, P and Nelder, J.A. (1989), Generalized Linear Models, London: Chapman and Hall.

Συμπληρωματικά Στοιχεία

Προαπαιτούμενες γνώσεις

Γραμμικά Μοντέλα, Εκτιμητική, Γραμμική Άλγεβρα Ι και ΙΙ.

Τρόπος διδασκαλίας και αξιολόγηση

Προσφέρονται φροντιστήρια σε υπολογιστές παράλληλα με το μάθημα με πρακτικές εφαρμογές ανάλυσης δεδομένων με R.
Γραπτές θεωρητικές εξετάσεις και  2 εργασίες ανάλυσης δεδομένων (αθροιστικό bonus 0,5 βαθμού η κάθε μια, ΑΝ ο βαθμός της γραπτής εξέτασης είναι μεγαλύτερος του 4.

Επικοινωνία μεταξύ φοιτητών και διδασκόντων

Ευάγγελος Ιωαννίδης
Γραφείο: Κοδριγκτώνος 12, 3ος όροφος
Τηλ. 210 8203545
Email: eioannid @aueb.gr

Ημερολόγιο

Ανακοινώσεις