Στατιστική στην Πληροφορική (3155)
Αντώνης Δημάκης
Κωδικός σύνδεσης ομάδας στο MS Teams: v3ru4j6
Στατιστική είναι η επιστήμη που ασχολείται με την συλλογή, σύνοψη, ανάλυση και ερμηνεία δεδομένων με απώτερο σκοπό την εξαγωγή συμπερασμάτων, επίτευξη προβλέψεων και λήψη αποφάσεων.
ΠΕΡΙΕΧΟΜΕΝΑ ΤΟΥ ΜΑΘΗΜΑΤΟΣ
Οπτικοποίηση δεδομένων και κατανομών
Περιγραφή κατανομών με αριθμούς
Συσχέτιση δεδομένων και συντελεστής συσχέτισης
Παραγωγή δεδομένων
Κεντρικό οριακό θεώρημα
Κατανομές δειγματοληψίας
Εκτίμηση διαστήματος εμπιστοσύνης μέσης τιμής πληθυσμού
Έλεγχος υπόθεσης μέσης τιμής πληθυσμού
Θέματα συμπερασματολογίας (t διάστημα εμπιστοσύνης και έλεγχος υπόθεσης, σύγκριση δύο πληθυσμών, συμπερασματολογία για την παράμετρο αναλογίας)
Γραμμική παλινδρόμηση και η μέθοδος των ελαχίστων τετραγώνων
Έλεγχος καλής προσαρμογής
Ανάλυση διακύμανσης (ANOVA)
Λογιστική παλινδρόμηση
Η αρχή της μέγιστης πιθανοφάνειας
Στατιστική κατά Bayes
ΛιγότεραΚωδικός σύνδεσης ομάδας στο MS Teams: v3ru4j6
Στατιστική είναι η επιστήμη που ασχολείται με την συλλογή, σύνοψη, ανάλυση και ερμηνεία δεδομένων με απώτερο σκοπό την εξαγωγή συμπερασμάτων, επίτευξη προβλέψεων και λήψη αποφάσεων.
ΠΕΡΙΕΧΟΜΕΝΑ ΤΟΥ ΜΑΘΗΜΑΤΟΣ
Οπτικοποίηση δεδομένων και κατανομών
Περιγραφή κατανομών με αριθμούς
Συσχέτιση δεδομένων και συντελεστής συσχέτισης
Παραγωγή δεδομένων
Κεντρικό οριακό θεώρημα
Κατανομές δειγματοληψίας
Εκτίμηση διαστήματος εμπιστοσύνης μέσης τιμής πληθυσμού
Έλεγχος υπόθεσης μέσης τιμής πληθυσμού
Θέματα συμπερασματολογίας (t διάστημα εμπιστοσύνης και έλεγχος υπόθεσης, σύγκριση δύο πληθυσμών, συμπερασματολογία για την παράμετρο αναλογίας)
Γραμμική παλινδρόμηση και η μέθοδος των ελαχίστων τετραγώνων
Έλεγχος καλής προσαρμογής
Ανάλυση διακύμανσης (ANOVA)
Λογιστική παλινδρόμηση
Η αρχή της μέγιστης πιθανοφάνειας
Στατιστική κατά Bayes
Κωδικός σύνδεσης ομάδας στο MS Teams: v3ru4j6
Στατιστική είναι η επιστήμη που ασχολείται με την συλλογή, σύνοψη, ανάλυση και ερμηνεία δεδομένων με απώτερο σκοπό την εξαγωγή συμπερασμάτων, επίτευξη προβλέψεων και λήψη αποφάσεων.
ΠΕΡΙΕΧΟΜΕΝΑ ΤΟΥ ΜΑΘΗΜΑΤΟΣ
Οπτικοποίηση δεδομένων και κατανομών
Περιγραφή κατανομών με αριθμούς
Συσχέτιση δεδομένων και συντελεστής συσχέτισης
Παραγωγή δεδομένων
Κεντρικό οριακό θεώρημα
Κατανομές δειγματοληψίας
Εκτίμηση διαστήματος εμπιστοσύνης μέσης τιμής πληθυσμού
Έλεγχος υπόθεσης μέσης τιμής πληθυσμού
Θέματα συμπερασματολογίας (t διάστημα εμπιστοσύνης και έλεγχος υπόθεσης, σύγκριση δύο πληθυσμών, συμπερασματολογία για την παράμετρο αναλογίας)
Γραμμική παλινδρόμηση και η μέθοδος των ελαχίστων τετραγώνων
Έλεγχος καλής προσαρμογής
Ανάλυση διακύμανσης (ANOVA)
Λογιστική παλινδρόμηση
Η αρχή της μέγιστης πιθανοφάνειας
Στατιστική κατά Bayes
Περίγραμμα
Περιεχόμενο μαθήματος (Syllabus)
- Διερευνητική Ανάλυση Δεδομένων (Exploratory Data Analysis)
- Αριθμητικού και οπτικοί περιγραφείς της κατανομής μεταβλητών
- Περιγραφείς σχέσεων μεταβλητών, συντελεστής συσχέτισης, γραμμική παλινδρόμηση ελαχίστων τετραγώνων
- Principal Component Analysis (PCA)
- Εξαγωγή συμπερασμάτων (Statistical inference)
-
- Διαστήματα εμπιστοσύνης, έλεγχοι υπόθεσης
- Συμπεράσματα για τη μέση τιμή πληθυσμών, t-έλεγχος
- Συμπεράσματα για την εμφάνιση ποσοστών στον πληθυσμό, z-έλεγχος
- Συμπεράσματα από πίνακες συχνοτήτων (χ^2), χ^2 έλεγχος καλής προσαρμογής
- Συμπεράσματα για γραμμική παλινδρόμηση
- Ανάλυση διασποράς (ANOVA)
3. Προχωρημένα θέματα
- Λογιστική Παλινδρόμηση, Αρχή Μέγιστης Πιθανοφάνειας, στατιστική κατά Bayes, ...
Αντικειμενικοί στόχοι
Εισαγωγή στις ιδέες της κλασσικής στατιστικής και στις βασικές μεθόδους με χρήση λογισμικού στατιστικής ανάλυσης.
Συνιστώμενη Βιβλιογραφία
Επιλογές συγγραμμάτων στον Εύδοξο:
1.Στατιστική μεθοδολογία_Αναθεωρημένη έκδοση, ΖαϊρηςΠοσειδώνας Εμμ.
2.ΣΤΑΤΙΣΤΙΚΗ, Günter Bamberg, Franz Baur, Michael Krapp
3.ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ ΜΕ ΤΗΝ R, JOHN VERZANI
4.Στατιστική: Ανάλυση δεδομένων με χρήση της R, Witte Robert, Witte John, Ανδρουλάκης Γεώργιος, Κουνετάς Κωνσταντίνος
Ακολουθείται η δομή & προσέγγιση του συγγράμματος:
Introduction to the Practice of Statistics, Moore, McCabe, Craig, 6th edition, W.H. Freeman, 2007.
Διδακτικές και μαθησιακές μέθοδοι
Διαλέξεις: 1-3 Τρίτη Α23, 11-1 Παρασκευή Α25
Φροντιστήρια: Πέμπτη 7-9μμ CSLAB 1 (κατόπιν ανακοίνωσης)
Μέθοδοι αξιολόγησης / βαθμολόγησης
Θα δοθούν 4 σειρές ασκήσεων για ομάδες 1 ή 2 ατόμων, σχεδόν κάθε 2 εβδομάδες.
Τελικός βαθμός = 30% ασκήσεις + 70% τελική εξέταση, εάν τελική εξέταση >= 4,
εάν τελική εξέταση < 4 τότε τελικός βαθμός = τελική εξέταση.
Προαπαιτήσεις
Μαθηματικά ΙΙ, Πιθανότητες
Συμπληρωματικά Στοιχεία
Ώρες γραφείου: 11-1 Τρίτη & 1-3 Παρασκευή
Γραφείο: 506, 5ος όροφος, Τροίας 2
Μέθοδοι διδασκαλίας
Αυτό το εξάμηνο όλες οι διαλέξεις θα γίνουν αποκλειστικά δια ζώσης.
- Διερευνητική Ανάλυση Δεδομένων (Exploratory Data Analysis)
- Αριθμητικού και οπτικοί περιγραφείς της κατανομής μεταβλητών
- Περιγραφείς σχέσεων μεταβλητών, συντελεστής συσχέτισης, γραμμική παλινδρόμηση ελαχίστων τετραγώνων
- Principal Component Analysis (PCA)
- Εξαγωγή συμπερασμάτων (Statistical inference)
-
- Διαστήματα εμπιστοσύνης, έλεγχοι υπόθεσης
- Συμπεράσματα για τη μέση τιμή πληθυσμών, t-έλεγχος
- Συμπεράσματα για την εμφάνιση ποσοστών στον πληθυσμό, z-έλεγχος
- Συμπεράσματα από πίνακες συχνοτήτων (χ^2), χ^2 έλεγχος καλής προσαρμογής
- Συμπεράσματα για γραμμική παλινδρόμηση
- Ανάλυση διασποράς (ANOVA)
3. Προχωρημένα θέματα
- Λογιστική Παλινδρόμηση, Αρχή Μέγιστης Πιθανοφάνειας, στατιστική κατά Bayes, ...
Εισαγωγή στις ιδέες της κλασσικής στατιστικής και στις βασικές μεθόδους με χρήση λογισμικού στατιστικής ανάλυσης.
Introduction to the Practice of Statistics, Moore, McCabe, Craig, 6th edition, W.H. Freeman, 2007.
Διαλέξεις: 1-3 Τρίτη Α23, 11-1 Παρασκευή Α25
Φροντιστήρια: Πέμπτη 7-9μμ CSLAB 1 (κατόπιν ανακοίνωσης)
Θα δοθούν 4 σειρές ασκήσεων για ομάδες 1 ή 2 ατόμων, σχεδόν κάθε 2 εβδομάδες.
Τελικός βαθμός = 30% ασκήσεις + 70% τελική εξέταση, εάν τελική εξέταση >= 4,
εάν τελική εξέταση < 4 τότε τελικός βαθμός = τελική εξέταση.
Μαθηματικά ΙΙ, Πιθανότητες
Ώρες γραφείου: 11-1 Τρίτη & 1-3 Παρασκευή
Γραφείο: 506, 5ος όροφος, Τροίας 2
Αυτό το εξάμηνο όλες οι διαλέξεις θα γίνουν αποκλειστικά δια ζώσης.
Παρακαλώ συμπληρώστε το ανώνυμο ερωτηματολόγιο για χρήση στο μάθημα & εργαστήρια
- (15/10) Διάλεξη 0: πληροφορίες για το μάθημα, ιστορικά στοιχεία, Εισαγωγή στη διερευνητική ανάλυση δεδομένων
- (18/10) Διάλεξη 1: Διερευνητική ανάλυση δεδομένων μιας μεταβλητής
- (21/10) Διάλεξη 2: Κανονική κατανομή. Διερεύνηση σχέσης μεταξύ δύο μεταβλητών
- (25/10) Διάλεξη 3: Συντελεστής συσχέτισης, γραμμική παλινδρόμηση
- (29/10) Διάλεξη 4: Συντελεστής συσχέτισης, γραμμική παλινδρόμηση (συν.)
- (1/11) Διάλεξη 5: Διερεύνηση σχέσεων μεταξύ κατηγορικών μεταβλητών
- (5/11) Διάλεξη 6: Principal Component Analysis (PCA)
- (8/11) Διάλεξη 7: Παραγωγή δεδομένων, σχέσεις αιτιότητας, συγκριτικά τυχαιοποιημένα πειράματα
- (12/11) Διάλεξη 8: Παραγωγή δεδομένων, σχέσεις αιτιότητας, συγκριτικά τυχαιοποιημένα πειράματα
- (19/11) Διάλεξη 9: Παραγωγή δεδομένων, σχέσεις αιτιότητας, συγκριτικά τυχαιοποιημένα πειράματα
- (22/11) Διάλεξη 10: Βασικές ιδέες στατιστικής συμπερασματολογίας
- (26/11) Διάλεξη 11: Ιδιότητες εκτιμητών
- (29/11) Διάλεξη 12: Εισαγωγή στα διαστήματα εμπιστοσύνης
- (3/12) Διάλεξη 13: Εισαγωγή στους έλεγχους σημαντικότητας
- (10/12) Διάλεξη 14: Εισαγωγή στους έλεγχους σημαντικότητας (συν.) Διαστήματα εμπιστοσύνης για τη μέση τιμή
- (11/12) Διάλεξη 15: Διαστήματα εμπιστοσύνης για τη μέση τιμή (συν.)
- (13/12) Διάλεξη 16: Σύγκριση μέσης τιμής δύο πληθυσμών
- (17/12) Διάλεξη 17: Συμπεράσματα για ποσοστά
- (20/12) Διάλεξη 18: Συμπεράσματα για σχέσεις κατηγορικών μεταβλητών
- (7/1) Διάλεξη 19: Συμπεράσματα για σχέσεις ποσοτικών μεταβλητών
- (8/1) Διάλεξη 20: Συμπεράσματα για σχέσεις ποσοτικών μεταβλητών (συν.). Ανάλυση διακύμανσης (ANOVA)
- (10/1) Διάλεξη 21: ΑNOVA (συν.)
Τα εργαστήρια θα γίνονται Παρασκευή 5-7μμ στο CSLAB I από τον βοηθό του μαθήματος κ. Λώλο (alexlolos@aueb.gr)
- (18/10) Εργαστήριο 1: Πρώτα βήματα στην R, διερεύνηση δεδομένων
- (25/10) Εργαστήριο 2: Διερεύνηση κατηγορικών δεδομένων, σχέσεων μεταξύ δύο μεταβλητών
- (22/11) Εργαστήριο 3: Kατανομές δειγματοληψίας, ιδιότητες εκτιμητών