ΑΡΙΣΤΟΤΕΛΕΙΟ
ΠΑΝΕΠΙΣΤΗΜΙΟ
|
2016- 2017 Χειμερινό Εξάμηνο |
Διδάσκων
Καθηγητής:
|
Αναστάσιος
Γούναρης |
|
Γραφείο:
|
γραφείο 28, Β' όροφος, Εθνικής Αντιστάσεως 16 | |
Τηλέφωνο:
|
2310 991933 | |
E-mail:
|
gounaria@csd.auth.gr | |
Διαλέξεις:
|
Δευτέρα 18:45 - 21:15 (Αίθουσα 2, παράρτημα Εθν. Αντιστάσεως) |
|
Διάλεξη | Ημερομηνία |
Περιληπτικές
Διαφάνειες |
Υλικό
προς Μελέτη |
1 |
10/10/2016 |
Παρουσιάση του μαθήματος - Εισαγωγικά για το Map-Reduce | α) Ιστοσελίδα
στο Google. β) Κεφάλαια 1 και 2 από το βιβλίο "Data-Intensive Text Processing with MapReduce" των Jimmy Lin και Chris Dyer. |
2 |
17/10/2016 | Βασικές
γνώσεις υποβάθρου στα θέματα της επεξεργασίας
και
βελτιστοποίησης ερωτημάτων |
Το
πλήρες σχετικό υλικό του προπτυχιακού μαθήματος
βρίσκεται εδώ
και εδώ. |
3 |
24/10/2016 | Παραλληλοποίηση ερωτημάτων | α)
Κεφάλαιο
14
από το βιβλίο Principles
of Distributed Database Systems (μέχρι
και το 14.4.3) β) Κεφάλαιο "Παράλληλη Διαχείριση Δεδομένων" |
4 |
31/10/2016 |
Διαχείριση δεδομένων σε Map-Reduce | α) Κεφάλαιο
3 από το "Data-Intensive Text Processing
with MapReduce". β) Κεφάλαιο 2 του βιβλίου Mining of Massive Datasets |
5 |
7/11/2016 | Διαχείριση
Δεδομένων σε MapReduce και
SPARK
(συνέχεια). Σύγκριση Map Reduce και ΣΔΒΔ Ανάλυση προγραμμάτων MapReduce |
α) MapReduce
and
parallel DBMSs: friends or foes? β) MapReduce: a flexible data processing tool γ) Upper and Lower Bounds on the Cost of a MapReduce Computation |
6 |
14/11/2016 | Εισαγωγή Κατανεμημένων Βάσεων Δεδομένων | Κεφάλαιο 1 από το βιβλίο Principles of Distributed Database Systems |
7 |
21/11/2016 | Αρχιτεκτονική και Σχεδίαση Κατανεμημένων Βάσεων Δεδομένων | Κεφάλαιο 3 από το βιβλίο Principles of Distributed Database Systems |
8 |
28/11/2016 | Σχεδίαση Κατανεμημένων Βάσεων Δεδομένων (συνέχεια) | Κεφάλαιο 3 από το βιβλίο Principles of Distributed Database Systems |
9 |
5/12/2016 | Εισαγωγή στην
Επεξεργασία Ερωτημάτων σε
ΚΒΔ Επεξεργασία Κατανεμημένων Ερωτημάτων |
Κεφάλαιο
6
από το βιβλίο Principles
of Distributed Database Systems Κεφάλαιο 7 από το βιβλίο Principles of Distributed Database Systems |
10 |
12/12/2016 | Βελτιστοποίηση Κατανεμημένων Ερωτημάτων | Κεφάλαιο 8 από το βιβλίο Principles of Distributed Database Systems |
11 |
19/12/2016 | Βελτιστοποίηση Κατανεμημένων Ερωτημάτων | Κεφάλαιο 8 από το βιβλίο Principles of Distributed Database Systems |
12 |
16/1/2017 | Θέματα Υλοποίησης Εργασίας | |
13 |
23/1/2017 | Θέματα Διαχείρισης Συναλλαγών σε Κατανεημένες Βάσεις Δεδομένων, NoSQL και Flink | Κεφάλαια 11 και 12 από το βιβλίο Principles of Distributed Database Systems |
Ανακοινώσεις |
22 Νοε |
Ανάθεση
εργασιών: ΑΕΜ 654: σύνδεση αστέρα 4 σχέσεων ΑΕΜ 666: σύνδεση αλυσίδας 4 σχέσεων ΑΕΜ 673: δυαδική θ-σύνδεση ΑΕΜ 702: σύνδεση αστέρα 4 σχέσεων ΑΕΜ 703: δυαδική θ-σύνδεση Τα ερωτήματα να είναι μέρος αυτών στο https://github.com/databricks/spark-sql-perf Οι τεχνικές που πρέπει να ακολουθηθούν να είναι: α) Για τις συνδέσεις 4 σχέσεων, αυτές που περιγράφονται στην εργασία "Optimizing Multiway Joins in a Map-Reduce Environment", Sections 4.1 (σύνδεση αστέρα) και 4.4.3 (σύνδεση αλυσίδας) β) Για τις δυαδικές συνδέσεις, η τεχνική 1-Bucket-Theta από την εργασία "Processing Theta-Joins using MapReduce". Προθεσμία παράδοσης (κώδικας σε Scala ή Java, εκτελέσιμο jar και παρουσίαση): 1η διάλεξη μετά τα Χριστούγεννα. |
8 Νοε |
Υπενθύμιση: στην αρχή της διάλεξης στις 14/11/2016 θα πραγματοποηθεί η πρώτη γραπτή εξέταση του μαθήματος διάρκειας 30' (βαρύτητα: 15% στον τελικό βαθμό). |
10 Οκτ |
Επιπλέον εργασίες για
διαχέιριση δεδομένων
σε MapReduce |
10 Οκτ |
Διδακτικά Βοηθήματα
|