ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ
Τμήμα Πληροφορικής

Κατανεμημένη Διαχείριση Δεδομένων (ΠΜΣ)
2016- 2017
Χειμερινό Εξάμηνο
Διδάσκων Καθηγητής:
Αναστάσιος Γούναρης
Γραφείο:
γραφείο 28, Β' όροφος, Εθνικής Αντιστάσεως 16
Τηλέφωνο:
2310 991933
E-mail:
gounaria@csd.auth.gr
Διαλέξεις:
 Δευτέρα 18:45 - 21:15  (Αίθουσα 2, παράρτημα Εθν. Αντιστάσεως)
Διαλέξεις

Διάλεξη Ημερομηνία
Περιληπτικές Διαφάνειες
Υλικό προς Μελέτη
 1
 10/10/2016
Παρουσιάση του μαθήματος - Εισαγωγικά για το Map-Reduce α) Ιστοσελίδα στο Google.
β) Κεφάλαια 1 και 2 από το βιβλίο "Data-Intensive Text Processing with MapReduce"
των Jimmy Lin και Chris Dyer.
 2
 17/10/2016 Βασικές γνώσεις υποβάθρου στα θέματα της επεξεργασίας και βελτιστοποίησης ερωτημάτων
Το πλήρες σχετικό υλικό του προπτυχιακού μαθήματος βρίσκεται εδώ και εδώ.
 3
 24/10/2016 Παραλληλοποίηση ερωτημάτων α) Κεφάλαιο 14 από το βιβλίο Principles of Distributed Database Systems (μέχρι και το 14.4.3)
β) Κεφάλαιο "Παράλληλη Διαχείριση Δεδομένων"
 4
 31/10/2016
Διαχείριση δεδομένων σε Map-Reduce α) Κεφάλαιο 3 από το "Data-Intensive Text Processing with MapReduce".
β) Κεφάλαιο 2 του βιβλίου Mining of Massive Datasets
 5
7/11/2016 Διαχείριση Δεδομένων σε MapReduce και SPARK (συνέχεια).
Σύγκριση Map Reduce και ΣΔΒΔ
Ανάλυση προγραμμάτων MapReduce
α) MapReduce and parallel DBMSs: friends or foes?
β) MapReduce: a flexible data processing tool

γ) Upper and Lower Bounds on the Cost of a MapReduce Computation
 6
14/11/2016 Εισαγωγή Κατανεμημένων Βάσεων Δεδομένων Κεφάλαιο 1 από το βιβλίο Principles of Distributed Database Systems
 7
21/11/2016 Αρχιτεκτονική και Σχεδίαση Κατανεμημένων Βάσεων Δεδομένων Κεφάλαιο 3 από το βιβλίο Principles of Distributed Database Systems
 8
28/11/2016 Σχεδίαση Κατανεμημένων Βάσεων Δεδομένων (συνέχεια) Κεφάλαιο 3 από το βιβλίο Principles of Distributed Database Systems
 9
5/12/2016 Εισαγωγή στην Επεξεργασία Ερωτημάτων σε ΚΒΔ
Επεξεργασία Κατανεμημένων Ερωτημάτων
Κεφάλαιο 6 από το βιβλίο Principles of Distributed Database Systems
Κεφάλαιο 7 από το βιβλίο Principles of Distributed Database Systems
 10
12/12/2016 Βελτιστοποίηση Κατανεμημένων Ερωτημάτων Κεφάλαιο 8 από το βιβλίο Principles of Distributed Database Systems
 11
19/12/2016 Βελτιστοποίηση Κατανεμημένων Ερωτημάτων Κεφάλαιο 8 από το βιβλίο Principles of Distributed Database Systems
 12
16/1/2017 Θέματα Υλοποίησης Εργασίας
 13
23/1/2017 Θέματα Διαχείρισης Συναλλαγών σε Κατανεημένες Βάσεις Δεδομένων, NoSQL και Flink Κεφάλαια 11 και 12 από το βιβλίο Principles of Distributed Database Systems

Ανακοινώσεις

22 Νοε

Ανάθεση εργασιών:
ΑΕΜ 654: σύνδεση αστέρα 4 σχέσεων
ΑΕΜ 666: σύνδεση αλυσίδας 4 σχέσεων
ΑΕΜ 673: δυαδική θ-σύνδεση
ΑΕΜ 702: σύνδεση αστέρα 4 σχέσεων
ΑΕΜ 703:
δυαδική θ-σύνδεση

Τα ερωτήματα να είναι μέρος αυτών στο https://github.com/databricks/spark-sql-perf

Οι τεχνικές που πρέπει να ακολουθηθούν να είναι:
α) Για τις συνδέσεις 4 σχέσεων, αυτές που περιγράφονται στην εργασία "Optimizing Multiway Joins in a
Map-Reduce Environment", Sections 4.1 (σύνδεση αστέρα) και 4.4.3 (σύνδεση αλυσίδας)
β) Για τις δυαδικές συνδέσεις, η τεχνική 1-Bucket-Theta από την εργασία "Processing Theta-Joins using MapReduce".

Προθεσμία παράδοσης (κώδικας σε Scala ή Java, εκτελέσιμο jar και παρουσίαση): 1η διάλεξη μετά τα Χριστούγεννα.

8 Νοε

Υπενθύμιση: στην αρχή της διάλεξης στις 14/11/2016 θα πραγματοποηθεί η πρώτη γραπτή εξέταση του μαθήματος διάρκειας 30' (βαρύτητα: 15% στον τελικό βαθμό).

10 Οκτ

Επιπλέον εργασίες για διαχέιριση δεδομένων σε MapReduce
  • A survey of large-scale analytical query processing in MapReduce (κατεβάστε από εδώ)
  • Distributed data management using MapReduce (κατεβάστε από εδώ)

10 Οκτ

Διδακτικά Βοηθήματα
  • To βασικό βοήθημα του μαθήματος για τα θέματα Kατανεμημένων Βάσεων Δεδομένων είναι το βιβλίο  Principles of Distributed Database Systems των M. Tamer Ozsu και Patrick Valduriez (2011). Το βιβλίο είναι διαθέσιμο από εδώ. Στα πλαίσια του μαθήματος θα καλυφθoύν τα Κεφάλαια 1, 3, 6-9 και 14.
  • Επίσης, στα πλαίσια του μαθήματος, θα εξεταστούν θέματα που έχουν σχέση με μαζικό παραλληλισμό και το μοντέλο MapReduce. Ένα ελεύθερα διαθέσιμο βοήθημα που συστήνεται είναι το "Data-Intensive Text Processing with MapReduce" των Jimmy Lin και Chris Dyer.