[Madgik] Παρουσίαση Διπλωματικής Εργασίας: Δημήτρης Σπυρόπουλος, Δευτέρα 9/9, 3:30μμ, Αίθ. Α56

Ημερομηνία Διεξαγωγής: 
09/09/2019 - 15:30 - 16:30

ΠΕΡΙΛΗΨΗ:
Στις μέρες μας, η ανάγκη για γρήγορη και αποδοτική επεξεργασία τεράστιων ποσοτήτων δεδομένων οδήγησε στην ανάπτυξη συστημάτων τα οποία τρέχουν πάνωαπό συστάδες υπολογιστών, όπως το Apache Spark. Ένα πολύ συχνό πρόβλημα τέτοιων συστημάτων είναι να βρεθούν οι βέλτιστες τιμές των παραμέτρων τους, με βάση το προς-εκτέλεση ερώτημα. Η παρούσα δουλειά επεκτείνει ένα σύγχρονο σκιαγράφο συστήματος για το Apache Spark, και δικαιλογεί την υπεροχή των fat executors σε εκτέλεση αναλυτικών ερωτημάτων. Επιπλέον, ο αριθμός και το είδος των πόρων που ένα σύστημα χρησιμοποιεί είναι ζωτικής σημασίας για την απόδοση του. Οι πάροχοι υπολογιστικών νέφων προσφέρουν μεγάλη ποικιλία πόρων διαφορετικής επεξεργαστικής ισχύος και κόστους, αφήνοντας τον χρήστη να επιλέξει αυτούς που θα δεσμευτούν για την εκτέλεση του ερωτήματος του. Η δουλειά αυτή μελετά το συγκεκριμένο πρόβλημα και παρέχει έναν νέο αλγόριθμο που εξερευνά τον χρονο- προγραμματιστικό χώρο των ομοιογενών υπολογιστικών συστάδων. Ο αλγόριθμος παράγει ένα σύνολο pareto χρονοπρογραμμάτων, αφήνοντας τον χρήστη να επιλέγει την συστάδα που ταιριάζει στις ανάγκες του. Με βάση το σημείο αναφοράς TPC-H, ο προτεινόμενος αλγόριθμος πετυχαίνει 6,8% λιγότερο χρόνο εκτέλεσης και 7,03% λιγότερο κόστος, όταν χρησιμοποιείται η ίδια συστάδα υπολογιστικών πόρων.

Η ομιλία αυτή αποτελεί τη δημόσια παρουσίαση της διπλωματικής εργασίας του ομιλητή.

 

Σεμινάριο