19 Νοεμβρίου 2017

H IBM και το αμερικάνικο τμήμα Ενέργειας συνεργάζονται για την δημιουργία ενός Υπερυπολογιστή που ως επίκεντρο θα έχει τα δεδομένα

Η ΙΒΜ και το τμήμα Ενέργειας των ΗΠΑ συνεργάζονται για την δημιουργία υπολογιστικών συστημάτων τελευταίας γενιάς και υψηλής απόδοσης, τα οποία αποκαλούν «Υπερυπολογιστές που επικεντρώνονται στα δεδομένα». Σε αυτό εμπλέκονται τόσο επιχειρήσεις όσο και η Εθνική Ασφάλεια.

Το μόνο που χρειάστηκε για την έναρξη της Εθνικής Στρατηγικής Υπολογιστικής Πρωτοβουλίας (NSCI),   ήταν η υπογραφή του Προέδρου, Μπάρακ Ομπάμα. Η κίνηση αυτή συνάπτει μία συνεχόμενη συνεργασία μεταξύ της IBM και του τμήματος ενέργειας για την ανάπτυξη υπερυπολογιστών τελευταίας γενιάς.

Όμως αντί να σπαταλήσει επιπλέον δύναμη στην επεξεργασία των υπολογιστικών προβλημάτων, η ΙΒΜ αντιμετωπίζει με ευρύτερες και πιο συστημικές κινήσεις την ροή των δεδομένων μέσω ενός συστήματος και το που μπορεί να επικεντρωθεί ο υπολογισμός ώστε να μπορεί να επεξεργαστεί τα δεδομένα καθώς αυτά κινούνται.

Η λογική αυτή είναι γνωστή ως Υπερυπολογιστική με επίκεντρο στα δεδομένα.

«Το να μετριέται ένας υπολογιστής με βάση τις λειτουργίες του αποτελεί πλέον μία αρχαϊκή ιδέα.» δήλωσε ο David Turek, αντιπρόεδρος της Technical Computing με μία πορεία 25 ετών στον τομέα της Υπερυπολογιστικής.

Αντ’ αυτού είναι καλύτερο κανείς να εξετάσει την εξακλίμακα, που δεν μετριέται με exa-flops αλλά με πολλές διαστάσεις. Σημαίνει την αναβάθμιση της εισαγωγής/ εξαγωγής, την ευρύζωνικότητα της μνήμης, το αποτύπωμα της μνήμης και άλλες παραμέτρους. «Βασίζεται στο πόσο γρήγορα μπορείς να κάνεις την εφαρμογή σου να τρέχει,» εξήγησε. «Το σημείο ροής μπορεί να είναι άσχετο με την ταχύτητα της εφαρμογής.»

Με την πρώτη ματιά, η εξακλίμακα μπορεί να μοιάζει με exabytes δεδομένων που καταναλώνονται από exaflops υπολογιστικής δύναμης. «Η κίνηση των δεδομένων προκαλεί την καθυστέρηση» δήλωσε ο Turek. Πρέπει να αλλαχθεί η αρχιτεκτονική του συστήματος για να επεξεργάζεται τα δεδομένα εκεί που κινούνται, παρά  να τα «πετάει» σε μία παράλληλη παράταξη επεξεργασίας.

«Χρησιμοποιούμε την υποδομή για να μπορέσουμε να αντιμετωπίσουμε το πρόβληα στο σύνολο του.» είπε ο Turek. Αυτό μπορεί να σημαίνει την βασική ανάλυση δεδομένων όσο αυτά είναι ακόμη αποθηκευμένα, ή να γίνεται MapReduce στο δίκτυο καθώς τα δεδομένα ακόμη ρέουν.

Πως λειτουργεί.

Για να παρουσιάσει την λογική αυτή, ο Turek έφερε ως παράδειγμα μία δουλειά που είχε κάνει στο παρελθόν με μία εταιρία πετρελαίου. Η εξερεύνηση για πετρέλαιο βασίζεται σε σεισμικά δεδομένα, τα οποία εξαρχής είναι αρκετά ογκώδη. Οι υπερυπολογιστές εδώ είναι απαραίτητοι για να λειτουργήσουν οι αλγόριθμοι που χρειάζονται για το ξεκαθάρισμα και την ανάλυση αυτών των δεδομένων.

Η πρόσθεση περισσότερων σειρών επεξεργαστών θα αύξανε τον χρόνο λύσης μόνο περί το 2% ή 3% είπε ο Turek. « Η ροή εργασίας είναι τόσο απασχολημένη με την διαχείριση των δεδομένων» που η συγκέντρωση στην δύναμη επεξεργασίας μόνο «δεν είχε γερά θεμέλια ως υπολογιστική στρατηγική.» όπως εξήγησε.

Η ανακοίνωση του Προέδρου Ομπάμα για την NSCI παρέχει ένα επιπλέον στρατηγικό συγκείμενο, περιμένοντας από το συμβόλαιο συνεργασίας αξίας 325 εκατομμυρίων δολαρίων της ΙΒΜ με το τμήμα ενέργειας να παραδώσει 2 υπερυπολογιστές μέχρι το 2017.

Ο πρώτος υπερυπολογιστής θα δοθεί στο Εθνικό Εργαστήριο Lawrence Livermore στην Καλιφόρνια, στο οποίο έχει ανατεθεί η στρατηγική συντήρηση του πυρηνικού οπλοστασίου των ΗΠΑ. (Η τελευταία φυσική εξέταση μίας πυρηνικής κεφαλής στις ΗΠΑ, έγινε το 1996. Όλα τα τεστ που έγιναν μετέπειτα ήταν είτε προσομοιώσεις με τον υπολογιστή, είτε σχέδια πυρηνικών κεφαλών.)

Ο δεύτερος, που είναι γνωστός και ως Summit, θα δοθεί στο Εθνικό Εργαστήριο Oak Ridge στο Τενεσί, όπου ήδη πραγματοποιούνται δοκιμές για έξυπνα ηλεκτρονικά δίκτυα και για την δέσμευση του άνθρακα αλλά θα μπορούσαν επίσης να επεκταθούν και στον τομέα της υπολογιστικής χημείας .

«To Summit θα αντικαταστήσει το Titan Cray XK7 του οποίου η ύψιστη ταχύτητα ήταν 27 petaflops από το 2012. Το Summit θα αγγίζει 40 petaflops άνα κόμβο για το Titan» εξήγησε ο Buddy Bland διευθυντής του Project για το Oak Ridge Leadership Computing Facility του τμήματος ενέργειας. Η Summit όμως θα φέρει μόνο 3.500 κόμβους έναντι 18.000 για το Titan, προσέθεσε και κάθε ένας από τους κόμβους της Summit θα έχουν περίπου μισό terrabyte ενέργειας.

«Στους χρήστες μας θα αρέσει πολύ αυτό» προσέθεσε ο Bland.

«Τώρα στο Titan τα GPUs και τα CPUs δεν έχουν κοινή μνήμη.» συνέχισε ο Bland. «Οι χρήστες πρέπει να μεταφέρουν τα δεδομένα από το ένα στο άλλο.» Το Summit  θα επιτρέψει στα GPUs και τα CPUs να έχουν πρόσβαση στα ίδια δεδομένα από κοινή μνήμη. Αυτό θα οδηγήσει, σύμφωνα με τα λεγόμενα του Bland σε μία «τρομερή βελτίωση της απόδοσης. Είναι πιό εύκολο για τον χρήστη να μην ανησυχεί για την κίνηση των δεδομένων».

Αυτήν τη στιγμή το τμήμα ενέργειας δουλεύει με την ΙΒΜ και την Nvidia προκειμένου να δημιουργήσουν τον κωδικό που χρειάζεται για να χρησιμοποιήσουν το Summit. «Πρέπει να απλώσεις τα δεδομένα στο σύστημα για να εκμεταλλευτείς την ευρυζωνικότητα της μνήμης» είπε ο Bland. Πρόκειται για ακόμη μία λεπτότητα της υπολογιστικής πρακτικής, όπου τα δεδομένα μεταφέρονται από την αργή μνήμη στην γρήγορη μνήμη.

Άλλο ένα πλεονέκτημα που προσθέτει το Summit είναι η πρόχειρη μνήμη. Το Cache,  το οποίο καθορίζει την τοποθεσία των δεδομένων «δεν γνωρίζει τι θα χρειαστεί έπειτα» δήλωσε ο Bland. Η πρόχειρη μνήμη επιτρέπει στους χρήστες να μεταφέρουν δεδομένα στη μνήμη και να τα κρατήσουν εκεί μέχρι να χρειαστεί να τα μετακινήσουν κάπου αλλού.

Για την ΙΒΜ, ο υπερυπολογιστής που επικεντρώνεται στα δεδομένα, εξυπηρετεί επίσης και τον σκοπό της «απόδειξης», που μπορεί να μειωθεί για να εξυπηρετήσει και πιό ταπεινούς σκοπούς των πανεπιστημιακών ιδρυμάτων ή να πουληθεί σε μεγάλες εταιρίες που ασχολούνται με την ανάλυση μεγάλων δεδομένων.

Χρήση στην Εθνική Ασφάλεια και στις Επιχειρήσεις

Ο Turek παραδέχεται ότι η αγορά υπερυπολογιστών τελευταίας τεχνολογίας είναι περιορισμένη σε μερικούς μόνο θεσμούς που λειτουργούν στα απόλυτα άκρα της υπολογιστικής επιστήμης. Η δύναμη που χρειάζεται μόνο για τα 2 αυτά συστήματα του τμήματος ενέργειας είναι περίπου 10 megawatt για την καθεμία (1 megawatt μπορεί να παρέχει ηλεκτρισμό σε περίπου 1.000 σπίτια).

Το ζήτημα όμως δεν μόνο η υπολογιστική τεχνολογία.

Αυτήν τη στιγμή, το ρεκόρ για τον πιό δυνατό υπερυπολογιστή το έχει η Κίνα. Ο Tianhe-2 μπορεί να αποδίδει με 33,86 petaflops, σχεδόν με 2 φορές την ταχύτητα του Titan που αυτήν τη στιγμή χρησιμοποιείται στο Oak Ridge.

O Tianhe-2 χρησιμοποείται από το National University of Defense Technology στο Guangzhou και αποτελεί ένα από τα 4 κέντρα υπερυπολογιστών που σχεδιάστηκαν από τις ΗΠΑ και χρησιμοποιούνται ενάντια στα αμερικάνικα συμφέροντα ασφαλείας. Το κινεζικό πρακτορείο ειδήσεων Xinhua δήλωσε πως ο Tianhe-2 χρησιμοποιείται για γενετική ανάλυση, ανάπτυξη φαρμάκων και αεροδυναμική ανάλυση για αεροσκάφη και τρένα μεγάλης ταχύτητας.

Υπό το NSCI του Ομπάμα, οι ΗΠΑ θα χτίσουν και θα αναπτύξουν ένα σύστημα που θα λειτουργεί με 1 exaflop ή 1.000 petaflops. Αλλά πρέπει να είμαστε προσεκτικοί για το λεγόμενο «Turek’s Asterisk». Καθώς η δύναμη επεξεργασίας μόνο δεν είναι πλέον ο μοναδικός δείκτης για το πόσο δυνατός είναι ένας υπερυπολογιστής.