28 Μαρτίου 2024

Η Hadoop στην υπηρεσία της ανάλυσης μεγάλων όγκων δεδομένων

Το πρόβλημα των “big data” μετατρέπεται σε ένα μεγάλο πεδίο μάχης για τους πωλητές και η αψιμαχία που επίκειται έχει να κάνει με την παροχή της λειτουργικότητας για αποθήκευση και ανάλυση πολύπλοκων και ογκωδών τύπων δεδομένων που οι επιχειρήσεις ελπίζουν να εκμεταλλευτούν. Τα τελευταία λίγα χρόνια, οι πωλητές ανέπτυξαν πλατφόρμες και συσκευές big data με στόχο την ενίσχυση της αποθήκευσης και των προγραμμάτων analytics για τις επιχειρήσεις.

 

Κάποιοι ενσωμάτωσαν στις προσφορές τους το δημοφιλές Apache Hadoop, ένα open source σύστημα αποθήκευσης και επεξεργασίας ογκωδών σετ δεδομένων. Η Hadoop μπορεί να είναι μια απάντηση για τον όγκο και την ταχύτητα των big data, δυο από τα τρία χαρακτηριστικά που χρησιμοποιούνται συνήθως για να ορίσουν τον όρο, αλλά το τελευταία χαρακτηριστικό, η ποικιλία, είναι πιο το απαιτητικό, ιδιαίτερα όσον αφορά την ανάλυση.

 

«Μερικές φορές, όταν οι άνθρωποι μιλούν για big data, μιλούν για πραγματικά μεγάλους όγκους δεδομένων, κι εκεί είναι που λύσεις όπως η Hadoop μπορούν να σας βοηθήσουν», ανέφερε η Yvonne Genovese, business applications analyst στη Gartner Inc., που εδρεύει στο Stamford στο Κονέκτικατ. «Στις περισσότερες περιπτώσεις, όταν οι πελάτες κοιτάνε στο Web και στα social data, δεν τους ενδιαφέρει τόσο ο όγκος όσο ο τύπος των δεδομένων που συναντούν. Αυτός είναι ένας από τους λόγους που η πλατφόρμα big data της Hewlett-Packard που πρόκειται να λανσαριστεί σύντομα προκαλεί σοκ. Η HP Next Generation Platform χρησιμοποιεί την τεχνολογία από δυο εταιρείες που αγόρασε νωρίτερα φέτος: τη Vertica Systems, που απέκτησε το Μάρτιο και την Autonomy που απέκτησε τον Οκτώβριο. Συνδυάζοντας την αναλυτική βάση δεδομένων για δομημένα δεδομένα της Vertica με τα εργαλεία της Autonomy για μη δομημένα δεδομένα στο ίδιο περιβάλλον θα μπορούσε να σταθεροποιήσει τη θέση της Hewlett-Packard στο πεδίο μάχης των big data και να σηκώσει τη μπάρα όσον αφορά τις προσφορές των πωλητών.