Το τελευταίο απόκτημα της Hortonworks αποτελεί μία εισαγωγή στην δημιουργία ενός προϊόντος διαχείρισης ροής δεδομένων που βασίζεται σε ανοιχτή πηγή.

Ο πωλητής του Hadoop, Hortonworks, αμέσως μετά την κυκλοφορία μίας νέας έκδοσης της διανομής της, απέκτησε μία εταιρία στα πλαίσια που η Hortonworks απαιτεί για την διαχείριση της μετακίνησης των αρχείων προς, από και δίπλα στο Hadoop.

 

Η εταιρία είναι η Onyara, και το πλαίσιο (του οποίου η Onyara είναι και μεγάλος υποστηρικής) είναι το Apache NiFi Project, ένα σύστημα που φτιάχνει γραφικά διαγράμματα για το πως κινούνται τα δεδομένα στο εσωτερικό ενός συστήματος.

Η Hortonworks αντιμετωπίζει το NiFi ως έναν τρόπο να δημιουργήσει μία νέα πλατφόρμα δεδομένων για το Hadoop, που να ασχολείται με δεδομένα που συλλέχθηκαν και αντιμετωπίστηκαν σε αληθινό χρόνο από μία πανοπλία συσκευών “έξυπνων” και μη. Αρχικά το NiFi, ήταν πρόγραμμα της NSA και ήταν ανοιχτής πηγής υπό το Πρόγραμμα Μεταφοράς Τεχνολογιών της Υπηρεσίας, το ίδιο πρόγραμμα αποκρυπτογράφησης που παρείχε και το εργαλείο διαδικτυακής ασφάλειας SIMP.

Από το να προσπαθεί να εφαρμόσει την λειτουργικότητα απευθείας στο Hadoop, η Hortonworks δημιουργεί μία παράλληλη προσφορά προϊόντος, το Hortonworks DataFlow (καμία σχέση με το προϊόν της Google με το ίδιο όνομα). Το DataFlow πωλείται σε εταιρίες που ψάχνουν λύσεις για την διαχείριση δεδομένων εν κινήσει, αλλά και αδρανών δεδομένων.

Το ΝiFi επίσης προορίζεται για καλή συνεργασία με τα άλλα επιτυχημένα προϊόντα του Hadoop όπως το Spark (για την επεξεργασία δεδομένων σε αληθινό χρόνο) και το Kafka (υπηρεσία μηνυμάτων). Ακόμη, υπάρχουν σχέδια για την προσαρμογή των ελεγχόμενων ροών του NiFi στην ήδη υπάρχουσα Πρωτοβουλία Διαχείρισης Δεδομένων της Hortonworks, έτσι ώστε τα δεδομένα που ελέγχονται από το DataFlow να μπορούν να ονομαστούν και να επισημανθούν ακόμη και χώρια από το Hadoop.

Η κύρια αποστολή του Hortonworks είναι να προσθέσει τα ανάμεικτα στοιχεία του NiFi στο Hortonworks, και να παράσχει στο Hadoop όλα τα σχετικά προϊόντα χωρίς τα ιδιόκτητα βάρη. Όλα όμως τα σημάδια δείχνουν πως κάθε είδος καθαρά ανοιχτής πηγής, θα είναι εξαιρετικά δύσκολο.

Τα τελευταία οικονομικά νέα της Hortonworks ήταν ανάμεικτα με αύξηση των καθαρών απωλειών παρά την αύξηση της βάσης των πελατών και την αύξηση των εσόδων του τετραμήνου. Το DataFlow αποδεικνύεται ως προσπάθεια για την δημιουργία μίας νέα πηγής εσόδων για την εταιρία με τον χειρισμό των ήδη υπαρχόντων πελατών αντί για την εύρεση νέων. Με το μέγεθος της συγκεκριμένης αγοράς για τις εμπορικές προσφορές του Hadoop, η προηγούμενη προσέγγιση φαίνεται πιο έξυπνη.