Με 50 ΤΒ δεδομένα από μηχανή που παράγονται καθημερινά και με 100PB δεδομένων που χρειάζεται να προσπελαστούν συνολικά, η πρόκληση στα δεδομένα του eBay είναι πραγματικά αστρονομική.

Αυτός ο κατακλυσμός δεδομένων βοηθά το eBay να συναγωνιστεί τη γνώση των πελατών, που την χρησιμοποιούσαν όταν πήγαιναν σε ένα κατάστημα. Η μόνη διαφορά είναι ότι τώρα η προσπάθεια είναι για μια ιστοσελίδα διαδικτυακών δημοπρασιών.

Μιλώντας στο συνέδριο Gartner CRM στο Λονδίνο, ο David Stephenson, επικεφαλής των παγκόσμιων επιχειρηματικών analytics του eBay, ανέφερε πως στόχος της ιστοσελίδα είναι να κάνει τις αγορές ευκολότερες. Η εταιρεία χρησιμοποιεί τα analytics για να κατανοήσει καλύτερα τους πελάτες της. Η φιλοδοξία του είναι να γίνει πιο προσωπική, σαν ένα συνοικιακό κατάστημα.

Διαχείριση της συμπεριφοράς των πελατών

Ο Stevenson παραδέχτηκε ότι το eBay ξεκινά τον αγώνα του στη προσπέλαση της σειράς δεδομένων των πελατών.

Η πρόκληση των big data για το eBay είναι ότι με την απλή επιχειρηματική ερώτηση «Ποια αντικείμενα εμφανίστηκαν στην αναζήτηση χθες;» περιλαμβάνει προσπέλαση πέντε δισεκατομμυρίων προβολών σελίδων. «Είναι λοιπόν μεγάλο πρόβλημα να κάνεις μια τόσο απλή επιχειρηματική ερώτηση,» ανέφερε ο Stephenson.

Αλλά το eBay χρειάζεται κάτι παραπάνω από απλές ερωτήσεις. Ο Stephenson ανέφερε πως η ιστοσελίδα σκόπευε να κάνει ανάλυση συναισθημάτων, ανάλυση δικτύων και εικόνων, τα οποία δεν μπορούν να συμπεριληφθούν σε μια απλή παραδοσιακή βάση δεδομένων.

Όσον αφορά τα δεδομένα των πελατών, το eBay χρησιμοποίησε ένα δείγμα της τάξεως του 1% και απέρριψε όλο το υπόλοιπο, ανέφερε ο Stephenson.

«Υπάρχει μία ένταση, είτε για την επιβολή δομών σε τεράστιες ποσότητες δεδομένων απορρίπτοντας άλλα δεδομένα, είτε γιατί θα έπρεπε να κρατηθούν όλα τα δεδομένα, αλλά χωρίς να μπορεί κανείς να τα αξιοποιήσει.

Έτσι λοιπόν ξεκίνησε μια καινοτομία το eBay. Επτά χρόνια πριν, η εταιρεία είχε ξεκινήσει ένα πρότζεκτ αποθήκευσης όλων των δεδομένων των πελατών της. Χρειαζόταν λοιπόν ένα προϊόν που να μπορεί να αποθηκεύει εκατοντάδες ΡΒ με δεδομένα πελατών, αλλά και να είναι εύκολο στη χρήση από μόλις πέντε άτομα, και εύκολα να έχουν πρόσβαση οι αναλυτές.

Η εταιρεία εργάστηκε με την Teradata για την δημιουργία συσκευής με εκατοντάδες πληροφορίες πελατών. Το σύστημα είχε κατασκευαστεί με λογισμικό παλιό, ίσα ίσα για την προσπέλαση των δεδομένων και την φθηνή του αποθήκευση.

Το τελικό αποτέλεσμα ήταν μια αποθήκη δεδομένων με το όνομα Singularity.

Το eBay, μαζί με το Singularity, χρησιμοποιούσε και το Hadoop, δημιουργώντας έτσι ένα τρίγωνο analytics δεδομένων. Η ιστοσελίδα δημοπρασιών δημιούργησε 20.000 κόμβους σε συμπλέγματα Hadoop, χωρητικότητας 80 ΡΒ. Αυτά, σε συνεργασία με την αποθήκη δεδομένων Teradata δίνουν όλα τα δυνατά εργαλεία στο eBay για να κάνει ανάλυση δεδομένων για να παρακολουθεί τους πελάτες του.

Η πραγματική αξία των analytics

Ο Stephenson ανέφερε ότι η Singularity αποδεικνύει την αξία του στη σελίδα του eBay, και μπορεί να χρησιμοποιηθεί για να τη σφυγμομέτρηση της αγοράς. Αυτό επιτρέπει στο eBay να ελέγχει ιδέες και να παρακολουθεί τι πραγματικά λειτουργεί, όπως π. χ. αν οι επισκέπτες της σελίδας προτιμούν μεγάλες εικόνες στα αποτελέσματα αναζήτησης.

Η τεχνολογία μπορεί να δώσει και στοιχεία για την δύναμη στην αναζήτηση, αυτό που αναφέρει ο Stephenson ως «οικονομολόγος στο κουτί». Είναι πιθανό το eBay να παρουσιάσει συμβουλές αναζήτησης που βασίζεται σε θέματα που έχουν ήδη ρωτήσει οι χρήστες. «Οποιαδήποτε ερώτηση τεθεί υπάρχει ήδη στο αρχείο μας,» ανέφερε.

Αυτές οι δυνατότητες αναζήτησης επιτρέπουν σε έναν πωλητή του eBay να καθορίσει αν είναι καλύτερο να ρίξει μια τιμή ή αν πραγματικά αξίζει η δωρεάν αποστολή, καθώς και πολλές άλλες ερωτήσεις που σχετίζονται με την επιτυχή πώληση αντικειμένων στο eBay.