26 Σεπτεμβρίου 2017

Τα 4 πιο συνηθισμένα λάθη που κάνουν οι Μάνατζερ με τα Big Data

Πολύς λόγος γίνεται τώρα τελευταία για τα δεδομένα και τις αναλύσεις. Οι επιχειρήσεις συνεχώς προσπαθούν να βρουν τρόπους για να συλλέξουν και να αναλύσουν πολλά δεδομένα, με τις συνέπειες αν δεν γίνει αυτό να τους έχουν γίνει γνωστές. Γίνεται μια προσπάθεια από τους μάνατζερ των εταιρειών να βγάλουν χρήσιμα συμπεράσματα και γνώση από τα δεδομένα.

Ορίστε τα τέσσερα συνηθέστερα λάθη που κάνουν στην προσπάθεια τους:

 

1. Η πρώτη πρόσκληση που μειώνει την αξία των big data για τις επιχειρήσεις είναι η συμβατότητα. Τα δεδομένα προέρχονται από πολλές διαφορετικές πηγές και είναι πολλών διαφορετικών μορφών, τύπων και κωδικοποιήσεων. Αν δεν μπορούν οι επιχειρήσεις να διαχειριστούν αυτό το θέμα τότε δύσκολα μπορούν να επωφεληθούν από όλα αυτά τα δεδομένα. Οι επιχειρήσεις απαντούν σε αυτό το πρόβλημα με τις «λίμνες δεδομένων» όπου κρατούν τεράστια μεγέθη μη δομημένων δεδομένων.


2. Δεν καταλαβαίνουν τα όρια των μη δομημένων δεδομένων. Αυτή είναι η δεύτερη πρόκληση. Αν και έχει γίνει σημαντική πρόοδος στα δεδομένα γραπτής φυσικής γλώσσας/κειμένου, όπου με διάφορες τεχνικές διαχειρίζονται όπως δομημένα δεδομένα, μορφές όπως βίντεο ακόμα αναλύονται πολύ δύσκολα. Σε αυτό το τομέα οι επιχειρήσεις είναι πιο πετυχημένες, αφού έχουν αποκτήσει εμπειρία στη χρήση μη δομημένων δεδομένων στη πράξη.


3. Υποθέτουν ότι οι συσχετίσεις που ανακαλύπτουν στα δεδομένα σημαίνουν κάτι. Όταν το μέγεθος των δεδομένων είναι πολύ μεγάλο είναι αναπόφευκτο να βρεθούν αριθμοί που είναι παρόμοιοι μεταξύ τους, άρα να ανακαλυφθούν ψεύτικες συσχετίσεις οδηγώντας έτσι τους μάνατζερ σε λάθος αποφάσεις. Χρειάζεται καλός σχεδιασμός, εφαρμογή και αξιολόγηση των αποτελεσμάτων πριν χρησιμοποιηθούν επιπλέον τεχνικές προσομοίωσης και πειραμάτων για να αποφασιστεί αν μπορούν τα αποτελέσματα να χρησιμοποιηθούν για λήψη αποφάσεων ή αν μπορούν να γενικευτούν. Όμως, συχνά το μέγεθος των δεδομένων αντί για όφελος βάζει εμπόδια στις επιστημονικές μεθόδους. Δεν είναι τυχαίο ότι η google συχνά χρησιμοποιεί ένα τυχαίο δείγμα από το 0.1% των διαθέσιμων δεδομένων της. Επίσης, τα στατιστικά τεστ και οι υποθέσεις επηρεάζονται άμεσα από το μέγεθος των δεδομένων.


4. Υποτιμούν τα προσόντα των εργαζομένων που είναι απαραίτητα. Πέρα από τις μεθόδους που περιγράψαμε νωρίτερα, οι επιχειρήσεις μπορούν να χτίσουν αλγόριθμους για αυτή τη δουλειά. Οι αλγόριθμοι αυτοί μπορούν να ξεχωρίζουν τα σημαντικά κομμάτια των δεδομένων που προσφέρουν την απαραίτητη πληροφορία για το εκάστοτε ζήτημα. Αν και η δύναμη της πρόβλεψης αυξάνεται όσο μεγαλώνει το μέγεθος των δεδομένων, από ένα σημείο και μετά η αύξηση αυτή φαίνεται να μην προσφέρει πολλά στη πρόβλεψη. Για την κατασκευή καλύτερων αλγορίθμων είναι απαραίτητη η πρόσληψη καλύτερων data scientists.

 

Συνοψίζοντας, τα big data από μόνα τους είναι απίθανο να είναι χρήσιμα. Πρέπει να συνδυαστούν με τα κατάλληλα προσόντα, εργαλεία και διαχείριση. Πολλές φορές φαίνεται ότι είναι φθηνό να αποκτηθούν τα δεδομένα που χρειάζονται και ακριβή η εύρεση του κατάλληλου προσωπικού για την αξιοποίηση τους. Μάλλον αξίζει το κόπο και επιστρέφει αξία στην επιχείρηση.