8 Νοεμβρίου 2024

Η πρόκληση των Analytics στον κόσμο του μη δομημένου κειμένου

Τα Analytics είναι αναμφισβήτητα ένας από τους πιο σημαντικούς μηχανισμούς για διατήρηση του ανταγωνισμού στην τεχνολογικά αναπτυγμένη αγορά εργασίας. Δυστυχώς, οποιαδήποτε επεξεργασία ανάλυσης είναι ολοκληρωμένη μόνο για τα δεδομένα που ερεύνησε -  και αυτά τα δεδομένα είναι προσβάσιμα μόνο όταν βρίσκονται σε φορμάτ που μπορεί να χρησιμοποιηθεί. Έχει αποδεχθεί ότι η μετατροπή μη δομημένου κειμένου σε δεδομένα προς ανάλυση είναι μεγάλη πρόκληση. Αλλά για την εταιρία, τα αποτελέσματα θα δείξουν πως αξίζουν την επένδυση.

Η δυναμική της ανάλυσης κειμένου

Σύμφωνα με την Rebecca Wettemann από την Nucleus Research, στο σύγγραμμά της «The Real Benefits from Text Mining» αναφέρει πώς «Η εξόρυξη κειμένου μπορεί να βοηθήσει τις εταιρίες να αυξήσουν τις πληροφορίες τους για τα προϊόντα, τις υπηρεσίες, τους ανταγωνιστές και τους πελάτες για να αυξήσουν την ικανοποίηση των πελατών». Από το 2008, όταν η Nucleus ερευνούσε το ζήτημα, οι εταιρίες πέτυχαν μείωση των εξόδων, αύξησαν την παραγωγικότητά τους, το μάρκετινγκ τους επωφελήθηκε, και όλα αυτά χάρη στην εξόρυξη κειμένου. Σήμερα, ο όγκος και η ποικιλία των πηγών δεδομένων που μπορούν να εξορυχτούν από τις πληροφορίες είναι μεγαλύτερος από ποτέ – και τα εργαλεία επεξεργασίας και ανάλυσης δεδομένων ωριμάζουν επίσης.

Πώς συνδέεται το tagging με τα  analytics στον επιχειρηματικό κόσμο;


Σύμφωνα με τον James Niehaus, αντιπρόεδρο Analytics & Ψηφιακής στρατηγικής της Ensighten, η διαχείριση λογισμικού tag έχει ενσωματωθεί στις λύσεις analytics διαδικτύου όπως στα Google Analytics, Adobe SiteCatalyst, IBM Coremetrics, και Web Trends. Τα συστήματα βελτιστοποίησης όπως Monetate και Optimizely είναι επίσης συχνά εργαλεία ΒΙ που χρησιμοποιούν δεδομένα tag, ενώ οι εταιρίες προσπαθούν να μάθουν όλο και περισσότερα από τα μη δομημένα κείμενα. Η ίδια η ανάλυση περνά από διάφορους πειραματισμούς με τεστ πολυμεταβλητών (MVT) για να βρεθούν ακόμη περισσότερες πληροφορίες για την συμπεριφορά των χρηστών. Το Tagging λειτουργεί πολύ καλά και στη ροή της εργασίας γιατί ως ιδέα είναι πολύ απλό και λειτουργεί με διάφορα συστήματα ΒΙ.

Υπάρχει όριο πληροφοριών που μπορεί να εξαχθεί από μη δομημένο κείμενο;

Ενώ η εξόρυξη κειμένου έχει σχεδιαστεί για να φέρνει στο φως νέες πληροφορίες, πολλές φορές μπορεί να αποκαλύψει πληροφορίες που θα ήταν καλύτερο να μείνουν κρυφές. Σε τέτοιες περιπτώσεις, είναι σημαντικό να καθορίζει κανείς τι θέλει να αφήσει απέξω και τι να παρουσιάσει, όπως για παράδειγμα την μη δημοσιοποίηση προσωπικών δεδομένων, που το tagging μπορεί να τα προστατεύσει.

Σε μεγαλύτερη κλίμακα, ακόμη και με τον πλούτο των πληροφοριών να είναι κρυμμένος στη ροή των Big Data, δεν είναι όλα τα στοιχεία σχετικά. Το να γνωρίζει κανείς τι πρέπει να παραβλέψει είναι εξίσου σημαντικό με το να γνωρίζει τι πρέπει να βρει. Όσο το tagging γίνεται κοινότυπο, οι εταιρίες θα αντιμετωπίζουν νέες ερωτήσεις για το πότε έχουν ξεπεράσει το όριο. Ίσως θα έρθει η μέρα που ακόμη και τα tags δεν θα χρειάζεται να ελέγχονται.