Γράφει ο Γιώργος Χρυσικός
Big Data Science ή στα ελληνικά η Επιστήμη των Μεγάλων Δεδομένων είναι μία από τις πιο διαδεδομένες και ταχύτατα εξελισσόμενες επιστήμες τα τελευταία χρόνια λόγω της ραγδαίας εξάπλωσης της τεχνολογίας και του αυξανόμενου ψηφιακού μετασχηματισμού της οικονομίας. Αυτή τη στιγμή, ενώ διαβάζεται το παρόν άρθρο, μια τεράστια ροή δισεκατομμυρίων δεδομένων παράγεται και αποθηκεύεται αδιάκοπα ανά δευτερόλεπτο. Φανταστείτε το μέγεθος των δεδομένων ύστερα από μόλις ένα λεπτό ή ακόμα μετά από μία ώρα. Τα δεδομένα δε γεννιούνται σε κάποιο ερευνητικό κέντρο υψηλής τεχνολογίας, αλλά προκύπτουν μέσα από τις εκφάνσεις της ανθρώπινης δραστηριότητας, από τον τρόπο που παράγουμε, καταναλώνουμε και συμπεριφερόμαστε.
Κατ’ αρχάς, τι είναι τα Μεγάλα Δεδομένα (Big Data); Πρόκειται για ένα τεράστιο και πολύπλοκο όγκο δεδομένων που αναπτύσσεται με ταχύτατους ρυθμούς και είναι ανέφικτο να επεξεργαστεί μέσω παραδοσιακών μεθόδων. Τα Big Data αποτελούν μέρος της καθημερινής μας ζωής. Από μια ηλεκτρονική (online) συναλλαγή ή μια τυπική δια ζώσης συναλλαγή σε ένα εμπορικό πολυκατάστημα, μια τράπεζα έως από μια απλή περιήγηση στο διαδίκτυο, στα μέσα κοινωνικής δικτύωσης δημιουργούνται Μεγάλα Δεδομένα. Στα βασικά τους χαρακτηριστικά συγκαταλέγονται τα λεγόμενα ΄5 Vs΄: Volume, Velocity, Variety, Veracity και Value. Το πρώτο χαρακτηριστικό (Volume) αναφέρεται στο τεράστιο μέγεθος των δεδομένων και το δεύτερο χαρακτηριστικό (Velocity) επισημαίνει το ταχύτατο ρυθμό με τον οποίο εισρέουν συνεχώς νέα δεδομένα, επεξεργάζονται και αναλύονται. Μετέπειτα ακολουθεί η ποικιλομορφία (Variety) των πιθανών διαφορετικών τύπων δεδομένων, όπως είναι τα γραπτά ή ηχογραφημένα μηνύματα, οι εικόνες, τα βίντεο κ.α. Άλλο ένα σημαντικό χαρακτηριστικό είναι η αξιοπιστία των δεδομένων (Veracity) δηλαδή η ενδεχόμενη ύπαρξη αβεβαιότητας και σφαλμάτων στα δεδομένα. Για παράδειγμα, θα θεωρούσατε μια δημοσίευση στο Facebook ή στο Twitter ως ένα αξιόπιστο δεδομένο; Πιθανότατα να είναι αναληθές, καθώς υπάρχουν αρκετές φορές πολλοί λογαριασμοί πίσω από τον ίδιο χρήστη στα μέσα κοινωνικής δικτύωσης με αποτέλεσμα να μη διασφαλίζεται ότι τα δεδομένα είναι ποιοτικά και αξιόπιστα. Τέλος, τα Μεγάλα Δεδομένα μπορούν να αποτελέσουν πολύτιμη πηγή αξίας (Value) για τον επιχειρηματικό τομέα.
Η αξιοποίηση της τεράστιας ποσότητας δεδομένων που θα οδηγήσει σε αύξηση της αξίας των επιχειρήσεων προϋποθέτει οι επιχειρήσεις να έχουν στο εργατικό τους δυναμικό Αναλυτές Μεγάλου Όγκου Δεδομένων (Big Data Analysts). Είναι εξειδικευμένοι επαγγελματίες που προέρχονται κατά βάση από τους επιστημονικούς κλάδους των Οικονομικών, της Στατιστικής, της Πληροφορικής και των Θετικών επιστημών και κατέχουν τις γνώσεις και ικανότητες στο να διαχειρίζονται και να αναλύουν πληθώρα δεδομένων εφαρμόζοντας Aλγορίθμους Mηχανικής Mάθησης (Machine Learning Algorithms) με στόχο την εξαγωγή χρήσιμων πληροφοριών και συσχετίσεων που κρύβονται πίσω από τα δεδομένα και μέχρι εκείνη τη στιγμή ήταν άγνωστες. Φυσικά, η διαδικασία της εξόρυξης δεδομένων καθίσταται εφικτή μόνο μέσω των δεξιοτήτων των Αναλυτών Δεδομένων σε λογισμικά επιχειρηματικής ευφυΐας όπως Python, R, Stata, Gretl, SQL, Power BI, Tableau κ.α. Σύμφωνα, με την Ευρωπαϊκή Επιτροπή, μέχρι το 2025, η αγορά Μεγάλων Δεδομένων αναμένεται να φτάσει τα 829 δισεκατομμύρια ευρώ και ο αριθμός των επαγγελματιών στο τομέα των δεδομένων στην Ευρωπαϊκή Ένωση προβλέπεται σχεδόν να διπλασιαστεί σε σχέση με το 2018 αγγίζοντας τα 11 εκατομμύρια.
Η ανάλυση δεδομένων βοηθά τις επιχειρήσεις να λάβουν καλύτερες αποφάσεις και να παραμείνουν ανταγωνιστικές στη σημερινή αγορά. Ολοένα και περισσότερες επιχειρήσεις αρχίζουν να αποκτούν θέση στο ψηφιακό κόσμο δημιουργώντας το δικό τους ηλεκτρονικό κατάστημα και αποθηκεύοντας τα ψηφιακά αποτυπώματα των πελατών τους.
Δηλαδή γνωρίζουν, ποιο προϊόν αγοράζουμε; Πότε το αγοράζουμε; Ποια άλλα προϊόντα παρατηρούμε, άρα ποια προϊόντα τους πρόκειται να αγοράσουμε; Με αυτό το τρόπο οι επιχειρήσεις μπορούν να μάθουν καλύτερα τις αγοραστικές ανάγκες των πελατών τους και ποιο συγκεκριμένα τις προτιμήσεις τους. Η επιχείρηση μπορεί να προχωρήσει σε ανάλυση κατηγοριοποίησης (classification analysis) ταξινομώντας για παράδειγμα τα προϊόντα της ως προϊόντα επιθυμητά ή αυξημένης ζήτησης και λιγότερο επιθυμητά ή μειωμένης ζήτησης. Προβλέποντας την αγοραστική συμπεριφορά των πελατών της, η επιχείρηση μπορεί να δώσει έμφαση στη προσφορά προϊόντων με τη μεγαλύτερη απήχηση και συνεπώς να μειώσει τα κόστη παραγωγής μεγεθύνοντας τα κέρδη της. Παρόμοια πρακτική εφαρμόζεται και στις τράπεζες για τη διάκριση των πελατών τους ως φερέγγυους ή μη φερέγγυους στην εξέταση για τη χορήγηση δανείων.
Επιπρόσθετα, οι επιχειρήσεις μπορούν μέσω της ανάλυσης συσταδοποίησης (clustering analysis) να διαθέτουν διαφορετικές ομάδες πελατών αναγνωρίζοντας άλλους παρόμοιους πελάτες βάσει των δημογραφικών στοιχείων και καταναλωτικών συμπεριφορών. Υπάρχουν διαφορετικά προφίλ πελατών σε καθένα από τα οποία γίνονται διαφορετικές συστάσεις και προσφορές προϊόντων μειώνοντας σημαντικά τις διαφημιστικές δαπάνες. Ηλεκτρονικά καταστήματα, όπως η Amazon και το eBay προωθούν συστάσεις αγοράς προϊόντων βάσει όχι μόνο προηγούμενων αγορών μας αλλά και με γνώμονα τα προϊόντα που έχουν αγοράσει άλλοι παρόμοιοι με εμάς χρήστες.
Στη καθημερινή μας ζωή, έχετε αναρωτηθεί για ποιο λόγο γίνονται συχνές εκπτώσεις σε συγκεκριμένα αγαθά στα σουπερμάρκετ; Μειώνεται το κέρδος των σουπερμάρκετ; Μάλλον όχι. Πάλι κρύβονται από πίσω τα Μεγάλα Δεδομένα. Τα σουπερμάρκετ διατηρούν μεγάλες βάσεις δεδομένων δοσοληψιών από τις οποίες προκύπτουν συνεμφανίσεις μεταξύ διαφορετικών προϊόντων λόγου χάρη ουίσκι και φουντούκια, δηλαδή πολύ μεγάλη πιθανότητα ύπαρξης των προϊόντων αυτών στα καλάθια αγορών των καταναλωτών. Άρα, αν θελήσει το σουπερμάρκετ να αυξήσει, για παράδειγμα, τη πώληση φουντουκιών η οποία είναι περιορισμένη θα μειώσει τη τιμή του ουίσκι. Η μείωση στη τιμή του ουίσκι θα καλυφθεί από τις αυξημένες πωλήσεις φουντουκιών αφήνοντας τα κέρδη ανέπαφα ή ακόμη και αυξημένα.
Τα οφέλη των Μεγάλων δεδομένων δε περιορίζονται μόνο στον επιχειρηματικό τομέα. Τα Μεγάλα Δεδομένα βρίσκονται παντού και συμβάλλουν παντού, από τη πρόβλεψη καλύτερης ιατρικής θεραπείας για την αντιμετώπιση κάποιας χρόνιας ασθένειας μέχρι το ταίριασμα του αριθμού των σουτ, assist, φάουλ μεταξύ κάθε παίκτη του μπάσκετ για τη σύσταση μιας πιο αποδοτικής ομάδας στο NBA. Ωστόσο, έχουν αρχίσει να εγείρονται ανησυχίες γύρω από τη συλλογή δεδομένων, καθώς όλο και περισσότεροι άνθρωποι εκφράζουν έναν έντονο προβληματισμό ότι τα προσωπικά τους δεδομένα θα παραβιαστούν από κακόβουλους και ότι ενέχει κίνδυνος να πέσουν θύματα αισχροκέρδειας. Προς μια εναρμόνιση μεταξύ τεχνητής νοημοσύνης και ανθρωπίνων δικαιωμάτων κατευθύνεται η ΕΕ αφενός μέσω της θέσπισης του κανονισμού προσωπικών δεδομένων (GDPR) που ορίζει τη συγκατάθεση των ανθρώπων για να γίνουν γνωστά τα προσωπικά τους δεδομένα στις επιχειρήσεις και το δικαίωμά τους να ζητήσουν από αυτές τη διαγραφή των προσωπικών τους δεδομένων αλλά και αφετέρου μέσω της στρατηγικής για τη δημιουργία μιας ενιαίας ασφαλής οικονομίας δεδομένων προς όφελος των επιχειρήσεων και ερευνητών βασισμένη στη προστασία των καταναλωτών και της ιδιωτικής ζωής των ευρωπαίων πολιτών.
Βιβλιογραφία
Καθημερινή. Η ανάλυση Big Data ανατρέπει τη ζωή μας (2013). Διαθέσιμο σε
https://www.kathimerini.gr/culture/499216/i-analysi-big-data-anatrepei-ti-zoi-mas/
Μηγιάκης, Π. (2021). Finance Tech: Τα big data «κλειδί» της οικονομικής πολιτικής. Καθημερινή. Διαθέσιμο σε
(Ημ. Επίσκεψης 26-6-2021)
Ναυτεμπορική. Οικονομία και Αγορές. Ποιο θα είναι το εργασιακό μέλλον; (2021). Διαθέσιμο σε
https://m.naftemporiki.gr/story/1731602/seb-poio-tha-einai-to-ergasiako-mellon
(Ημ. Επίσκεψης 24-6-2021)
Europa, Θέματα ΕΕ. Μαζικά Δεδομένα: οι ευκαιρίες και οι κίνδυνοι (2016). Διαθέσιμο σε
(Ημ. Επίσκεψης 24-6-2021)
Europa, Οδηγός για τις επιχειρήσεις στην Ευρώπη. Προστασία δεδομένων στο πλαίσιο του ΓΚΠΔ (2021). Διαθέσιμο σε
(Ημ. Επίσκεψης 24-6-2021)
Fortune Greece. Big Data–Η νέα εμμονή των μεγάλων επιχειρήσεων (2016). Διαθέσιμο σε
https://www.fortunegreece.com/article/big-data-i-nea-emmoni-ton-megalon-epichiriseon/
(Ημ. Επίσκεψης 24-6-2021)
Mills, T. Five Benefits of Big Data Analytics And How Companies Can Get Started (2019). Forbes. Available at
(Access on 24-6-2021)
LAWSPOT. Big Data: ορισμός, οφέλη και προκλήσεις (infographics) (2021). Διαθέσιμο σε
https://www.lawspot.gr/nomika-nea/big-data-orismos-ofeli-kai-prokliseis-infographics
(Ημ. Επίσκεψης 24-6-2021)
Πηγή εικόνας: https://www.shutterstock.com/el/image-vector/big-data-visualization-fractal-element-lines-626375033