Ομιλία Μωϋσή Μπουντουρίδη στο Ε.Κ. Αθηνά

mosesΣτο πλαίσιο των εβδομαδιαίων διαλέξεων που γίνονται στο Ε.Κ. Αθηνά, τη Δευτέρα 5 Δεκεμβρίου 2016 και ώρα 14.00, στην αίθουσα Zampolli, θα πραγματοποιηθεί ομιλία του καθηγητή Μωϋσή Μπουντουρίδη (http://www.math.upatras.gr/~mboudour/) με θέμα “Ανάλυση Δικτύων από το Twitter”.

Περίληψη:

Στην παρουσίαση αυτή θα μιλήσουμε για την εξαγωγή και την δικτυακή ανάλυση των μεγάλων δεδομένων (big data) από το Twitter. Για το πρώτο σκέλος, θα περιγράψουμε πώς χρησιμοποιούμε αφενός εργαλεία της Python για την εξόρυξη των streaming data από το Twitter API και αφετέρου της Ruby για το scraping δεδομένων από σελίδες του advanced search του Twitter. Το δεύτερο και κύριο σκέλος της παρουσίασης εστιάζεται στην ανάλυση των δεδομένων αυτών μέσα από τις σχετικές μεθοδολογίες της  Επιστήμης των Δικτύων. Εξ αιτίας του μεγέθους των μεγάλων δεδομένων που εξάγονται από το Twitter, η δικτυακή οπτικοποίηση (visualization) του συνολικού (global) δικτύου είναι πολύ δύσκολο να οδηγήσει από μόνη της σε χρήσιμα συμπεράσματα για την υπό εξέταση δικτυακή δομή. Για τον λόγο αυτό θα ακολουθήσουμε δυο τεχνικές τοπικού τεμαχισμού του συνολικού δικτύου σε μικρότερα δίκτυα τα οποία μπορούν να αναλυθούν πλήρως και αποτελεσματικά από τις υπάρχουσες μεθοδολογίες της Επιστήμης των Δικτύων. Πιο συγκεκριμένα, μας ενδιαφέρουν δυο ιδιαίτερες τεχνικές τεμαχισμού (και αποσύνθεσης-decomposition) μεγάλων δικτύων. Η πρώτη τεχνική βασίζεται στην αποκομή του υπογράφου των κόμβων που σχηματίζουν μεταξύ τους ακμές με βάρη μεγαλύτερα ή ίσα κάποιας τιμής k. Έτσι σχηματίζονται διάφορα δίκτυα τα οποία τα ονομάζουμε k-edge-weight-cores. Η δεύτερη τεχνική στηρίζεται στην αποκοπή των ονομαζόμενων εγωκεντρικών (υπο-)δικτύων, που είναι οι υπογράφοι οι οποίοι σχηματίζονται από ένα ή περισσότερα “εγώ” (“ego”) και όλους τους γείτονές τους, τους “άλλους” (“alters”). Τα δίκτυα αυτά ονομάζονται (multi-)egocentric graphs. Από την άλλη μεριά, οι κύριοι τύποι των δικτύων που μπορούν να εξαχθούν από μεγάλα δεδομένα του Twitter είναι δυο: graphs of co-occurrent hashtags και graphs of users’ mentions. Στην πρώτη περίπτωση, οι κόμβοι είναι τα hashtags και οι ακμές οι συνεμφανίσεις των hashtags, οπότε ο γράφος των συνεμφανιζόμενων hashtags είναι μη κατευθυνόμενος. Στην δεύτερη περίπτωση, οι κόμβοι είναι (Twitter) users και οι ακμές οι αναφορές (mentions, replies, RTs κλπ.) που κάνουν οι users μεταξύ τους, οπότε ο γράφος των αλληλο-αναφερόμενων χρηστών είναι κατευθυνόμενος. Για όλες αυτές τις περιπτώσεις κάνουμε τις εξής δικτυακές αναλύσεις: (1) κατανομές και ιστογράμματα βαθμών κόμβων και βαρών ακμών, (2) κεντρικότητες κόμβων και (3) ανίχνευση κοινοτήτων (communities) μέσω του αλγορίθμου Louvain της μεγιστοποίησης του modularity του γράφου. Συμπερασματικά, αυτό που επιτυγχάνουμε με τον τεμαχισμό και την δικτυακή ανάλυση των δικτύων των μεγάλων δεδομένων του Twitter είναι να κατανοήσουμε καλύτερα την πολύπλοκη δυναμική ενός μεγάλου δικτύου μέσω της χρήσης μιας υπολογιστικής πλατφόρμας ευέλικτης κατευθυνόμενης πλοήγησης-εστίασης  στα μέρη του δικτύου που μας ενδιαφέρουν περισσότερο και μέσα στα οποία μπορούμε να αναγνωρίσουμε ευκολότερα τους “κρυμμένους” μηχανισμούς δικτυακής αλληλεξάρτησης (οι οποίοι είναι αδύνατο να ανιχνευτούν μέσα στις απλές οπτικοποιήσεις του συνολικού δικτύου ή μέσα από τους πολύ απαιτητικούς και χρονοβόρους υπολογισμούς για όλο το μεγάλο δίκτυο). (Κάποιες από τις υπολογιστικές έννοιες που χρησιμοποιούμε εδώ μπορούν να βρεθούν στην πρόσφατη εργασία μας: http://link.springer.com/article/10.1140%2Fepjst%2Fe2016-02673-0).

Σύντομο βιογραφικό:

Ο Μωυσής Α. Μπουντουρίδης είναι Αναπληρωτής Καθηγητής στο Τμήμα Μαθηματικών του Πανεπιστημίου Πατρών. Είναι απόφοιτος Χημικών Μηχανικών του ΕΜΠ και διδάκτορας Μηχανικής του Πανεπιστημίου Johns Hopkins. Τα ερευνητικά του ενδιαφέροντα βρίσκονται σε περιοχές των υπολογιστικών και εφαρμοσμένων μαθηματικών (τόσο σε φυσικές, όσο και σε κοινωνικές επιστήμες), όπως τα δυναμικά συστήματα, τα πολύπλοκα δίκτυα, τα κοινωνικά δίκτυα και η μαθηματική κοινωνιολογία.

preloader