IVML  
  about | r&d | publications | courses | people | links
   

Θ. Ασπρογέρακα
Ανάλυση Συναισθήματος σε κείμενο από tweets με Μεθόδους Μη Επιβλεπόμενης Μηχανικής Μάθησης
School of Electrical and Computer Engineering, National Technical University of Athens
ABSTRACT
Αντικείμενο της παρούσας διπλωματικής είναι η Ανάλυση Συναισθήματος σε κείμενο μικρού μήκους που προέρχεται από δικτυακές πηγές, με χρήση Μηχανικής Μάθησης. Το σύνολο δεδομένων που χρησιμοποιείται αποτελείται από δημοσιεύσεις του ιστοχώρου κοινωνικής δικτύωσης www.twitter.com, οι οποίες έχουν κοινό θέμα τον τουρισμό στην Ελλάδα. Στόχος μας είναι η κατάταξη των δημοσιεύσεων (tweets) στις εξής τέσσερις κλάσεις συναισθήματος: θετική (positive) κλάση, αρνητική (negative) κλάση, ουδέτερη (neutral) κλάση, απροσδιόριστη (undefined) κλάση με τη βοήθεια Μη Επιβλεπόμενης Μηχανικής Μάθησης. Αρχικά, γίνεται μια εισαγωγή στην έννοια της Ανάλυσης Συναισθήματος και ακολούθως γίνεται εκτενής αναφορά στις δύο βασικές μεθόδους που εφαρμόζονται στα προβλήματα Ανάλυσης Συναισθήματος. Αυτές είναι η βασισμένη σε λεξικό μέθοδος και η βασισμένη σε Μηχανική Μάθηση μέθοδος, με το ενδιαφέρον μας να επικεντρώνεται στη δεύτερη. Στο τμήμα που αναφέρεται στην βασισμένη σε λεξικό μέθοδο γίνεται περιγραφή της μεθόδου, των δυσκολιών και των τρόπων αντιμετώπισης τους και τέλος περιγράφεται η δημιουργία διαδεδομένων Λεξικών Συναισθήματος και γίνεται αναφορά σε σημαντικές σχετικές δημοσιεύσεις. Στο τμήμα που αφορά τη μέθοδο που βασίζεται στη Μηχανική Μάθηση γίνεται περιγραφή των κατηγοριών Μηχανικής Μάθησης γενικά και ειδικά για το πρόβλημα της Ανάλυσης Συναισθήματος. Αναλύονται τα στάδια και οι παράμετροι της μεθόδου και περιγράφονται βασικοί αλγόριθμοι για κάθε μία από τις κατηγορίες Μηχανικής Μάθησης στην Ανάλυση Συναισθήματος. Ακολούθως, γίνεται αναφορά στα προβλήματα της μεθόδου, στους τρόπους αξιολόγησης ενός συστήματος Ανάλυσης Συναισθήματος και σε διάφορα διαθέσιμα datasets. Τέλος, γίνεται ειδική αναφορά στη διαχείριση των tweets και κλείνουμε με μια σύντομη περιγραφή σχετικών δημοσιεύσεων και με την παράθεση διαθέσιμων APIs Ανάλυσης Συναισθήματος. Στη συνέχεια, έχοντας πλέον περιγράψει θεωρητικά όλα τα απαραίτητα στάδια και παραμέτρους εστιάζουμε στην εφαρμογή της μεθόδου Μηχανικής Μάθησης στα δεδομένα μας. Δοκιμάζουμε διάφορες εκδοχές προεπεξεργασίας των δεδομένων, διαφορετικούς αλγορίθμους και μεταβολή διάφορων παραμέτρων του προβλήματος. Έμφαση δόθηκε στην Μη Επιβλεπόμενη Μηχανική Μάθηση (συσταδοποίηση). ωστόσο για βαθύτερη κατανόηση και μελέτη των αποτελεσμάτων έγιναν δοκιμές και με τη μέθοδο Επιβλεπόμενης Μάθησης. Μελετώντας με προσοχή τα αποτελέσματα που προκύπτουν από τις διάφορες δοκιμές, συμπεραίνουμε ότι η συσταδοποίηση δεν μπορεί να δώσει ικανοποιητικά αποτελέσματα στο πρόβλημα της Ανάλυσης Συναισθήματος σε tweets λόγω του ότι η μέθοδος προσπαθεί να εντοπίσει ομοιότητες μεταξύ των tweets αγνοώντας εντελώς τις διαφορές που ενδεχομένως να είναι πιο σημαντικές. Ωστόσο, μέσα από τη μελέτη των αποτελεσμάτων καταλήγουμε σε σημαντικά ευρήματα που θα μπορούσαν να φανούν χρήσιμα σε μελλοντικές έρευνες.
09 March , 2016
Θ. Ασπρογέρακα, "Ανάλυση Συναισθήματος σε κείμενο από tweets με Μεθόδους Μη Επιβλεπόμενης Μηχανικής Μάθησης", School of Electrical and Computer Engineering, National Technical University of Athens
[ save PDF] [ BibTex] [ Print] [ Back]

© 00 The Image, Video and Multimedia Systems Laboratory - v1.12