IVML  
  about | r&d | publications | courses | people | links
   

Δ. Σουφλερός
Βάση οπτικών δεδομένων για τη μοντελοποίηση και ανίχνευση της προσοχής του χρήστη σε περιβάλλοντα φυσικής αλληλεπίδρασης
School of Electrical and Computer Engineering, National Technical University of Athens
ABSTRACT
Η ανάλυση κινούμενης εικόνας και η εξαγωγή πληροφοριών για τα αντικείμενα που περιέχει και τις δραστηριότητές τους αποτελεί έναν σημαντικό κομμάτι του τομέα της όρασης υπολογιστών. Ειδικά η ανθρώπινη συμπεριφορά και η κατανόηση της από τον υπολογιστή ερευνώνται διεξοδικά τα τελευταία χρόνια και τα αποτελέσματα που προκύπτουν έχουν άμεση εφαρμογή σε τεχνολογίες αιχμής, διευρύνοντας ακόμη περισσότερο τους ορίζοντες για περαιτέρω μελέτη και εξέλιξη. Η παρούσα διπλωματική εργασία ασχολείται με την ανίχνευση της θέσης του κεφαλιού του ανθρώπου και την εκτίμηση της κίνησης του στο χώρο. Για τον λόγο αυτό δημιουργήθηκε μία βάση προσώπων σε ακολουθίες καρέ με είκοσι βίντεο καταγεγραμμένα σε τυπικές συνθήκες ενός εργασιακού χώρου, με πολύπλοκο περιβάλλοντα χώρο με έντονη ανθρώπινη δραστηριότητα και τεχνητό φωτισμό. Τα βίντεο προέρχονται από δέκα εθελοντές που κλήθηκαν να πραγματοποιήσουν κινήσεις σε δύο διαφορετικές συνεδρίες. Στην μεν πρώτη κινούνται ελεύθερα με αυτόβουλες περιστροφικές ή μεταφορικές κινήσεις του κεφαλιού σε οριζόντιο και κάθετο άξονα, στην δε δεύτερη ακολουθούν ένα προκαθορισμένο μοτίβο κινήσεων που συνδυάζει αλλαγές στην πόζα του κεφαλιού και της κατεύθυνσης του βλέμματος. Για την ανίχνευση της στάσης του κεφαλιού κατασκευάστηκε και χρησιμοποιήθηκε μία πρότυπη διάταξη τριών φωτοδιόδων τοποθετημένη στο κεφάλι. Με την βοήθεια της, ο αλγόριθμος που υλοποιήθηκε σε Matlab εντοπίζει την θέση των φωτοδιόδων, εκτιμά την στάση του κεφαλιού σε κάθε καρέ του βίντεο και εξάγει πληροφορίες σχετικά με την γωνία περιστροφής του κεφαλιού και την θέση του. Είναι σε θέση να ιχνηλατήσει τις φωτοδιόδους και απομονώσει τα σημεία ενδιαφέροντος σε σύνθετο φόντο με κινούμενα αντικείμενα, έντονο φωτισμό και αντανακλάσεις. To ground truth που προκύπτει από την ανάλυση της βάσης από τον αλγόριθμο μπορεί να χρησιμεύσουν ως δεδομένα αναφοράς και σύγκρισης για άλλους ερευνητικούς αλγόριθμους που θα αξιοποιήσουν την συγκεκριμένη βάση. Η ιδιαιτερότητα της βάσης που δημιουργήσαμε έγκειται στον συνδυασμό της στάσης του κεφαλιού και της κίνησης των ματιών σε ακολουθίες καρέ, κάτι που κατά της διάρκεια της συγγραφής της παρούσας εργασίας δεν υπήρχε στην διεθνή βιβλιογραφία.
09 February , 2010
Δ. Σουφλερός, "Βάση οπτικών δεδομένων για τη μοντελοποίηση και ανίχνευση της προσοχής του χρήστη σε περιβάλλοντα φυσικής αλληλεπίδρασης", School of Electrical and Computer Engineering, National Technical University of Athens
[ save PDF] [ BibTex] [ Print] [ Back]

© 00 The Image, Video and Multimedia Systems Laboratory - v1.12