Η Ανίχνευση και Κατηγοριοποίηση Ανθρωπίνων Κινήσεων, ως τομέας σύμπραξης της Όρασης Υπολογιστών και της Αναγνώρισης Προτύπων, χρησιμοποιείται σε ολοένα και περισσότερες εφαρμογές για την περιγραφή της ανθρώπινης δραστηριότητας, όπως η ανάλυση video με βάση το περιεχόμενο και η διαμόρφωση ευφυούς περιβάλλοντος με διαδραστικές εφαρμογές. Οι εφαρμογές αυτές απαιτούν αποδοτικές μεθόδους για την αυτόματη ανάλυση και ταξινόμηση των δεδομένων κίνησης, και αποτελούν ένα πολύ δραστήριο ερευνητικό πεδίο. Για την αντικειμενική αξιολόγηση και σύγκριση των διαφόρων μεθόδων ανάλυσης και κατηγοριοποίησης της ανθρώπινης δραστηριότητας, τα τελευταία χρόνια έχουν δημιουργηθεί συλλογές από video με καταγεγραμμένες κινήσεις. Στόχος αυτής της Διπλωματικής εργασίας είναι να προσφέρει στην ερευνητική κοινότητα μια νέα βάση δεδομένων κίνησης που μπορεί να χρησιμοποιηθεί στην αξιολόγηση και σύγκριση των διαφόρων μεθόδων ανάλυσης και κατηγοριοποίησης της ανθρώπινης δραστηριότητας. Η βάση μας περιλαμβάνει 8374 video, που περιέχουν 12 κινήσεις του αθλήματος της αντισφαίρισης εκτελεσμένων από 55 διαφορετικά άτομα καταγεγραμμένα με την κάμερα τρισδιάσταστης λήψης Kinect. Πιο συγκεκριμένα, περιλαμβάνει video που καταγράφουν την κάθε κίνηση στις τρεις διαστάσεις του χώρου, καθώς και την κίνηση του σκελετού του ανθρώπινου σώματος. Η συσκευή καταγραφής Kinect διαθέτει κάμερα υπερύθρων, επιτρέποντας έτσι, την εξαγωγή πληροφορίας σχετικά με το βάθος και τη θέση των αρθρώσεων του ανθρώπινου σώματος. Mε αυτό τον τρόπο επιτυγχάνεται μια μοντελοποίηση του ανθρώπινου σκελετού σε τρεις διαστάσεις. Στο πλαίσιο της εργασίας, εφαρμόζουμε δυο μεθόδους ανίχνευσης και ταξινόμησης των κινήσεων στα δεδομένα της βάσης μας. Ειδικότερα, εφαρμόζουμε τη μέθοδο «εντοπισμού σημείων ενδιαφέροντος στο χωροχρόνο» (Space-Time Interest Points) και τη μέθοδο «εντοπισμού πυκνών τροχιών κίνησης» (Dense Trajectories). Οι δύο μέθοδοι χρησιμοποιούν ως τοπικούς χωροχρονικούς περιγραφείς τα Ιστογράμματα Προσανατολισμένης Κλίσης (Histograms of Oriented Gradient-HOG), Ιστογράμματα Οπτικής Ροής (Histograms of Optical Flow - HOF) και Ιστογράμματα Ορίων Κίνησης (Μοtion Boundary Histograms). Η ταξινόμηση των video πραγματοποιείται με μια μηχανή διανυσμάτων υποστήριξης (Support Vector Machine- SVM) ως ταξινομητή πολλών κλάσεων. Τα αποτελέσματα της πειραματικής διαδικασίας δείχνουν ότι η βάση έχει δυναμική για τη χρησιμοποίηση της σε μελέτες για την ανάπτυξη εφαρμογών αναγνώρισης ανθρώπινων κινήσεων που παρουσιάζουν ιδιαίτερες προκλήσεις.
|