Κ. Παρδάλης |
Εντοπισμός πολυτροπικών χαρακτηριστικών για οπτικοακουστική αναγνώριση ομιλίας |
School of Electrical and Computer Engineering, National Technical University of Athens |
ABSTRACT
|
Η χρήση της οπτικής πληροφορίας για την βελτίωση της κατανόησης της ανθρώπινης ομιλίας αποτελεί ένα πολύ ενεργό πεδίο τα τελευταία χρόνια. Ο άνθρωπος είναι ικανός να κατανοήσει την ομιλία σε πολύ ικανοποιητικό βαθμό από την οπτική πληροφορία μόνο, ενώ η αξία της έχει αποδειχθεί με πληθώρα πειραμάτων, τόσο για την περίπτωση του ανθρώπου όσο και για την μηχανή. Η παρούσα εργασία σκοπό έχει να ασχοληθεί με τον προσδιορισμό και την εξαγωγή των οπτικών αυτών χαρακτηριστικών τα οποία δίνουν την δυνατότητα της κατανόησης του ανθρώπινου λόγου μόνο με την χρήση της οπτικής πληροφορίας. Να εντοπισθούν τα όρια των τεχνολογιών που υπάρχουν στον συγκεκριμένο τομέα και οι πιθανές βελτιώσεις που μπορεί να προκύψουν. Ορίζεται μία συνολική αρχιτεκτονική η οποία μπορεί να οδηγήσει στην εξαγωγή των χαρακτηριστικών αυτών και μελετάται το κάθε τμήμα της ξεχωριστά
|
09 July , 2008 |
Κ. Παρδάλης, "Εντοπισμός πολυτροπικών χαρακτηριστικών για οπτικοακουστική αναγνώριση ομιλίας", School of Electrical and Computer Engineering, National Technical University of Athens |
[ PDF] [
BibTex] [
Print] [
Back] |