Deteção e correção de disfluências em crianças

Teixeira, Ângela Daniela Carneiro

Please use this identifier to cite or link to this item: https://hdl.handle.net/10316/99679

Title:	Deteção e correção de disfluências em crianças
Authors:	Teixeira, Ângela Daniela Carneiro
Orientador:	Perdigão, Fernando
Keywords:	Fala; reconhecimento; crianças; modelos; verosimilhança; HMM; Speech; recognition; children; likelihood; HMM
Issue Date:	Sep-2012
Place of publication or event:	Coimbra
Abstract:	A fala é o meio de comunicação por excelência, sendo o seu processo de aprendizagem um dos mais complexos que se conhece. No entanto, as crianças são extremamente eficientes neste processo. Ao longo do seu desenvolvimento, a criança desenvolve uma série de mecanismos mentais (ao nível da percepção e ao nível do controlo motor) que lhe permitem a aprendizagem e aperfeiçoamento da fala. No início do processo de aprendizagem, existem sempre alguns sons cuja replicação é mais difícil, sendo expectável que a criança apenas adquira o domínio de alguns fones mais complexos numa fase mais avançada do seu desenvolvimento. Com a evolução das tecnologias desenvolvidas na área do reconhecimento automático de fala houve um investimento da sua aplicação a áreas como as da aprendizagem da língua ou da terapia da fala. Um trabalho realizado anteriormente, que propunha o desenvolvimento de um sistema de auxílio à terapia da fala para detecção de disfluências em crianças em idade pré-escolar, serviu de ponto de partida para o presente estudo. Foi objectivo deste estudo implementar o módulo desse sistema correspondente à identificação e correcção de disfluências para sua posterior inserção no sistema completo. Em termos de processamento do sinal de fala, o sistema que se baseia nos Modelos de Markov Não Observáveis (HMM – Hidden Markov Models) é um dos mais utilizados, tendo sido a escolha para o desenvolvimento de modelos de reconhecimento de fala para crianças a aplicar neste estudo. No âmbito deste estudo procedeu-se ao tratamento da base de dados recolhida no estudo referido, para criar os modelos de reconhecimento de fala necessários para solucionar o problema principal proposto, o da identificação de dificuldades de pronunciação. Os modelos foram criados com recurso às ferramentas facultadas pelo HTK (Hidden Markov Model Toolkit), produzindo resultados de reconhecimento satisfatórios. Procedeu-se então ao desenvolvimento de um método que permitisse a detecção de disfluências em palavras proferidas por crianças, usando para isso os valores de verosimilhança calculados no processo de reconhecimento da locução a analisar. Speech is the prime mean of communication, with its learning process being one of the most complex and yet, one where humans excel at. Throughout its growth, the child develops a series of mental mechanisms (either at a perception level or at a motor control level) which allow the learning and improvement of speech. At the beginning of the learning process, there are always some sounds whose replication is more difficult, it is expected that the child will only acquire the domain of some of the more complex phones at a later stage of its development. As the technologies in the area of automatic speech recognition evolved, there was an increase in the tendency to apply it to areas such as language learning or speech therapy. A previous work, which proposed a Computer Aided Speech Therapy system directed toward the detection of disfluencies for children in pre-school age, served as the starting point for this study. The development of this system’s module that corresponded to the identification and correction of disfluencies, for subsequent insertion into the complete system, was the main goal of this thesis. In terms of speech signal processing, the system based on Hidden Markov Models (HMM - Hidden Markov Models) is one of the most widely used and was chosen in this study for the development of models of speech recognition for children. For the purpose of this study, the processing of the database collected in the above mentioned work was carried out. This necessary for creating the speech recognition models needed to implement this study’s main goal of identifying pronunciation problems. The models were created using the tools provided by HTK (Hidden Markov Model Toolkit), having produced satisfactory recognition results. A method that allowed the detection of disfluencies on words spoken by children was also developed, using for this the likelihood values calculated in the recognition of the utterance to be tested.
Description:	Dissertação de Mestrado em Engenharia Eletrotécnica e de Computadores apresentada à Faculdade de Ciências e Tecnologia da Universidade de Coimbra.
URI:	https://hdl.handle.net/10316/99679
Rights:	openAccess
Appears in Collections:	FCTUC Eng.Electrotécnica - Teses de Mestrado

Files in This Item:

File	Description	Size	Format
TeseFinal.pdf		2.03 MB	Adobe PDF	View/Open

Show full item record

Google Scholar^TM

Check

Files in This Item:

Google ScholarTM

Google Scholar^TM