Utilize este identificador para referenciar este registo:
https://hdl.handle.net/10316/81609
Título: | Reconhecedor de fonemas em português europeu baseado em redes neuronais | Outros títulos: | European portuguese phoneme recognizer based on neural networks | Autor: | Franco, Guilherme de Abreu | Orientador: | Perdigão, Fernando Manuel dos Santos Fernandes, Gabriel Falcão Paiva |
Palavras-chave: | DNN; Reconhecimento de Fonemas; CNTK; GPU; HMM; DNN; Phoneme recognition; CNTK; GPU; HMM | Data: | 20-Set-2016 | Título da revista, periódico, livro ou evento: | Reconhecedor de fonemas em português europeu baseado em redes neuronais | Local de edição ou do evento: | DEEC | Resumo: | Nesta tese aborda-se o problema de reconhecimento automático de fonemas em português europeu através do uso de redes neuronais profundas (DNNs – Deep Neural Networks) em conjugação com modelos de Markov não observáveis (HMM). Implementam-se soluções para esse mesmo problema, explorando diversas arquitecturas para as DNNs usando vários tipos de parâmetros.Começa-se com a implementação de reconhecedores simples, em que as redes neuronais têm apenas uma ou duas camadas escondidas.Posteriormente implementa-se um sistema que usa três contextos temporais (esquerdo, central e direito), baseado no reconhecedor desenvolvido pela Universidade de Brno.São ainda feitas tentativas de melhoria do desempenho das redes implementadas.O desenvolvimento desses sistemas é feito usando o framework CNTK, criado pela Microsoft, que possibilita o treino de forma eficiente dos sistemas em placas gráficas (ou GPUs – Graphics Processing Units).O sistema de GPUs usado é disponibilizado pelo centro de pesquisa CUDA da NVidia, localizado no laboratório de processamento de imagem do Instituto de Telecomunicações da Universidade de Coimbra.Palavras-Chave : DNN, Reconhecimento de Fonemas, CNTK, GPU,HMM . In this thesis, the problem of automatic European Portuguese phoneme recognition using deep neural networks (DNNs) in conjunction with hidden Markov models (HMMs) is tackled. Solutions to that same problem are implemented, exploring several DNN architectures while using several kinds of parameters.A simple recognizer is implemented at first, in which the DNNs have only one or two hidden layers.Then, a system with three contexts is implemented (left, central and right), based on the recognizer developed by Brno University. Attempts are made in order to improve the performance of the implemented networks.The networks development is achieved through the use of Microsoft’s CNTK framework, which makes training using graphics processing units (GPUs) possible.The used GPU system is provided by NVidia’s CUDA research center located at the image processing laboratory, at University of Coimbra’s Telecommunications Institute. Key-Words : DNN, Phoneme recognition, CNTK, GPU, HMM . |
Descrição: | Dissertação de Mestrado Integrado em Engenharia Electrotécnica e de Computadores apresentada à Faculdade de Ciências e Tecnologia | URI: | https://hdl.handle.net/10316/81609 | Direitos: | openAccess |
Aparece nas coleções: | UC - Dissertações de Mestrado |
Ficheiros deste registo:
Ficheiro | Descrição | Tamanho | Formato | |
---|---|---|---|---|
Tese_V3.pdf | 3.72 MB | Adobe PDF | Ver/Abrir |
Google ScholarTM
Verificar
Este registo está protegido por Licença Creative Commons