Reconhecedor de fonemas em português europeu baseado em redes neuronais

Franco, Guilherme de Abreu

Utilize este identificador para referenciar este registo: https://hdl.handle.net/10316/81609

Título:	Reconhecedor de fonemas em português europeu baseado em redes neuronais
Outros títulos:	European portuguese phoneme recognizer based on neural networks
Autor:	Franco, Guilherme de Abreu
Orientador:	Perdigão, Fernando Manuel dos Santos Fernandes, Gabriel Falcão Paiva
Palavras-chave:	DNN; Reconhecimento de Fonemas; CNTK; GPU; HMM; DNN; Phoneme recognition; CNTK; GPU; HMM
Data:	20-Set-2016
Título da revista, periódico, livro ou evento:	Reconhecedor de fonemas em português europeu baseado em redes neuronais
Local de edição ou do evento:	DEEC
Resumo:	Nesta tese aborda-se o problema de reconhecimento automático de fonemas em português europeu através do uso de redes neuronais profundas (DNNs – Deep Neural Networks) em conjugação com modelos de Markov não observáveis (HMM). Implementam-se soluções para esse mesmo problema, explorando diversas arquitecturas para as DNNs usando vários tipos de parâmetros.Começa-se com a implementação de reconhecedores simples, em que as redes neuronais têm apenas uma ou duas camadas escondidas.Posteriormente implementa-se um sistema que usa três contextos temporais (esquerdo, central e direito), baseado no reconhecedor desenvolvido pela Universidade de Brno.São ainda feitas tentativas de melhoria do desempenho das redes implementadas.O desenvolvimento desses sistemas é feito usando o framework CNTK, criado pela Microsoft, que possibilita o treino de forma eficiente dos sistemas em placas gráficas (ou GPUs – Graphics Processing Units).O sistema de GPUs usado é disponibilizado pelo centro de pesquisa CUDA da NVidia, localizado no laboratório de processamento de imagem do Instituto de Telecomunicações da Universidade de Coimbra.Palavras-Chave : DNN, Reconhecimento de Fonemas, CNTK, GPU,HMM . In this thesis, the problem of automatic European Portuguese phoneme recognition using deep neural networks (DNNs) in conjunction with hidden Markov models (HMMs) is tackled. Solutions to that same problem are implemented, exploring several DNN architectures while using several kinds of parameters.A simple recognizer is implemented at first, in which the DNNs have only one or two hidden layers.Then, a system with three contexts is implemented (left, central and right), based on the recognizer developed by Brno University. Attempts are made in order to improve the performance of the implemented networks.The networks development is achieved through the use of Microsoft’s CNTK framework, which makes training using graphics processing units (GPUs) possible.The used GPU system is provided by NVidia’s CUDA research center located at the image processing laboratory, at University of Coimbra’s Telecommunications Institute. Key-Words : DNN, Phoneme recognition, CNTK, GPU, HMM .
Descrição:	Dissertação de Mestrado Integrado em Engenharia Electrotécnica e de Computadores apresentada à Faculdade de Ciências e Tecnologia
URI:	https://hdl.handle.net/10316/81609
Direitos:	openAccess
Aparece nas coleções:	UC - Dissertações de Mestrado

Ficheiros deste registo:

Ficheiro	Descrição	Tamanho	Formato
Tese_V3.pdf		3.72 MB	Adobe PDF	Ver/Abrir

Mostrar registo em formato completo

Google Scholar^TM

Verificar

Este registo está protegido por Licença Creative Commons

Ficheiros deste registo:

Google ScholarTM

Google Scholar^TM