MERGE Áudio 2.0

Louro, Pedro Miguel Lima

Please use this identifier to cite or link to this item: https://hdl.handle.net/10316/102155

DC Field	Value	Language
dc.contributor.advisor	Paiva, Rui Pedro Pinto de Carvalho e	-
dc.contributor.advisor	Panda, Renato Eduardo Silva	-
dc.contributor.author	Louro, Pedro Miguel Lima	-
dc.date.accessioned	2022-09-26T22:01:12Z	-
dc.date.available	2022-09-26T22:01:12Z	-
dc.date.issued	2022-09-15	-
dc.date.submitted	2022-09-26	-
dc.identifier.uri	https://hdl.handle.net/10316/102155	-
dc.description	Dissertação de Mestrado em Engenharia Informática apresentada à Faculdade de Ciências e Tecnologia	pt
dc.description.abstract	A biblioteca de musical disponível digitalmente aos consumidores levou ao crescimante do campo científico de Recoonhecimento de Emoção em Música, devido à necissidade de organizar estas enormes coleções e prestar recomendações personalizadas para os ouvintes. A infância deste campo é dominada por metodologias de Aprendizagem Computacional Clássica utilizando elementos cuidadosamente desenhados para identificar as emoções percecionadas em peças musicais. Recentemente, registou-se um aumento de metodologias de Apredizagem Profunda no campo devido à sua abilidade de extrair elementos relevantes nestas peças, tornando o passo de desenhar elementos automático.Este trabalho contribuí para o campo oferecendo um conjunto alargado de experiências utilizando diversas metodologias avaliadas em dois conjuntos de dados: o conjunto de dados 4 Quadrant Audio Emotion Dataset (4QAED), previamente desenvolvido pela nossa equipa, e a sua extensão, cujos resultados são comparados de forma a estudar o impacto na performance.Obtivemos resultados acima do estado da arte. Nomeadamente, um F1 Score de 80.24\% utilizando um modelo híbrido, constituído por uma Rede Neuronal Convolucional, pré-treinado em amostras sintetizadas a partir de técnias de sintetização de dados áudio, uma Rede Neuronal Densa, pré-treinada em elementos extraídos desenhados à mão.O trabalho desenvolvido deu também alguma , incluindo continuar a explorar metodologias que utilizam Sintetização de Dados and utilizar a informação de múltiplas representações espectrais para lidar com o número reduzido de amostras disponíveis nos conjuntos de dados no estado da arte.	pt
dc.description.abstract	The library of digital music available to consumers has pushed for the growth of the Music Emotion Recognition research field, due to the need of organizing these large collections and provide personalized recommendations to listeners. The infancy of this field is dominated by Classical Machine Learning approaches using carefully constructed features to identify the perceived emotions of music pieces. Recently, there has been an increase in Deep Learning approaches in the field due to the ability of extracting the underlying features in the pieces, making the feature design step of the previous approaches automatic.This work thus contributes to the field by providing an extensive set of experiments using a variety of approaches conducted on two datasets: the 4 Quadrant Audio Emotion Dataset (4QAED) dataset, previously developed by our team, and its extension, whose results are compared against for studying the impact in performance. We obtained results above the state-of-the-art. Namely, a 80.24\% F1 Score using an hybrid model, comprised of a Convolutional Neural Network, pre-trained on augmentated samples obtained using classical audio augmentation techniques, and a Dense Neural Network, pre-trained on extracted handcrafted features.The developed worked also gave some insight in some promising directions, include further exploring Data Augmentation approaches and leveraging the information from multiple spectral representation to deal with the low amount of samples available in current state of the art datasets.	pt
dc.description.sponsorship	FCT	pt
dc.language.iso	eng	pt
dc.relation	info:eu-repo/grantAgreement/FCT/6817 - DCRRNI ID/157404/PT	pt
dc.rights	openAccess	pt
dc.rights.uri	http://creativecommons.org/licenses/by-nc/4.0/	pt
dc.subject	Recuperação de Informação em Música	pt
dc.subject	Reconhecimento de Emoção em Música	pt
dc.subject	Aprendizagem Computacional	pt
dc.subject	Aprendizagem Profunda	pt
dc.subject	Sintetização de Dados	pt
dc.subject	Music Information Retrieval	pt
dc.subject	Music Emotion Recognition	pt
dc.subject	Machine Learning	pt
dc.subject	Deep Learning	pt
dc.subject	Data Augmentation	pt
dc.title	MERGE Áudio 2.0	pt
dc.title.alternative	MERGE Audio 2.0	pt
dc.type	masterThesis	pt
degois.publication.location	DEI - FCTUC	pt
degois.publication.title	MERGE Áudio 2.0	eng
dc.peerreviewed	yes	-
dc.date.embargo	2022-09-15	*
dc.identifier.tid	203062582	pt
thesis.degree.discipline	Informática	-
thesis.degree.level	1	-
thesis.degree.name	Mestrado em Engenharia Informática	pt
uc.degree.grantorUnit	Faculdade de Ciências e Tecnologia - Departamento de Engenharia Informática	-
uc.rechabilitacaoestrangeira	no	pt
uc.degree.grantorID	0500	-
uc.contributor.author	Louro, Pedro Miguel Lima::0000-0003-3201-6990	-
uc.degree.classification	18	-
uc.date.periodoEmbargo	0	pt
uc.degree.presidentejuri	Simões, Paulo Alexandre Ferreira	-
uc.degree.elementojuri	Macedo, Luís Miguel Machado Lopes	-
uc.degree.elementojuri	Paiva, Rui Pedro Pinto de Carvalho e	-
uc.contributor.advisor	Paiva, Rui Pedro Pinto de Carvalho e::0000-0003-3215-3960	-
item.openairetype	masterThesis	-
item.cerifentitytype	Publications	-
item.languageiso639-1	en	-
item.fulltext	Com Texto completo	-
item.grantfulltext	open	-
item.openairecristype	http://purl.org/coar/resource_type/c_18cf	-
crisitem.advisor.researchunit	CISUC - Centre for Informatics and Systems of the University of Coimbra	-
crisitem.advisor.researchunit	CISUC - Centre for Informatics and Systems of the University of Coimbra	-
crisitem.advisor.parentresearchunit	Faculty of Sciences and Technology	-
crisitem.advisor.parentresearchunit	Faculty of Sciences and Technology	-
crisitem.advisor.orcid	0000-0003-3215-3960	-
crisitem.advisor.orcid	0000-0003-2539-5590	-
Appears in Collections:	UC - Dissertações de Mestrado

Files in This Item:

File	Description	Size	Format
PedroMiguelLimaLouro.pdf		8.2 MB	Adobe PDF	View/Open

Show simple item record

Page view(s)

118

checked on Jul 3, 2024

Download(s)

80

checked on Jul 3, 2024

Google Scholar^TM

Check

This item is licensed under a Creative Commons License

Files in This Item:

Page view(s)

Download(s)

Google ScholarTM

Google Scholar^TM