Please use this identifier to cite or link to this item:
https://hdl.handle.net/10316/92189
Title: | Exploring a Siamese Neural Network Architecture for One-Shot Drug Discovery | Other Titles: | Exploring a Siamese Neural Network Architecture for One-Shot Drug Discovery | Authors: | Torres, Luís Henrique Magalhães Ramos | Orientador: | Ribeiro, Bernardete Martins Arrais, Joel Perdiz |
Keywords: | Redes Neuronais Siamese; Redes Neuronais Convolucionais; Descoberta de Fármacos; Aprendizagem Profunda; One-Shot Learning; Drug Discovery; Deep Learning; One-Shot Learning; Siamese Neural Network; Convolutional Neural Network | Issue Date: | 28-Sep-2020 | metadata.degois.publication.title: | Exploring a Siamese Neural Network Architecture for One-Shot Drug Discovery | metadata.degois.publication.location: | DEI | Abstract: | As redes neuronais profundas oferecem um elevado poder preditivo ao ser capazes de inferir as propriedades farmacológicas e atividades biológicas de pequenas moléculas em aplicações para descoberta de fármacos. No entanto, a quantidade de informação supervisionada disponível para treino é escassa e o passo de 'lead-optimization' apresenta um problema de 'low-data', dificultando a descoberta de novos compostos com a atividade terapêutica pretendida e respetivos análogos farmacológicos. Um requisito fundamental é a necessidade de uma grande quantidade de exemplos de treino por classe, o que nem sempre é possível em aplicações para descoberta de fármacos. Estes desafios invalidam o uso de instâncias cujas classes são desconhecidas no treino ou em dados onde o número de classes é elevado e oscila dinamicamente. O grande objetivo deste estudo é otimizar a descoberta de novos compostos partindo de um conjunto reduzido de moléculas candidatas. Assim, propomos uma arquitetura de redes neuronais paralelas implementando uma estratégia de 'one-shot learning', baseada num conjunto de redes neuronais convolucionais (CNNs) capazes de aprender a partir de um dado 'score' de semelhança entre duas moléculas devolvido por uma dada função de similaridade. Aplicando uma estratégia de 'one-shot learning', apenas necessitamos de um reduzido conjunto de instâncias por classe para treino e de um pequeno conjunto de dados e recursos computacionais para a construção de um modelo eficaz na previsão. Os resultados obtidos demonstram que o uso de um conjunto de redes neuronais convolucionais paralelas implementando uma estratégia de 'one-shot learning' conduz à obtenção de desempenhos superiores na previsão de novos compostos comparando com os modelos 'state-of-the-art'. Assim, o modelo proposto permite prever corretamente e com elevada eficácia, novos compostos e respetivos análogos farmacológicos, considerando a escassez de dados biológicos disponíveis para aplicações de descoberta e desenvolvimento de fármacos. Deep neural networks offer a great predictive power when inferring the pharmacological properties and biological activities of small molecules in drug discovery applications. However, in the traditional drug discovery process, where supervised data is scarce, the lead-optimization step is a low-data problem, making it difficult to find molecules with the desired therapeutic activity and obtain accurate predictions for novel compounds and their pharmacological analogs. One major requirement to ensure the validity of the obtained neural network models is the need for a large number of training examples per class, which is not always feasible in drug discovery applications. This invalidates the use of instances whose classes were not considered in the training phase or in data where the number of classes is high and oscillates dynamically.The main objective of the study is to optimize the discovery of novel compounds based on a reduced set of candidate drugs. We propose a Siamese neural network architecture for one-shot classification, based on Convolutional Neural Networks (CNNs), that learns from a similarity score between two input molecules according to a given similarity function. Using a one-shot learning strategy, few instances per class are needed for training, and a small amount of data and computational resources are required to build an accurate model. The results achieved demonstrate that using a Siamese Deep Neural Network for one-shot classification leads to overall improved performance when compared to other state-of-the-art models. The proposed one-shot Siamese neural network architecture provides an accurate and reliable prediction of novel compounds considering the lack of biological data available for drug discovery tasks. |
Description: | Trabalho de Projeto do Mestrado Integrado em Engenharia Biomédica apresentado à Faculdade de Ciências e Tecnologia | URI: | https://hdl.handle.net/10316/92189 | Rights: | embargoedAccess |
Appears in Collections: | UC - Dissertações de Mestrado |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
Projeto.pdf | 2.34 MB | Adobe PDF | View/Open |
Page view(s) 50
681
checked on Nov 6, 2024
Download(s)
294
checked on Nov 6, 2024
Google ScholarTM
Check
This item is licensed under a Creative Commons License