Please use this identifier to cite or link to this item:
https://hdl.handle.net/10316/99226
Title: | Multi-Domain and Unsupervised Machine Learning for eCommerce Fraud Detection | Authors: | Sapata, Tiago | Orientador: | Ribeiro, Bernardete Martins Alegria, António Almeida, Miguel |
Issue Date: | 1-Jul-2016 | metadata.degois.publication.location: | Coimbra | Abstract: | A globalização e o progresso tecnológico impulsionaram o aumento exponencial do acesso à internet
nos últimos anos. O comércio eletrónico (eCommerce) seguiu a tendência, constantemente
acompanhado por pagamentos fraudulentos, levando a perdas consideráveis nas receitas destes
comerciantes. A Feedzai é uma empresa especializada em Machine Learning e Big Data que oferece
soluções de prevenção de fraude em pagamentos. Uma destas soluções é um serviço baseado
na Cloud especificamente para comércio eletrónico. Neste trabalho, utilizando dados históricos
de comerciantes já existentes (chamado o domínio Source), são implementados dois algoritmos
de Domain Adaptation, com o objectivo de melhorar a performance na deteção de fraude em
pequenos ou novos comerciantes que não possuem pagamentos suficientes para treinar devidamente
um modelo de ML. Adicionalmente, e com o mesmo objectivo, é explorado um algoritmo
de deteção de outliers não supervisionado, não sendo necessário assim o recurso a dados históricos
(do domínio Source) ou a dados anotados no domínio Target. Após teste com múltiplos e
distintos datasets, conclui-se que ambos os algoritmos de Domain Adaptation não melhoram a
performance na deteção de fraude. Por outro lado, considerando que apenas utiliza dados não
anotados no domínio Target, o algoritmo não supervisionado apresenta uma performance considerável
e apresenta-se como uma solução promissora para novos comerciantes no caso de uso
de eCommerce apresentado. Globalization and technological progress led to exponential growth of internet access in the last decade. eCommerce followed the trend, constantly accompanied by payment fraud, costing merchants a substantial percentage of their revenue. Feedzai is a company specializing in Machine Learning (ML) and Big Data, providing solutions for fraud prevention in payments. One of Feedzai’s solutions is a Cloud-based SaaS for eCommerce merchants. In this work, using historical data from existing merchants (called Source domain), we implement two Domain Adaptation algorithms with the goal of improving fraud detection for small or new merchants (called Target domain), who typically have insufficient payment data to properly train a ML model. Furthermore, we explore an Unsupervised Learning outlier detection algorithm, which does not rely on historical or labeled data, with the same goal. Upon testing on multiple distinct datasets, obtained results demonstrate both Domain Adaptation algorithms fail to improve performance and actually decrease it. On the other hand, considering it only uses unlabeled data from the Target domain, the Unsupervised Learning method provides quite good performance and proves to be a promising solution for new merchants in the presented eCommerce use case. |
Description: | Relatório Final de Estágio do Mestrado em Engenharia Informática apresentado à Faculdade de Ciências e Tecnologia da Universidade de Coimbra. | URI: | https://hdl.handle.net/10316/99226 | Rights: | embargoedAccess |
Appears in Collections: | FCTUC Eng.Informática - Teses de Mestrado |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
Tese_TSapata.pdf | 744.05 kB | Adobe PDF | View/Open |
Page view(s)
136
checked on Nov 6, 2024
Download(s)
41
checked on Nov 6, 2024
Google ScholarTM
Check
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.