Propuesta de modelo predictivo para la detección de fraude en mensajes de texto mediante el uso de Redes Neuronales Recurrentes

Salinas Bolaños, Yair Andrey

Propuesta de modelo predictivo para la detección de fraude en mensajes de texto mediante el uso de Redes Neuronales Recurrentes

Archivos

Texto completo (10.33 MB)

Autorización (acceso restringido) (316.88 KB)

Informe Turnitin (acceso restringido) (45.21 MB)

Fecha

2024

Redes Sociales

Citación

Citación APA

Salinas Bolaños, Yair Andrey

Resumen

El smishing, o fraude por mensajes de texto, se ha vuelto un problema creciente en el país, debido a la falta de mecanismos adecuados para detectar mensajes fraudulentos, lo que ha generado que muchos ciudadanos sean víctimas de estafa al recibir estos tipos de mensajes. El estudio tuvo como objetivo encontrar el mejor clasificador de fraude en mensajes de texto en el contexto peruano, para lo cual se recolectaron 527 imágenes de las que se obtuvieron 1740 mensajes, etiquetados manualmente como FRAUDE o LEGITIMO, basándose en recomendaciones de entidades públicas/privadas, y validadas por una experta en fraude del rubro de telecomunicaciones; posteriormente, se integraron con bases en otros idiomas, logrando un total de 4475 registros. Los mensajes fueron vectorizados con Word2Vec y FastText. Finalmente, se entrenaron algoritmos de Redes Neuronales Recurrentes (RNN, LSTM, GRU) y combinaciones con CNN para identificar el mejor modelo. Los resultados evaluados con Accuracy, Precision, Recall, F1-score y AUC evidenciaron que el mejor clasificador fue una RNN de 3 capas (200, 160, 1) usando el embedding FastText-NewL de 300 dimensiones, alcanzando 85.62% en Accuracy, 84.49% en Precision, 88.77% en Recall, 86.57% en F1-score y 93.14% en AUC.

Palabras clave

Seguridad informática, Fraude, Mensajería electrónica, Aprendizaje automático, Redes neuronales

URI

https://hdl.handle.net/20.500.12640/4287

Colecciones

Ingeniería de Tecnologías de Información y Sistemas

El item tiene asociados los siguientes ficheros de licencia: Creative Commons

Excepto si se señala otra cosa, la licencia del item se describe como https://creativecommons.org/licenses/by-nc-sa/4.0/

Página completa del ítem

Repositorio Institucional

Propuesta de modelo predictivo para la detección de fraude en mensajes de texto mediante el uso de Redes Neuronales Recurrentes

Archivos

Fecha

Título de la revista

ISSN de la revista

Título del volumen

Fecha de fin de embargo

Redes Sociales

Citación

Resumen

Descripción

Palabras clave

Citación

DOI

URI

Colecciones

Endorsement

Review

Supplemented By

Referenced By

El item tiene asociados los siguientes ficheros de licencia: Creative Commons