Artículos de investigación

Análisis comparativo de K-NN, Naïve-Bayes y regresión logística para la detección de fraude con tarjetas de crédito

Vol. 19 Núm. 3 (2023)
Publicado: 2023-09-22
Kavita Arora
Manav Rachna International Institute of Research & Studies
Dr. Sonal Pathak
Manav Rachna International Institute of Research and Studies, Faridabad
Nguyen Thi Dieu Linh
Hanoi University of Industry

Introducción: este artículo muestra el resultado de un estudio comparativo de “varios algoritmos de machine learning, a saber, K-NN, Naïve-Bayes y regresión logística para la detección de fraudes con tarjetas de crédito”, realizado con base en un conjunto de datos tomado de UCI.com en 2022-23 en el Instituto Internacional de Investigaciones y Estudios Manav Rachna.

Problema: el fraude con tarjetas de crédito está muy extendido hoy en día y las modalidades son cada vez más variadas. A menudo, se oye hablar de casos de fraude que causan daños irreparables a bancos e instituciones financieras, que no pueden ser compensados en términos de costos. Para evitar estafas con diversos modos de tarjetas de crédito, se debe poder identificar y descubrir los modos que suelen utilizar los estafadores. Este esquema proporciona a dichas instituciones financieras y bancos información completa y adecuada utilizando técnicas de machine learning, no solo sobre los modos que suelen utilizar los estafadores o defraudadores, sino también sobre las formas de protegerse contra dichos fraudes.

Objetivo: el presente artículo analiza los diversos modelos de machine learning basados en clasificación y regresión, a saber, K-Nearest Neighbors (K-NN), Naïve Bayes y regresión logística, que pueden lograr con éxito una precisión de clasificación del 80% utilizando regresión logística con una precisión de 78%, Retiro del 100% y F1 Score del 88% para transacciones fraudulentas con tarjeta de crédito.

Método: el análisis comparativo muestra que, para los parámetros de precisión, recuperación y exactitud, el K-NN es un mejor enfoque para detectar transacciones fraudulentas que la regresión logística y el Naïve Bayes.
Resultados: la precisión es marginalmente alta en la regresión logística, pero los parámetros de falso positivo no pueden identificar los datos desequilibrados; por lo tanto, disfrazan los resultados y la precisión de la regresión logística y el K-NN se considera adecuado para tales casos.

Conclusión: este esquema describe los sistemas automatizados de clasificación de fraude que utilizan técnicas de machine learning, a saber, K-NN, Regresión logística y Naïve Bayes, para producir un modelo que pueda distinguir transacciones con tarjetas de crédito válidas e inválidas.

Originalidad: a través de esta investigación, se utilizan las características más relevantes para visualizar la precisión con la matriz de confusión y se obtienen cálculos de precisión a partir del conjunto de datos utilizado.
Limitaciones: se podrían haber utilizado técnicas de Deep learning para obtener mejores resultados.

Palabras clave: detección de fraude, K-Nearest Neighbor, Naïve Bayes, machine learning , regresión logística

Cómo citar

[1]
K. Arora, S. Pathak, and N. T. Dieu Linh, “Análisis comparativo de K-NN, Naïve-Bayes y regresión logística para la detección de fraude con tarjetas de crédito”, ing. Solidar, vol. 19, no. 3, pp. 1–22, Sep. 2023, doi: 10.16925/2357-6014.2023.03.05.

S. L. Vailshery, “Wide-area and short-range IoT device installed base Worldwide 2014-2027,” Technology & Telecommunications. [Online] Available: https://www.statista.com.

Credit card fraud, [Online] Available: https://en.wikipedia.org/wiki/Credit_card_fraud.

S. Okoro, “Combatting Cybercrime, Tools and Capacity Building for Emerging Economies”, 2017. [Online], Available: https://documents1.worldbank.org/curated/en

Lookerstudio, 2018. [Online] Available: https://www.indiacode.nic.in/bitstream/123456789/1999/3/A2000-21.pdf

A. Rashmi, “Predictive Analysis Of Breast Cancer Using Machine Learning Techniques,” Revista Ingeniería Solidaria, vol. 15, no. 3, 2019. doi: https://doi.org/10.16925/2357-6014.2019.03.01

R. Wheeler, S. Aitken, “Multiple algorithms for fraud detection,” Knowledge-Based Systems. vol.13, pp.93–99. [Online]. Available:https://isiarticles.com/bundles/Article/pre/pdf/17658.pdf

Y.K. Saheed, Hambali, “Application of feature selection on Naive Bayes, random forest, and SVM for credit card fraud detection,” International Conference on Decision Aid Sciences and Application. (DASA), 2020. doi: https://doi.org/10.1109/DASA51403.2020.9317228

H. Najadat, O. Altiti, “Credit card fraud detection based on machines and Deep Learning,” International Conference on Information and Communication Systems.2020. doi: 10.1109/ICICS49469.2020.239524

R. Sailusha, V. Gnaneswar, R. Ramesh, G. R. Rao, “Credit Card Fraud Detection Using Machine Learning,” 2020 4th International Conference on Intelligent Computing and Control Systems (ICICCS), Madurai, India, 2020, pp. 1264-1270. doi: https://doi.org/10.1109/ICICCS48265.2020.9121114.

A. Gupta, M.C. Lohani, “Financial fraud detection using naive Bayes algorithm in highly imbalance data set,” Journal of Discrete Mathematical Sciences and Cryptography, vol. 24, no. 5, pp. 1559–1572, 2021.

D. Dighe, S. Kokate, “Detection of credit card fraud transactions using machine learning algorithms and Neural Networks: A comparative study,” International Conference on Computing Communication Control and Automation. doi: https://doi.org/10.1109/ICCUBEA.2018.8697799

Y. Jain, S. Jain, “A comparative analysis of various credit card fraud detection Techniques,” International Journal of Recent Technology and Engineering, vol. 7, no.52, pp.402-407, 2019.

Maniraj, S. Sarkar, “Credit card fraud detection using machine learning and Data Science,” International Journal of Engineering Research and Technology, vol. 8, no. 9, 2019. doi: https://doi.org/10.17577/IJERTV8IS090031S.

S. Kiran, J. Guru, “Credit card fraud detection using Naïve Bayes model based and KNN classifier,” International Journal of Advance Research, Ideas And Innovations In Technology, vol. 4, no. 3, pp.44 - 47, 2018.

S. Maes, K. Tuyls, “Credit card fraud detection using Bayesian and neural networks,” International naiso congress on neuro fuzzy technologies. pp. 261-270.2002

M. Zareapoor, K. Seeja, “Analysis on credit card fraud detection techniques: Based on certain design criteria,” International Journal of Computer Applications, vol. 52, no. 3, pp. 35–42, 2012

MÉTRICAS
VISTAS DEL ARTÍCULO: 568
VISTAS DEL PDF: 522