Comparative Analysis of K-Nn, Naïve Bayes, and logistic regression for credit card fraud detection

Kavita Arora; Sonal Pathak; Nguyen Thi Dieu Linh

doi:10.16925/2357-6014.2023.03.05

Análisis comparativo de K-NN, Naïve-Bayes y regresión logística para la detección de fraude con tarjetas de crédito

DOI: https://doi.org/10.16925/2357-6014.2023.03.05

Vol. 19 Núm. 3 (2023)

Publicado: 2023-09-22

Kavita Arora

Manav Rachna International Institute of Research & Studies

Dr. Sonal Pathak

Manav Rachna International Institute of Research and Studies, Faridabad

Nguyen Thi Dieu Linh

Hanoi University of Industry

Introducción: este artículo muestra el resultado de un estudio comparativo de “varios algoritmos de machine learning, a saber, K-NN, Naïve-Bayes y regresión logística para la detección de fraudes con tarjetas de crédito”, realizado con base en un conjunto de datos tomado de UCI.com en 2022-23 en el Instituto Internacional de Investigaciones y Estudios Manav Rachna.

Problema: el fraude con tarjetas de crédito está muy extendido hoy en día y las modalidades son cada vez más variadas. A menudo, se oye hablar de casos de fraude que causan daños irreparables a bancos e instituciones financieras, que no pueden ser compensados en términos de costos. Para evitar estafas con diversos modos de tarjetas de crédito, se debe poder identificar y descubrir los modos que suelen utilizar los estafadores. Este esquema proporciona a dichas instituciones financieras y bancos información completa y adecuada utilizando técnicas de machine learning, no solo sobre los modos que suelen utilizar los estafadores o defraudadores, sino también sobre las formas de protegerse contra dichos fraudes.

Objetivo: el presente artículo analiza los diversos modelos de machine learning basados en clasificación y regresión, a saber, K-Nearest Neighbors (K-NN), Naïve Bayes y regresión logística, que pueden lograr con éxito una precisión de clasificación del 80% utilizando regresión logística con una precisión de 78%, Retiro del 100% y F1 Score del 88% para transacciones fraudulentas con tarjeta de crédito.

Método: el análisis comparativo muestra que, para los parámetros de precisión, recuperación y exactitud, el K-NN es un mejor enfoque para detectar transacciones fraudulentas que la regresión logística y el Naïve Bayes.
Resultados: la precisión es marginalmente alta en la regresión logística, pero los parámetros de falso positivo no pueden identificar los datos desequilibrados; por lo tanto, disfrazan los resultados y la precisión de la regresión logística y el K-NN se considera adecuado para tales casos.

Conclusión: este esquema describe los sistemas automatizados de clasificación de fraude que utilizan técnicas de machine learning, a saber, K-NN, Regresión logística y Naïve Bayes, para producir un modelo que pueda distinguir transacciones con tarjetas de crédito válidas e inválidas.

Originalidad: a través de esta investigación, se utilizan las características más relevantes para visualizar la precisión con la matriz de confusión y se obtienen cálculos de precisión a partir del conjunto de datos utilizado.
Limitaciones: se podrían haber utilizado técnicas de Deep learning para obtener mejores resultados.

Palabras clave: detección de fraude, K-Nearest Neighbor, Naïve Bayes, machine learning , regresión logística

PDF (Inglés)

Cómo citar

[1]

K. Arora, S. Pathak, and N. T. Dieu Linh, “Análisis comparativo de K-NN, Naïve-Bayes y regresión logística para la detección de fraude con tarjetas de crédito”, ing. Solidar, vol. 19, no. 3, pp. 1–22, Sep. 2023, doi: 10.16925/2357-6014.2023.03.05.

Descargar cita

Licencia

Derechos de autor 2023 Ingeniería Solidaria

Esta obra está bajo una licencia internacional Creative Commons Atribución 4.0.

Compromiso ético y cesión de derechos

El autor debe declarar que su trabajo es original e inédito y que no se ha postulado a evaluación simultánea para su publicación por otro medio. Además, debe asegurar que no tiene impedimentos de ninguna naturaleza para la concesión de los derechos previstos en el contrato.

El autor se compromete a esperar el resultado de evaluación de la revista Ingeniería Solidaria, antes de considerar su presentación a otro medio; en caso de que la respuesta de publicación sea positiva, adicionalmente, se compromete a responder por cualquier acción de reivindicación, plagio u otra clase de reclamación que al respecto pudiera sobrevenir por parte de terceros.

Asimismo, debe declarar que, como autor o coautor, está de acuerdo por completo con los contenidos presentados en el trabajo y ceder todos los derechos patrimoniales, es decir, su reproducción, comunicación pública, distribución, divulgación, transformación, puesta a disposición y demás formas de utilización de la obra por cualquier medio o procedimiento, por el término de su protección legal y en todos los países del mundo, al Fondo Editorial de la Universidad Cooperativa de Colombia, de manera gratuita y sin contraprestación presente o futura.

Referencias

S. L. Vailshery, “Wide-area and short-range IoT device installed base Worldwide 2014-2027,” Technology & Telecommunications. [Online] Available: https://www.statista.com.

Credit card fraud, [Online] Available: https://en.wikipedia.org/wiki/Credit_card_fraud.

S. Okoro, “Combatting Cybercrime, Tools and Capacity Building for Emerging Economies”, 2017. [Online], Available: https://documents1.worldbank.org/curated/en

Lookerstudio, 2018. [Online] Available: https://www.indiacode.nic.in/bitstream/123456789/1999/3/A2000-21.pdf

A. Rashmi, “Predictive Analysis Of Breast Cancer Using Machine Learning Techniques,” Revista Ingeniería Solidaria, vol. 15, no. 3, 2019. doi: https://doi.org/10.16925/2357-6014.2019.03.01

R. Wheeler, S. Aitken, “Multiple algorithms for fraud detection,” Knowledge-Based Systems. vol.13, pp.93–99. [Online]. Available:https://isiarticles.com/bundles/Article/pre/pdf/17658.pdf

Y.K. Saheed, Hambali, “Application of feature selection on Naive Bayes, random forest, and SVM for credit card fraud detection,” International Conference on Decision Aid Sciences and Application. (DASA), 2020. doi: https://doi.org/10.1109/DASA51403.2020.9317228

H. Najadat, O. Altiti, “Credit card fraud detection based on machines and Deep Learning,” International Conference on Information and Communication Systems.2020. doi: 10.1109/ICICS49469.2020.239524

R. Sailusha, V. Gnaneswar, R. Ramesh, G. R. Rao, “Credit Card Fraud Detection Using Machine Learning,” 2020 4th International Conference on Intelligent Computing and Control Systems (ICICCS), Madurai, India, 2020, pp. 1264-1270. doi: https://doi.org/10.1109/ICICCS48265.2020.9121114.

A. Gupta, M.C. Lohani, “Financial fraud detection using naive Bayes algorithm in highly imbalance data set,” Journal of Discrete Mathematical Sciences and Cryptography, vol. 24, no. 5, pp. 1559–1572, 2021.

D. Dighe, S. Kokate, “Detection of credit card fraud transactions using machine learning algorithms and Neural Networks: A comparative study,” International Conference on Computing Communication Control and Automation. doi: https://doi.org/10.1109/ICCUBEA.2018.8697799

Y. Jain, S. Jain, “A comparative analysis of various credit card fraud detection Techniques,” International Journal of Recent Technology and Engineering, vol. 7, no.52, pp.402-407, 2019.

Maniraj, S. Sarkar, “Credit card fraud detection using machine learning and Data Science,” International Journal of Engineering Research and Technology, vol. 8, no. 9, 2019. doi: https://doi.org/10.17577/IJERTV8IS090031S.

S. Kiran, J. Guru, “Credit card fraud detection using Naïve Bayes model based and KNN classifier,” International Journal of Advance Research, Ideas And Innovations In Technology, vol. 4, no. 3, pp.44 - 47, 2018.

S. Maes, K. Tuyls, “Credit card fraud detection using Bayesian and neural networks,” International naiso congress on neuro fuzzy technologies. pp. 261-270.2002

M. Zareapoor, K. Seeja, “Analysis on credit card fraud detection techniques: Based on certain design criteria,” International Journal of Computer Applications, vol. 52, no. 3, pp. 35–42, 2012

MÉTRICAS

VISTAS DEL ARTÍCULO: 568

VISTAS DEL PDF: 522

https://plu.mx/plum/a/?doi=10.16925/2357-6014.2023.03.05

Biografía del autor/a

Kavita Arora , Manav Rachna International Institute of Research & Studies

Associate Professor, Department of Computer Applications, Manav Rachna International Institute of Research & Studies, Faridabad, Haryana, India – 121004
Dr. Sonal Pathak , Manav Rachna International Institute of Research and Studies, Faridabad

Professor, Department of Computer Applications, Manav Rachna International Institute of Research & Studies, Faridabad, Haryana, India – 121004
Nguyen Thi Dieu Linh , Hanoi University of Industry

Professor, Hanoi University of Industry, Hanoi, Vietnam