Predicción del cáncer de mama utilizando algoritmos de aprendizaje automático en diferentes conjuntos de datos

Artículos de investigación
Ömer Çağrı Yavuz

Karadeniz Technical University

M. Hanefi Calp

Ankara Hacı Bayram Veli University

Hazel Ceren Erkengel

Karadeniz Technical University

Introducción: El trabajo de investigación “Predicción del cáncer de mama utilizando algoritmos de aprendizaje automático en diferentes conjuntos de datos”, se desarrolló en la Universidad Técnica de Karadeniz en el año 2022.

Problema: El cáncer de mama es una enfermedad cada vez más común, día a día, provocando reacciones emocionales y conductuales y con consecuencias fatales si no se detecta a tiempo. En este punto, los métodos tradicionales son insuficientes, sobre todo en el diagnóstico precoz. Este estudio tiene como objetivo predecir el cáncer de mama mediante el uso de algoritmos de aprendizaje automático (ML) en diferentes conjuntos de datos y demuestra la aplicabilidad de estos algoritmos.

Metodología: se compararon los rendimientos de los algoritmos en conjuntos de datos equilibrados y no equilibrados, teniendo en cuenta las métricas de rendimiento obtenidas en aplicaciones en diferentes conjuntos de datos. Además, se desarrolló un modelo basado en el método Borda Voting al incluir en el proceso los resultados obtenidos de cuatro algoritmos diferentes (NB, KNN, DT y RF).

Originalidad y Limitaciones de la Investigación: En el modelo desarrollado en el marco del estudio se combinaron los valores de los resultados obtenidos de diferentes algoritmos como NB, KNN, DT y RF; el objetivo es aumentar el rendimiento del modelo con este proceso, que se basa en el método Borda Voting.

Resultados: Los valores de predicción obtenidos de cada algoritmo se escribieron en diferentes columnas en la misma hoja de cálculo y se aceptó el valor más repetitivo como valor final del resultado. El modelo desarrollado se probó en datos reales que constaban de 60 registros y se analizaron los resultados.

Conclusión: Cuando se examinaron los resultados, se observó que se obtuvo un mayor rendimiento con el modelo de RF propuesto en comparación con estudios similares en la literatura. 

Palabras clave: cáncer de mama, algoritmos de clasificación, aprendizaje automático, conjunto de datos no balanceado
Publicado
2023-01-22
Descargas
Métricas
Cargando métricas ...
https://plu.mx/plum/a/?doi=10.16925/2357-6014.2023.01.08