Análisis de la fertilidad por medio de técnicas de minería datos

Resumen: El objetivo de esta investigación es predecir las variables más importantes que afectan la fertilidad en una persona. Se utiliza la plataforma de aprendizaje automático y minería de datos Weka. Se emplean los algoritmos de Clusters EM, SimpleKMeans y J48, que es de comportamiento similar a un algoritmo Bayesiano. Inicialmente se modela una base de datos existente, hasta ajustar 105 registros y 9 variables, 8 de ellas independientes (edad, enfermedades, accidentes, cirugía, fiebre, alcohol, fumador y sedentarismo) y una dependiente (fertilidad). Como resultado se identifican las 5 variables más influyentes en este proceso: 1) edad, 2) accidente, 3) fiebre, 4) cirugía y 5) alcohol. Se logra un porcentaje de éxito superior al 90% cuando se emplea una validación cruzada 80% - 20%. Se concluye que las técnicas de árboles de decisión y clúster empleadas en este estudio permiten establecer de forma clara las variables más importantes en los procesos de fertilidad de una persona.

Saved in:
Bibliographic Details
Main Authors: Castrillón,Omar Danilo, Arango,Jaime Antero, Castillo,Luis Fernando
Format: Digital revista
Language:Spanish / Castilian
Published: Centro de Información Tecnológica 2022
Online Access:http://www.scielo.cl/scielo.php?script=sci_arttext&pid=S0718-07642022000300203
Tags: Add Tag
No Tags, Be the first to tag this record!