Clasificación de fuga de clientes en una entidad financiera utilizando el algoritmo Smote para datos desbalanceados en una regresión logística

Universidad Nacional Agraria La Molina. Facultad de Economía y Planificación. Departamento Académico de Estadística e Informática

Saved in:
Bibliographic Details
Main Author: Pariona Huarhuachi, Jefferson Clauss
Other Authors: Salinas Flores, Jesús Walter
Format: info:eu-repo/semantics/bachelorThesis biblioteca
Language:spa
Published: Universidad Nacional Agraria La Molina 2017
Subjects:Instituciones financieras, Consumidores, Comportamiento del consumidor, Métodos estadísticos, Modelos matemáticos, Análisis de la regresión, Técnicas de predicción, Evaluación, Perú, Algoritmo Smote, Fuga de clientes, Retención de clientes, http://purl.org/pe-repo/ocde/ford#4.05.00,
Online Access:https://hdl.handle.net/20.500.12996/3329
Tags: Add Tag
No Tags, Be the first to tag this record!
id dig-ban-20.500.12996-3329
record_format koha
institution UNALAM
collection DSpace
country Perú
countrycode PE
component Bibliográfico
access En linea
databasecode dig-ban
tag biblioteca
region America del Sur
libraryname Biblioteca Agrícola Nacional de la Molina
language spa
topic Instituciones financieras
Consumidores
Comportamiento del consumidor
Métodos estadísticos
Modelos matemáticos
Análisis de la regresión
Técnicas de predicción
Evaluación
Perú
Algoritmo Smote
Fuga de clientes
Retención de clientes
http://purl.org/pe-repo/ocde/ford#4.05.00
Instituciones financieras
Consumidores
Comportamiento del consumidor
Métodos estadísticos
Modelos matemáticos
Análisis de la regresión
Técnicas de predicción
Evaluación
Perú
Algoritmo Smote
Fuga de clientes
Retención de clientes
http://purl.org/pe-repo/ocde/ford#4.05.00
spellingShingle Instituciones financieras
Consumidores
Comportamiento del consumidor
Métodos estadísticos
Modelos matemáticos
Análisis de la regresión
Técnicas de predicción
Evaluación
Perú
Algoritmo Smote
Fuga de clientes
Retención de clientes
http://purl.org/pe-repo/ocde/ford#4.05.00
Instituciones financieras
Consumidores
Comportamiento del consumidor
Métodos estadísticos
Modelos matemáticos
Análisis de la regresión
Técnicas de predicción
Evaluación
Perú
Algoritmo Smote
Fuga de clientes
Retención de clientes
http://purl.org/pe-repo/ocde/ford#4.05.00
Pariona Huarhuachi, Jefferson Clauss
Clasificación de fuga de clientes en una entidad financiera utilizando el algoritmo Smote para datos desbalanceados en una regresión logística
description Universidad Nacional Agraria La Molina. Facultad de Economía y Planificación. Departamento Académico de Estadística e Informática
author2 Salinas Flores, Jesús Walter
author_facet Salinas Flores, Jesús Walter
Pariona Huarhuachi, Jefferson Clauss
format info:eu-repo/semantics/bachelorThesis
topic_facet Instituciones financieras
Consumidores
Comportamiento del consumidor
Métodos estadísticos
Modelos matemáticos
Análisis de la regresión
Técnicas de predicción
Evaluación
Perú
Algoritmo Smote
Fuga de clientes
Retención de clientes
http://purl.org/pe-repo/ocde/ford#4.05.00
author Pariona Huarhuachi, Jefferson Clauss
author_sort Pariona Huarhuachi, Jefferson Clauss
title Clasificación de fuga de clientes en una entidad financiera utilizando el algoritmo Smote para datos desbalanceados en una regresión logística
title_short Clasificación de fuga de clientes en una entidad financiera utilizando el algoritmo Smote para datos desbalanceados en una regresión logística
title_full Clasificación de fuga de clientes en una entidad financiera utilizando el algoritmo Smote para datos desbalanceados en una regresión logística
title_fullStr Clasificación de fuga de clientes en una entidad financiera utilizando el algoritmo Smote para datos desbalanceados en una regresión logística
title_full_unstemmed Clasificación de fuga de clientes en una entidad financiera utilizando el algoritmo Smote para datos desbalanceados en una regresión logística
title_sort clasificación de fuga de clientes en una entidad financiera utilizando el algoritmo smote para datos desbalanceados en una regresión logística
publisher Universidad Nacional Agraria La Molina
publishDate 2017
url https://hdl.handle.net/20.500.12996/3329
work_keys_str_mv AT parionahuarhuachijeffersonclauss clasificaciondefugadeclientesenunaentidadfinancierautilizandoelalgoritmosmoteparadatosdesbalanceadosenunaregresionlogistica
_version_ 1756090100616265728
spelling dig-ban-20.500.12996-33292023-01-05T08:01:57Z Clasificación de fuga de clientes en una entidad financiera utilizando el algoritmo Smote para datos desbalanceados en una regresión logística Pariona Huarhuachi, Jefferson Clauss Salinas Flores, Jesús Walter Instituciones financieras Consumidores Comportamiento del consumidor Métodos estadísticos Modelos matemáticos Análisis de la regresión Técnicas de predicción Evaluación Perú Algoritmo Smote Fuga de clientes Retención de clientes http://purl.org/pe-repo/ocde/ford#4.05.00 Universidad Nacional Agraria La Molina. Facultad de Economía y Planificación. Departamento Académico de Estadística e Informática La retención de clientes ha tomado mucha importancia en los últimos años en las entidades financieras debido a la competencia agresiva por parte del sector, así como la autonomía del cliente en buscar mejores beneficios dentro de todas las ofertas que existen en el mercado bancario lo que se ve reflejado en el aumento de la tasa de clientes fugados. Ante esto se ha visto necesaria la implementación de técnicas estadísticas y/o técnicas de minería de datos, con la finalidad de construir un clasificador predictivo que pueda ayudar a identificar a clientes potenciales a fugarse. En muchos casos cuando se aplican técnicas de clasificación, es común que la clase a predecir ocurra con menor frecuencia que la otra clase: la presencia de datos desbalanceados. Es decir, se tiene menor número de clientes fugados que no fugados, lo cual representa un inconveniente debido a que el clasificador necesita datos suficientes de ambas clases para poder aprender de ellas y así alcanzar una buena predicción. En esta investigación se propone el algoritmo Syntetic Minority Over-sampling Technique (SMOTE) como solución a este problema. SMOTE crea instancias nuevas a partir de un sobre-muestreo de las instancias existentes, llevando la clase minoritaria a un número suficiente para ser considerada balanceada y la clase mayoritaria si es necesaria reducirla mediante sub-muestreo aleatorio. En la presente investigación se validarán tales beneficios con la construcción de un modelo de regresión logística binaria con datos desbalanceados con y sin la aplicación del algoritmo de SMOTE; con el fin predecir la fuga de clientes en una entidad financiera. Se usarán para medir la precisión, la curva ROC y elementos de la comprobación de tabla cruzada como la especificidad y la sensibilidad. Customer retention has taken much importance in recent years in financial institutions due to aggressive competition from the sector, as well as the autonomy of the client to seek better benefits within all offers that exist in the banking market, which is reflected in the increase in the rate of customers escaped. It has been necessary the implementation of statistical or technical techniques of data mining, in order to build a predictive classifier that can help identify potential customers to abscond. In many cases when classification techniques are applied, it is common to predict class to occur less frequently than other kind: the presence of unbalanced data. I.e. you have fewer customers escaped than not escapees, which represents a drawback since the classifier needs sufficient both kinds of data to be able to learn from them and thus achieve a good prediction. This research proposes the Syntetic Minority Over-sampling algorithm Technique (SMOTE) as a solution to this problem. SMOTE creates instances new starting from a sobre-muestreo of them instances existing, carrying the class minority to a number enough to be considered balanced and the class majority if is necessary reduce it by sub-sampling random. In the present study are validated such benefits with the construction of a model of binary logistic regression with unbalanced data with and without the application of the algorithm of SMOTE; in order to predict the flight of clients in a financial institution. They will be used to measure the precision, the ROC curve and elements of table cross as the specificity and sensitivity testing. Tesis 2018-05-30T13:05:31Z 2018-05-30T13:05:31Z 2017 info:eu-repo/semantics/bachelorThesis E13.P37-T BAN UNALM https://hdl.handle.net/20.500.12996/3329 spa info:eu-repo/semantics/openAccess https://creativecommons.org/licenses/by-nc-nd/4.0/ application/pdf application/pdf application/pdf application/pdf Universidad Nacional Agraria La Molina Universidad Nacional Agraria La Molina Repositorio institucional - UNALM Estadística e Informática Universidad Nacional Agraria La Molina. Facultad de Economía y Planificación Ingeniero Estadístico e Informático Título Profesional