Algoritmo semisupervisado de agrupamiento que combina SUBCLU y el agrupamiento basado en restricciones, para la detección de grupos en conjuntos de alta dimensionalidad

Resumen Los datos de alta dimensionalidad plantean un desafío para los algoritmos de agrupamiento tradicionales, ya que las medidas de similitud convencionales utilizadas por estos no son significativas cuando se aplican sobre el espacio completo de datos, por lo que afectan la calidad de los grupos. Ante esto, los algoritmos de agrupamiento de subespacios han sido propuestos como alternativa para encontrar todos los grupos en todos los espacios del conjunto de datos (1). Al detectar grupos en espacios de menor dimensionalidad, cada grupo detectado puede pertenecer a diferentes subespacios del conjunto de datos original (2). Consecuentemente, atributos que el usuario considere de interés pueden ser excluidos en algunos o todos los grupos, perdiendo información importante y reduciendo el valor del resultado para los analistas. En este proyecto, se propone un nuevo método que combina el algoritmo SUBCLU (3) y el algoritmo de agrupamiento por restricciones (4), el cual permite al usuario identificar variables como atributos de interés con base en conocimiento previo del dominio, esto con el objeto de dirigir la detección de grupos hacia espacios que incluyan estos atributos y, por ende, generar grupos más significativos.

Saved in:
Bibliographic Details
Main Authors: Calvo-Valverde,Luis Alexander, Vallejos-Peña,Alonso
Format: Digital revista
Language:Spanish / Castilian
Published: Instituto Tecnológico de Costa Rica 2018
Online Access:http://www.scielo.sa.cr/scielo.php?script=sci_arttext&pid=S0379-39822018000300074
Tags: Add Tag
No Tags, Be the first to tag this record!
id oai:scielo:S0379-39822018000300074
record_format ojs
spelling oai:scielo:S0379-398220180003000742020-10-23Algoritmo semisupervisado de agrupamiento que combina SUBCLU y el agrupamiento basado en restricciones, para la detección de grupos en conjuntos de alta dimensionalidadCalvo-Valverde,Luis AlexanderVallejos-Peña,Alonso Minería de datos subespacios SUBCLU algoritmo de agrupamiento agrupamiento por restricciones Resumen Los datos de alta dimensionalidad plantean un desafío para los algoritmos de agrupamiento tradicionales, ya que las medidas de similitud convencionales utilizadas por estos no son significativas cuando se aplican sobre el espacio completo de datos, por lo que afectan la calidad de los grupos. Ante esto, los algoritmos de agrupamiento de subespacios han sido propuestos como alternativa para encontrar todos los grupos en todos los espacios del conjunto de datos (1). Al detectar grupos en espacios de menor dimensionalidad, cada grupo detectado puede pertenecer a diferentes subespacios del conjunto de datos original (2). Consecuentemente, atributos que el usuario considere de interés pueden ser excluidos en algunos o todos los grupos, perdiendo información importante y reduciendo el valor del resultado para los analistas. En este proyecto, se propone un nuevo método que combina el algoritmo SUBCLU (3) y el algoritmo de agrupamiento por restricciones (4), el cual permite al usuario identificar variables como atributos de interés con base en conocimiento previo del dominio, esto con el objeto de dirigir la detección de grupos hacia espacios que incluyan estos atributos y, por ende, generar grupos más significativos.info:eu-repo/semantics/openAccessInstituto Tecnológico de Costa RicaRevista Tecnología en Marcha v.31 n.3 20182018-09-01info:eu-repo/semantics/articletext/htmlhttp://www.scielo.sa.cr/scielo.php?script=sci_arttext&pid=S0379-39822018000300074es10.18845/tm.v31i3.3904
institution SCIELO
collection OJS
country Costa Rica
countrycode CR
component Revista
access En linea
databasecode rev-scielo-cr
tag revista
region America Central
libraryname SciELO
language Spanish / Castilian
format Digital
author Calvo-Valverde,Luis Alexander
Vallejos-Peña,Alonso
spellingShingle Calvo-Valverde,Luis Alexander
Vallejos-Peña,Alonso
Algoritmo semisupervisado de agrupamiento que combina SUBCLU y el agrupamiento basado en restricciones, para la detección de grupos en conjuntos de alta dimensionalidad
author_facet Calvo-Valverde,Luis Alexander
Vallejos-Peña,Alonso
author_sort Calvo-Valverde,Luis Alexander
title Algoritmo semisupervisado de agrupamiento que combina SUBCLU y el agrupamiento basado en restricciones, para la detección de grupos en conjuntos de alta dimensionalidad
title_short Algoritmo semisupervisado de agrupamiento que combina SUBCLU y el agrupamiento basado en restricciones, para la detección de grupos en conjuntos de alta dimensionalidad
title_full Algoritmo semisupervisado de agrupamiento que combina SUBCLU y el agrupamiento basado en restricciones, para la detección de grupos en conjuntos de alta dimensionalidad
title_fullStr Algoritmo semisupervisado de agrupamiento que combina SUBCLU y el agrupamiento basado en restricciones, para la detección de grupos en conjuntos de alta dimensionalidad
title_full_unstemmed Algoritmo semisupervisado de agrupamiento que combina SUBCLU y el agrupamiento basado en restricciones, para la detección de grupos en conjuntos de alta dimensionalidad
title_sort algoritmo semisupervisado de agrupamiento que combina subclu y el agrupamiento basado en restricciones, para la detección de grupos en conjuntos de alta dimensionalidad
description Resumen Los datos de alta dimensionalidad plantean un desafío para los algoritmos de agrupamiento tradicionales, ya que las medidas de similitud convencionales utilizadas por estos no son significativas cuando se aplican sobre el espacio completo de datos, por lo que afectan la calidad de los grupos. Ante esto, los algoritmos de agrupamiento de subespacios han sido propuestos como alternativa para encontrar todos los grupos en todos los espacios del conjunto de datos (1). Al detectar grupos en espacios de menor dimensionalidad, cada grupo detectado puede pertenecer a diferentes subespacios del conjunto de datos original (2). Consecuentemente, atributos que el usuario considere de interés pueden ser excluidos en algunos o todos los grupos, perdiendo información importante y reduciendo el valor del resultado para los analistas. En este proyecto, se propone un nuevo método que combina el algoritmo SUBCLU (3) y el algoritmo de agrupamiento por restricciones (4), el cual permite al usuario identificar variables como atributos de interés con base en conocimiento previo del dominio, esto con el objeto de dirigir la detección de grupos hacia espacios que incluyan estos atributos y, por ende, generar grupos más significativos.
publisher Instituto Tecnológico de Costa Rica
publishDate 2018
url http://www.scielo.sa.cr/scielo.php?script=sci_arttext&pid=S0379-39822018000300074
work_keys_str_mv AT calvovalverdeluisalexander algoritmosemisupervisadodeagrupamientoquecombinasubcluyelagrupamientobasadoenrestriccionesparaladetecciondegruposenconjuntosdealtadimensionalidad
AT vallejospenaalonso algoritmosemisupervisadodeagrupamientoquecombinasubcluyelagrupamientobasadoenrestriccionesparaladetecciondegruposenconjuntosdealtadimensionalidad
_version_ 1755933740556615680