Metodologia baseada em técnicas de mineração de dados para suporte à certificação de raças de ovinos.

O objetivo deste trabalho foi desenvolver uma metodologia baseada em técnicas de mineração de dados para selecionar os principais marcadores SNP (Single Nucleotide Polymorphism) para as raças de ovinos: Crioula, Morada Nova e Santa Inês. Os dados utilizados foram obtidos do Consórcio Internacional de Ovinos e são compostos por 72 animais das raças citadas, e cada animal possui 49.034 marcadores SNP. Considerando que o número de atributos (marcadores) é muito maior que o de observações (animais), foram aplicadas as técnicas de predição LASSO (Least Absolute Shrinkage and Selection Operator), Random Forest e Boosting para a geração de modelos preditivos que incorporam métodos de seleção de atributos. Os resultados revelaram que os modelos preditivos selecionaram os principais marcadores SNP para identificação das raças estudadas. O modelo LASSO selecionou um total de 29 marcadores relevantes. A partir dos modelos Random Forest e Boosting, foram obtidos 27 e 20 marcadores importantes, respectivamente. Por meio da intersecção dos modelos gerados, identificou-se um subconjunto de 18 marcadores com maior potencial de identificação das raças.

Saved in:
Bibliographic Details
Main Authors: VIEIRA, F. D., OLIVEIRA, S. R. de M., PAIVA, S. R.
Other Authors: FÁBIO DANILO VIEIRA, CNPTIA; STANLEY ROBSON DE MEDEIROS OLIVEIRA, CNPTIA; SAMUEL REZENDE PAIVA, SRI.
Format: Artigo de periódico biblioteca
Language:pt_BR
por
Published: 2016-02-04
Subjects:Polimorfismo de nucleotídeo único, Seleção de atributos, Modelos preditivos, Regressão penalizada, Feature selection, Predictive modeling, Penalized regression, Single nucleotide polymorphism, Models,
Online Access:http://www.alice.cnptia.embrapa.br/alice/handle/doc/1036157
http://dx.doi.org/10.1590/1809-4430-Eng.Agric.v35n6p1172-1186/2015
Tags: Add Tag
No Tags, Be the first to tag this record!
id dig-alice-doc-1036157
record_format koha
spelling dig-alice-doc-10361572017-08-16T03:40:16Z Metodologia baseada em técnicas de mineração de dados para suporte à certificação de raças de ovinos. VIEIRA, F. D. OLIVEIRA, S. R. de M. PAIVA, S. R. FÁBIO DANILO VIEIRA, CNPTIA; STANLEY ROBSON DE MEDEIROS OLIVEIRA, CNPTIA; SAMUEL REZENDE PAIVA, SRI. Polimorfismo de nucleotídeo único Seleção de atributos Modelos preditivos Regressão penalizada Feature selection Predictive modeling Penalized regression Single nucleotide polymorphism Models O objetivo deste trabalho foi desenvolver uma metodologia baseada em técnicas de mineração de dados para selecionar os principais marcadores SNP (Single Nucleotide Polymorphism) para as raças de ovinos: Crioula, Morada Nova e Santa Inês. Os dados utilizados foram obtidos do Consórcio Internacional de Ovinos e são compostos por 72 animais das raças citadas, e cada animal possui 49.034 marcadores SNP. Considerando que o número de atributos (marcadores) é muito maior que o de observações (animais), foram aplicadas as técnicas de predição LASSO (Least Absolute Shrinkage and Selection Operator), Random Forest e Boosting para a geração de modelos preditivos que incorporam métodos de seleção de atributos. Os resultados revelaram que os modelos preditivos selecionaram os principais marcadores SNP para identificação das raças estudadas. O modelo LASSO selecionou um total de 29 marcadores relevantes. A partir dos modelos Random Forest e Boosting, foram obtidos 27 e 20 marcadores importantes, respectivamente. Por meio da intersecção dos modelos gerados, identificou-se um subconjunto de 18 marcadores com maior potencial de identificação das raças. Journal of the Brazilian Association of Agricultural Engineering. 2016-02-04T11:11:11Z 2016-02-04T11:11:11Z 2016-02-04 2015 2016-02-05T11:11:11Z Artigo de periódico Engenharia Agrícola, Jaboticabal, v. 35, n. 6, p. 1172-1186, nov./dez. 2015. http://www.alice.cnptia.embrapa.br/alice/handle/doc/1036157 http://dx.doi.org/10.1590/1809-4430-Eng.Agric.v35n6p1172-1186/2015 pt_BR por openAccess
institution EMBRAPA
collection DSpace
country Brasil
countrycode BR
component Bibliográfico
access En linea
databasecode dig-alice
tag biblioteca
region America del Sur
libraryname Sistema de bibliotecas de EMBRAPA
language pt_BR
por
topic Polimorfismo de nucleotídeo único
Seleção de atributos
Modelos preditivos
Regressão penalizada
Feature selection
Predictive modeling
Penalized regression
Single nucleotide polymorphism
Models
Polimorfismo de nucleotídeo único
Seleção de atributos
Modelos preditivos
Regressão penalizada
Feature selection
Predictive modeling
Penalized regression
Single nucleotide polymorphism
Models
spellingShingle Polimorfismo de nucleotídeo único
Seleção de atributos
Modelos preditivos
Regressão penalizada
Feature selection
Predictive modeling
Penalized regression
Single nucleotide polymorphism
Models
Polimorfismo de nucleotídeo único
Seleção de atributos
Modelos preditivos
Regressão penalizada
Feature selection
Predictive modeling
Penalized regression
Single nucleotide polymorphism
Models
VIEIRA, F. D.
OLIVEIRA, S. R. de M.
PAIVA, S. R.
Metodologia baseada em técnicas de mineração de dados para suporte à certificação de raças de ovinos.
description O objetivo deste trabalho foi desenvolver uma metodologia baseada em técnicas de mineração de dados para selecionar os principais marcadores SNP (Single Nucleotide Polymorphism) para as raças de ovinos: Crioula, Morada Nova e Santa Inês. Os dados utilizados foram obtidos do Consórcio Internacional de Ovinos e são compostos por 72 animais das raças citadas, e cada animal possui 49.034 marcadores SNP. Considerando que o número de atributos (marcadores) é muito maior que o de observações (animais), foram aplicadas as técnicas de predição LASSO (Least Absolute Shrinkage and Selection Operator), Random Forest e Boosting para a geração de modelos preditivos que incorporam métodos de seleção de atributos. Os resultados revelaram que os modelos preditivos selecionaram os principais marcadores SNP para identificação das raças estudadas. O modelo LASSO selecionou um total de 29 marcadores relevantes. A partir dos modelos Random Forest e Boosting, foram obtidos 27 e 20 marcadores importantes, respectivamente. Por meio da intersecção dos modelos gerados, identificou-se um subconjunto de 18 marcadores com maior potencial de identificação das raças.
author2 FÁBIO DANILO VIEIRA, CNPTIA; STANLEY ROBSON DE MEDEIROS OLIVEIRA, CNPTIA; SAMUEL REZENDE PAIVA, SRI.
author_facet FÁBIO DANILO VIEIRA, CNPTIA; STANLEY ROBSON DE MEDEIROS OLIVEIRA, CNPTIA; SAMUEL REZENDE PAIVA, SRI.
VIEIRA, F. D.
OLIVEIRA, S. R. de M.
PAIVA, S. R.
format Artigo de periódico
topic_facet Polimorfismo de nucleotídeo único
Seleção de atributos
Modelos preditivos
Regressão penalizada
Feature selection
Predictive modeling
Penalized regression
Single nucleotide polymorphism
Models
author VIEIRA, F. D.
OLIVEIRA, S. R. de M.
PAIVA, S. R.
author_sort VIEIRA, F. D.
title Metodologia baseada em técnicas de mineração de dados para suporte à certificação de raças de ovinos.
title_short Metodologia baseada em técnicas de mineração de dados para suporte à certificação de raças de ovinos.
title_full Metodologia baseada em técnicas de mineração de dados para suporte à certificação de raças de ovinos.
title_fullStr Metodologia baseada em técnicas de mineração de dados para suporte à certificação de raças de ovinos.
title_full_unstemmed Metodologia baseada em técnicas de mineração de dados para suporte à certificação de raças de ovinos.
title_sort metodologia baseada em técnicas de mineração de dados para suporte à certificação de raças de ovinos.
publishDate 2016-02-04
url http://www.alice.cnptia.embrapa.br/alice/handle/doc/1036157
http://dx.doi.org/10.1590/1809-4430-Eng.Agric.v35n6p1172-1186/2015
work_keys_str_mv AT vieirafd metodologiabaseadaemtecnicasdemineracaodedadosparasuporteacertificacaoderacasdeovinos
AT oliveirasrdem metodologiabaseadaemtecnicasdemineracaodedadosparasuporteacertificacaoderacasdeovinos
AT paivasr metodologiabaseadaemtecnicasdemineracaodedadosparasuporteacertificacaoderacasdeovinos
_version_ 1756022017724776448