Metodologia baseada em técnicas de mineração de dados para suporte à certificação de raças de ovinos.
O objetivo deste trabalho foi desenvolver uma metodologia baseada em técnicas de mineração de dados para selecionar os principais marcadores SNP (Single Nucleotide Polymorphism) para as raças de ovinos: Crioula, Morada Nova e Santa Inês. Os dados utilizados foram obtidos do Consórcio Internacional de Ovinos e são compostos por 72 animais das raças citadas, e cada animal possui 49.034 marcadores SNP. Considerando que o número de atributos (marcadores) é muito maior que o de observações (animais), foram aplicadas as técnicas de predição LASSO (Least Absolute Shrinkage and Selection Operator), Random Forest e Boosting para a geração de modelos preditivos que incorporam métodos de seleção de atributos. Os resultados revelaram que os modelos preditivos selecionaram os principais marcadores SNP para identificação das raças estudadas. O modelo LASSO selecionou um total de 29 marcadores relevantes. A partir dos modelos Random Forest e Boosting, foram obtidos 27 e 20 marcadores importantes, respectivamente. Por meio da intersecção dos modelos gerados, identificou-se um subconjunto de 18 marcadores com maior potencial de identificação das raças.
Main Authors: | , , |
---|---|
Other Authors: | |
Format: | Artigo de periódico biblioteca |
Language: | pt_BR por |
Published: |
2016-02-04
|
Subjects: | Polimorfismo de nucleotídeo único, Seleção de atributos, Modelos preditivos, Regressão penalizada, Feature selection, Predictive modeling, Penalized regression, Single nucleotide polymorphism, Models, |
Online Access: | http://www.alice.cnptia.embrapa.br/alice/handle/doc/1036157 http://dx.doi.org/10.1590/1809-4430-Eng.Agric.v35n6p1172-1186/2015 |
Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
id |
dig-alice-doc-1036157 |
---|---|
record_format |
koha |
spelling |
dig-alice-doc-10361572017-08-16T03:40:16Z Metodologia baseada em técnicas de mineração de dados para suporte à certificação de raças de ovinos. VIEIRA, F. D. OLIVEIRA, S. R. de M. PAIVA, S. R. FÁBIO DANILO VIEIRA, CNPTIA; STANLEY ROBSON DE MEDEIROS OLIVEIRA, CNPTIA; SAMUEL REZENDE PAIVA, SRI. Polimorfismo de nucleotídeo único Seleção de atributos Modelos preditivos Regressão penalizada Feature selection Predictive modeling Penalized regression Single nucleotide polymorphism Models O objetivo deste trabalho foi desenvolver uma metodologia baseada em técnicas de mineração de dados para selecionar os principais marcadores SNP (Single Nucleotide Polymorphism) para as raças de ovinos: Crioula, Morada Nova e Santa Inês. Os dados utilizados foram obtidos do Consórcio Internacional de Ovinos e são compostos por 72 animais das raças citadas, e cada animal possui 49.034 marcadores SNP. Considerando que o número de atributos (marcadores) é muito maior que o de observações (animais), foram aplicadas as técnicas de predição LASSO (Least Absolute Shrinkage and Selection Operator), Random Forest e Boosting para a geração de modelos preditivos que incorporam métodos de seleção de atributos. Os resultados revelaram que os modelos preditivos selecionaram os principais marcadores SNP para identificação das raças estudadas. O modelo LASSO selecionou um total de 29 marcadores relevantes. A partir dos modelos Random Forest e Boosting, foram obtidos 27 e 20 marcadores importantes, respectivamente. Por meio da intersecção dos modelos gerados, identificou-se um subconjunto de 18 marcadores com maior potencial de identificação das raças. Journal of the Brazilian Association of Agricultural Engineering. 2016-02-04T11:11:11Z 2016-02-04T11:11:11Z 2016-02-04 2015 2016-02-05T11:11:11Z Artigo de periódico Engenharia Agrícola, Jaboticabal, v. 35, n. 6, p. 1172-1186, nov./dez. 2015. http://www.alice.cnptia.embrapa.br/alice/handle/doc/1036157 http://dx.doi.org/10.1590/1809-4430-Eng.Agric.v35n6p1172-1186/2015 pt_BR por openAccess |
institution |
EMBRAPA |
collection |
DSpace |
country |
Brasil |
countrycode |
BR |
component |
Bibliográfico |
access |
En linea |
databasecode |
dig-alice |
tag |
biblioteca |
region |
America del Sur |
libraryname |
Sistema de bibliotecas de EMBRAPA |
language |
pt_BR por |
topic |
Polimorfismo de nucleotídeo único Seleção de atributos Modelos preditivos Regressão penalizada Feature selection Predictive modeling Penalized regression Single nucleotide polymorphism Models Polimorfismo de nucleotídeo único Seleção de atributos Modelos preditivos Regressão penalizada Feature selection Predictive modeling Penalized regression Single nucleotide polymorphism Models |
spellingShingle |
Polimorfismo de nucleotídeo único Seleção de atributos Modelos preditivos Regressão penalizada Feature selection Predictive modeling Penalized regression Single nucleotide polymorphism Models Polimorfismo de nucleotídeo único Seleção de atributos Modelos preditivos Regressão penalizada Feature selection Predictive modeling Penalized regression Single nucleotide polymorphism Models VIEIRA, F. D. OLIVEIRA, S. R. de M. PAIVA, S. R. Metodologia baseada em técnicas de mineração de dados para suporte à certificação de raças de ovinos. |
description |
O objetivo deste trabalho foi desenvolver uma metodologia baseada em técnicas de mineração de dados para selecionar os principais marcadores SNP (Single Nucleotide Polymorphism) para as raças de ovinos: Crioula, Morada Nova e Santa Inês. Os dados utilizados foram obtidos do Consórcio Internacional de Ovinos e são compostos por 72 animais das raças citadas, e cada animal possui 49.034 marcadores SNP. Considerando que o número de atributos (marcadores) é muito maior que o de observações (animais), foram aplicadas as técnicas de predição LASSO (Least Absolute Shrinkage and Selection Operator), Random Forest e Boosting para a geração de modelos preditivos que incorporam métodos de seleção de atributos. Os resultados revelaram que os modelos preditivos selecionaram os principais marcadores SNP para identificação das raças estudadas. O modelo LASSO selecionou um total de 29 marcadores relevantes. A partir dos modelos Random Forest e Boosting, foram obtidos 27 e 20 marcadores importantes, respectivamente. Por meio da intersecção dos modelos gerados, identificou-se um subconjunto de 18 marcadores com maior potencial de identificação das raças. |
author2 |
FÁBIO DANILO VIEIRA, CNPTIA; STANLEY ROBSON DE MEDEIROS OLIVEIRA, CNPTIA; SAMUEL REZENDE PAIVA, SRI. |
author_facet |
FÁBIO DANILO VIEIRA, CNPTIA; STANLEY ROBSON DE MEDEIROS OLIVEIRA, CNPTIA; SAMUEL REZENDE PAIVA, SRI. VIEIRA, F. D. OLIVEIRA, S. R. de M. PAIVA, S. R. |
format |
Artigo de periódico |
topic_facet |
Polimorfismo de nucleotídeo único Seleção de atributos Modelos preditivos Regressão penalizada Feature selection Predictive modeling Penalized regression Single nucleotide polymorphism Models |
author |
VIEIRA, F. D. OLIVEIRA, S. R. de M. PAIVA, S. R. |
author_sort |
VIEIRA, F. D. |
title |
Metodologia baseada em técnicas de mineração de dados para suporte à certificação de raças de ovinos. |
title_short |
Metodologia baseada em técnicas de mineração de dados para suporte à certificação de raças de ovinos. |
title_full |
Metodologia baseada em técnicas de mineração de dados para suporte à certificação de raças de ovinos. |
title_fullStr |
Metodologia baseada em técnicas de mineração de dados para suporte à certificação de raças de ovinos. |
title_full_unstemmed |
Metodologia baseada em técnicas de mineração de dados para suporte à certificação de raças de ovinos. |
title_sort |
metodologia baseada em técnicas de mineração de dados para suporte à certificação de raças de ovinos. |
publishDate |
2016-02-04 |
url |
http://www.alice.cnptia.embrapa.br/alice/handle/doc/1036157 http://dx.doi.org/10.1590/1809-4430-Eng.Agric.v35n6p1172-1186/2015 |
work_keys_str_mv |
AT vieirafd metodologiabaseadaemtecnicasdemineracaodedadosparasuporteacertificacaoderacasdeovinos AT oliveirasrdem metodologiabaseadaemtecnicasdemineracaodedadosparasuporteacertificacaoderacasdeovinos AT paivasr metodologiabaseadaemtecnicasdemineracaodedadosparasuporteacertificacaoderacasdeovinos |
_version_ |
1756022017724776448 |