Busca de relações quando o número de variáveis é muito maior que o de observações: o caso de dados hiperespectrais.

Resumo: Experimentos em que são coletadas muitas medidas em cada unidade experimental têm matrizes de dados nas quais o número de colunas (variáveis) é muito maior que o de linhas (observações). Dados hiperespectrais são habitualmente coletados por instrumentos que medem instantaneamente as reflectâncias de um alvo em milhares de comprimentos de onda e podemos considerar que cada uma delas constitui uma variável prognóstica num modelo de regressão. A facilidade na obtenção de cada vez maior número de variáveis simultâneas não se repete na obtenção das observações dessas variáveis. A análise de componentes principais (ACP) é indicada para tratar tal quantidade de variáveis e reduzir a dimensionalidade dos dados, mas sua aplicação ainda exige a obtenção de um grande número de medidas. Já a análise discriminante é usada na tentativa de classificar diferentes alvos, mas precisa ser precedida da seleção de um pequeno subconjunto de bandas, geralmente escolhidas com base em informações preexistentes e não nos próprios dados. A regressão linear permite empregar o método stepwise para selecionar um subconjunto de bandas, mas só é indicada para variáveis dependentes quantitativas. O presente trabalho propõe o uso da regressão logística politômica stepwise para selecionar um pequeno conjunto de bandas espectrais que discrimine alvos em k classes, quando a variável resposta de interesse é nominal. Apresentamos um exemplo no qual os dados espectrais são utilizados para construção de modelos logísticos com um pequeno número de preditores (bandas) para classificação de folhas verdes em classes correspondentes a três culturas agrícolas: soja perene, milho e braquiária.

Saved in:
Bibliographic Details
Main Authors: LUIZ, A. J. B., MAIA, A. de H. N., SANCHES, I. D. A., GÜRTLER, S., SOUZA FILHO, C. R. de
Other Authors: ALFREDO JOSE BARRETO LUIZ, CNPMA; ALINE DE HOLANDA NUNES MAIA, CNPMA; IEDA DEL'ARCO SANCHES, INPE; SALETE GURTLER, INPE; CARLOS ROBERTO DE SOUZA FILHO, IG-UNICAMP.
Format: Separatas biblioteca
Language:pt_BR
por
Published: 2016-01-27
Subjects:Regressão logística politômica, Seleção de variáveis explicativas, Polytomous logistic regression, Stepwise, Selection of explanatory variables, Regressão linear, Estatística agrícola, Sensoriamento remoto, Linear models, Remote sensing,
Online Access:http://www.alice.cnptia.embrapa.br/alice/handle/doc/1035294
Tags: Add Tag
No Tags, Be the first to tag this record!
Description
Summary:Resumo: Experimentos em que são coletadas muitas medidas em cada unidade experimental têm matrizes de dados nas quais o número de colunas (variáveis) é muito maior que o de linhas (observações). Dados hiperespectrais são habitualmente coletados por instrumentos que medem instantaneamente as reflectâncias de um alvo em milhares de comprimentos de onda e podemos considerar que cada uma delas constitui uma variável prognóstica num modelo de regressão. A facilidade na obtenção de cada vez maior número de variáveis simultâneas não se repete na obtenção das observações dessas variáveis. A análise de componentes principais (ACP) é indicada para tratar tal quantidade de variáveis e reduzir a dimensionalidade dos dados, mas sua aplicação ainda exige a obtenção de um grande número de medidas. Já a análise discriminante é usada na tentativa de classificar diferentes alvos, mas precisa ser precedida da seleção de um pequeno subconjunto de bandas, geralmente escolhidas com base em informações preexistentes e não nos próprios dados. A regressão linear permite empregar o método stepwise para selecionar um subconjunto de bandas, mas só é indicada para variáveis dependentes quantitativas. O presente trabalho propõe o uso da regressão logística politômica stepwise para selecionar um pequeno conjunto de bandas espectrais que discrimine alvos em k classes, quando a variável resposta de interesse é nominal. Apresentamos um exemplo no qual os dados espectrais são utilizados para construção de modelos logísticos com um pequeno número de preditores (bandas) para classificação de folhas verdes em classes correspondentes a três culturas agrícolas: soja perene, milho e braquiária.