Análisis de componentes principales en teledetección. Consideraciones estadísticas para optimizar su interpretación

icon

12

pages

icon

Español

icon

Documents

2002

Écrit par

Publié par

Lire un extrait
Lire un extrait

Obtenez un accès à la bibliothèque pour le consulter en ligne En savoir plus

Découvre YouScribe et accède à tout notre catalogue !

Je m'inscris

Découvre YouScribe et accède à tout notre catalogue !

Je m'inscris
icon

12

pages

icon

Español

icon

Documents

2002

Lire un extrait
Lire un extrait

Obtenez un accès à la bibliothèque pour le consulter en ligne En savoir plus

Resumen
En este trabajo se ha aplicado el Análisis de Componentes Principales (A.C.P.) a una subimagen LANDSAT 5 TM que comprende a la ciudad de Río Cuarto, provincia de Córdoba, Argentina. Se analizan en detalle consideraciones tales como: ponderación o «peso» de cada banda y número de componentes a ser usados. Se presenta el desarrollo del A.C.P. basado en la matriz de varianza-covarianza y en la de correlación –y sus correspondientes autovalores y autovectores –y consideraciones para decidir cual de ellas usar. También se muestran criterios para seleccionar el número de componentes principales a ser usados. Si el objetivo es ponderar de la misma manera a todas las bandas intervinientes, debe usarse la matriz de correlación, en cambio, si se desea dar mayor relevancia a aquellas bandas que tienen mayor varianza, debe usarse la matriz de varianza-covarianza. Se presentan tres criterios estadísticos para decidir el número de componentes principales a ser usados: (a) En la curva que muestra los porcentajes de variación total explicada por cada componente, considerar aquellos anteriores al punto de inflexión (con lo cual se deberían usar los tres primeros componentes en el problema de aplicación)
(b) Considerar los componentes cuyos autovalores son mayores que el autovalor promedio (con lo cual se deberían usar los dos primeros componentes en el problema)
(c) Usar los componentes cuyos coeficientes de correlación con las bandas son grandes en valor absoluto (con lo cual se deberían usar los dos primeros componentes en el problema).
Abstract
A Principal Components Analysis (PCA) to a LANDSAT 5 TM that includes the city of Río Cuarto, province of Cordoba, Argentina, has been performed. Considerations are analyzed in detail such as: «weight» of each band and number of components to be used. It is presented the development of the PCA based on the covariance and correlation matrices – and their eingenvalues and eigenvectors – and considerations in order to decide which one is the most adequated. It is also suggested criteria to select the number of main components to be used. If the goal is to assign the same weight to all the intervening bands, the correlation matrix must be used, whereas if it is desired to give greater relevance to those bands that have greater variance, the covariance matrix must be used. Three statistical criteria have been shown in order to decide the number of main components to be used: (a) In the curve that shows the percentage of total variation explained by each component, it is necessary to consider the components previous to the saddle point (in this case the three first components should be use)
(b) To consider the components whose eigenvalues are greater than the average (and then the two first components should be used)
(c) To use those components whose correlation coefficients are high in absolute value (and then the two first components should be used, again).
Voir icon arrow

Publié par

Publié le

01 janvier 2002

Langue

Español


Revista de Teledetección. 2002. 17: 43-54.
Análisis de componentes principales en teledetec-
ción. Consideraciones estadísticas para optimizar
su interpretación
1 1 2S. B. Ferrero , M. G. Palacio y O. R. Campanella
Correo electrónico: sferrero@exa.unrc.edu.ar
Universidad Nacional de Río Cuarto
Facultad de Ciencias Exactas, Físico-Químicas y Naturales
Ruta 8 km. 603 - (5800) Río Cuarto - Córdoba (Argentina)
1) Departamento de Matemática. 2) Departamento de Geología
RESUMEN ABSTRACT
En este trabajo se ha aplicado el Análisis de A Principal Components Analysis (PCA) to a
Componentes Principales (A.C.P.) a una subimagen LANDSAT 5 TM that includes the city of Río Cuarto,
LANDSAT 5 TM que comprende a la ciudad de Río province of Cordoba, Argentina, has been performed.
Cuarto, provincia de Córdoba, Argentina. Se analizan en Considerations are analyzed in detail such as:
detalle consideraciones tales como: ponderación o «peso» «weight» of each band and number of components to
de cada banda y número de componentes a ser usados. be used.
Se presenta el desarrollo del A.C.P. basado en la It is presented the development of the PCA based
matriz de varianza-covarianza y en la de correlación on the covariance and correlation matrices – and their
–y sus correspondientes autovalores y autovectores –y eingenvalues and eigenvectors – and considerations
consideraciones para decidir cual de ellas usar. in order to decide which one is the most adequated. It
También se muestran criterios para seleccionar el is also suggested criteria to select the number of main
número de componentes principales a ser usados. components to be used.
Si el objetivo es ponderar de la misma manera a If the goal is to assign the same weight to all the
todas las bandas intervinientes, debe usarse la matriz intervening bands, the correlation matrix must be
de correlación, en cambio, si se desea dar mayor rele- used, whereas if it is desired to give greater relevance
vancia a aquellas bandas que tienen mayor varianza, to those bands that have greater variance, the cova-
debe usarse la matriz de varianza-covarianza. riance matrix must be used.
Se presentan tres criterios estadísticos para decidir el Three statistical criteria have been shown in order
número de componentes principales a ser usados: (a) to decide the number of main components to be used:
En la curva que muestra los porcentajes de variación (a) In the curve that shows the percentage of total
total explicada por cada componente, considerar aque- variation explained by each component, it is neces-
llos anteriores al punto de inflexión (con lo cual se sary to consider the components previous to the sadd-
deberían usar los tres primeros componentes en el pro- le point (in this case the three first components should
blema de aplicación); (b) Considerar los componentes be use); (b) To consider the components whose eigen-
cuyos autovalores son mayores que el autovalor pro- values are greater than the average (and then the two
medio (con lo cual se deberían usar los dos primeros first components should be used); (c) To use those
componentes en el problema); (c) Usar los componen- components whose correlation coefficients are high
tes cuyos coeficientes de correlación con las bandas in absolute value (and then the two first components
son grandes en valor absoluto (con lo cual se deberían should be used, again).
usar los dos primeros componentes en el problema).
KEY WORDS: remote sensing, Principal Component
PALABRAS CLAVE: teledetección, Análisis de Analysis (PCA).
Componentes Principales (ACP).
desde el sol, con distintas intensidades o nivelesINTRODUCCIÓN
digitales (ND) de acuerdo a la región del espectro
Teledetección espacial (firma espectral). Este fenómeno es el eje funda-
mental de la teledetección.Las diferentes coberturas de la superficie terrestre
Los datos son adquiridos en soporte digital y en(campos cultivados, roca desnuda, agua) reflejan la
radiación electromagnética (REM) que les llega formato numérico (ND) para cada elemento de la
N.º 17 - Junio 2002 43S. B. Ferrero, M. G. Palacio y O. R. Campanella
superficie y para cada banda). Esto abre un enorme perder una parte significativa de la información ori-
campo para la aplicación de la estadística a las cien- ginal (Chuvieco, 1996). Para el usuario final de pro-
cias de observación terrestre. Diversos métodos del ductos de teledetección, el objetivo del ACP es
análisis multivariado son utilizados en teledetección. construir una o varias imágenes que incrementen su
Cualquier imagen puede pensarse como una capacidad de diferenciar distintas coberturas. Es
matriz tridimensional, en la que cada una de las por ello que al realizar una composición color resul-
intersecciones de una fila y una columna correspon- ta interesante usar, en lugar de algunas bandas de la
de a una posición geográfica discreta, y por lo tanto imagen, los componentes principales 1, 2 y 3 en la
a un píxel, y la tercera dimensión está dada por la secuencia RGB respectivamente.
banda a la cual corresponde ese píxel. En otros tér- El ACP puede aplicarse como realce previo a la
minos, cada nivel digital asociado a un píxel puede interpretación visual o como procesamiento anterior
denotarse como ND donde i es el número de fila, a la clasificación. En general, esta técnica incremen-i,j,k
j es el número de columna y k es la banda. ta la eficiencia computacional de la clasificación
Teniendo presente este carácter matricial de cual- porque reduce la dimensionalidad de los datos.
quier imagen numérica, se pueden realizar sobre Por otra parte, desde el punto de vista estadístico,
ella transformaciones y operaciones estadísticas. el ACP facilita una primera interpretación sobre los
Por ejemplo, con los datos de una imagen digital se ejes de variabilidad de la imagen, lo que permite
pueden calcular medidas de tendencia central y dis- identificar aquellos rasgos que aparecen en la
persión en cada banda, aumentar el contraste, cam- mayoría de las bandas y aquellos otros que son
biar su orientación numérica (rotación de la matriz), específicos de algún grupo de ellas (Chuvieco,
realizar combinaciones aritméticas entre bandas, opcit). Este trabajo se refiere a casos en los que
sintetizar varias bandas reduciendo la información interesa identificar la información común a la
redundante (componentes principales) o discrimi- mayoría de las bandas, que está presente en los pri-
nar grupos con ND homogéneos dentro de la matriz meros componentes.
(clasificación). El ACP también es usado en aplicaciones multi-
temporales con el objeto de detectar cambios en dis-
tintas fechas. En este caso, los primeros componen-
Transformaciones lineales de los datos de imágenes tes resultantes del análisis no son los más interesan-
tes ya que recogen información común a las distin-
El carácter digital de las imágenes y su forma tas fechas (la estable). Los últimos componentes
vectorial permite generar nuevas imágenes aplican- ofrecen la información no común (el cambio) que es
do transformaciones lineales a una o varias imáge- lo que interesa en este contexto (Chuvieco, opcit).
nes. Las nuevas imágenes representan una descrip- Algebraicamente, el ACP genera nuevas varia-
ción alternativa de los datos, en la cual los nuevos bles (componentes), mediante una combinación
ND de un píxel están relacionados con sus ND ori- lineal de las p variables originales (bandas).
ginales a través de una operación lineal. La imagen Aunque se requieren los p componentes principales
transformada puede destacar ciertas características para reproducir la variabilidad total, muchas veces
que no era posible discernir en los datos originales la mayor parte de ella está contenida en un número
o, alternativamente, preservar la información esen- menor de componentes m. En ese caso, reempla-
cial contenida en la imagen en un número menor de zando las p bandas por los m componentes, se redu-
dimensiones. Las transformaciones pueden llevarse ce la dimensionalidad del problema conservando
a cabo para realizar un mejoramiento de la imagen casi la totalidad de la información.
o como un análisis previo a la aplicación de técni- En teledetección, la adquisición de imágenes en
cas de clasificación. bandas adyacentes del espectro implica, con frecuen-
cia, detectar información redundante (en apariencia
las bandas de la imagen se visualizan de manera simi-
ANÁLISIS DE COMPONENTES PRINCIPA- lar) . Por ello, los ND de los píxeles de una banda pue-
LES den presentar una importante relación con los de otra,
resultando una o más de una de ellas irrelevantes.
El objetivo del Análisis de Componentes Aunque la imagen puede arreglarse en una matriz
Principales (ACP) es resumir un grupo amplio de tridimensional, para realizar el ACP se utiliza una
variables en un nuevo conjunto (más pequeño) sin

Voir icon more
Alternate Text