Color">
PDF Todo Pib
PDF Todo Pib
PDF Todo Pib
Biomédicas
Representación de una imagen
¿Qué es una imagen?
Definición de Imagen
Una imagen puede ser definida matemáticamente por una
función:
F(x,y)
donde x e y son coordenadas espaciales de la imagen sobre
el plano y f es la intensidad o nivel de gris en ese punto
coordenado
Imagen digital
Si las coordenasas x e y,
junto con la amplitud de
los valores de f, son
cantidades discretas,
entonces hablamos de
una imagen digital o mapa
de bits.
Pixel
Unidad más pequeña
de información que
compone una
imagen.
La cantidad de pixeles
de una imagen
determina el tamaño
en BYTES que esta
tendrá.
Mapa de Bits
Las imágenes mapa de bits
se refieren a que la imagen
estará construida por una
cuadrícula discreta que va a
contener información acerca
del color de cada una de
ellas.
Profundidad de Pixel
Vecindad de Von
Neumann de radio uno.
Los píxeles horizontales y
verticales, más cercanos,
que rodean al que
tomamos como central
P(x,y).
Vecindad entre Píxeles
Un píxel P ubicado en las coordenadas (x,y) posee también
cuatro vecinos diagonales cuyas coordenadas serán:
El histograma es una
representación gráfica de
la distribución de los
distintos tonos de una
imagen.
Histograma
Percepción de imágenes
BRILLO
Propiedad de la imagen que
nos permite ver con mayor
claridad los objetos. El brillo
aumenta la luminosidad
total de la imagen, por
ejemplo aclarando los
colores oscuros y
blanqueando los claros.
Percepción de imágenes
Percepción de imágenes
CONTRASTE
Diferencia relativa en intensidad
que existe entre un punto de una
imagen y sus alrededores.
Cuando el contraste es nulo,
resulta imposible distinguir un
objeto de su fondo. En cambio, a
mayor contraste, mayor facilidad
para la diferenciación.
Percepción de imágenes
Percepción de imágenes
NITIDEZ
I(t)=I0e-𝝻t
Imagen de Rayos X
En la placa, o radiografía, de
rayos X plana la imagen es
una simple proyección
bidimensional, o un
diagrama de sombras, de un
objeto tridimensional. La
superposición 2D de tejidos
del paciente en el campo de
visión circunscripto por el
colimador del equipo.
Resolución espacial
El desenfoque total, o la falta de nitidez, de un sistema
comprende una combinación de fuentes contribuyentes:
Utot≈(Ug2+Um2+Ud2+Ui2)½
Eventos de coincidencia
Emisores de positrones
Medicina Nuclear: PET
Modalidad de Imágenes
Médicas
Existe un segundo
conjunto de
modalidades de
obtención de imágenes
que utiliza radiación
no-ionizante como
método de adquisición.
Resonancia Magnética:
MRI
La resonancia magnética (MRI) utiliza el
fenómeno de la resonancia magnética
nuclear: los nucleones no apareados se
orientan en un campo magnético, y los
pulsos de radiofrecuencia se utilizan
para cambiar el equilibrio de sus
orientaciones. Cuando el sistema
restablece el equilibrio, produce las
señales que forman la imagen.
Resonancia Magnética:
MRI
Las imágenes de resonancia
magnética proporcionan detalles
anatómicos y fisiológicos, es decir,
estructura y función de tejidos,
excelente visualización de los
mismos y alta una alta resolución
espacial. El método más versátil y
completo.
Resonancia Magnética:
MRI
La resonancia magnética se basa en la
resonancia magnética nuclear. Los
nucleones no apareados se comportan
como pequeños imanes, con un
momento magnético asociado. El núcleo
de hidrógeno, un solo protón, es de
particular importancia en las imágenes
de resonancia magnética debido a su
abundancia en los tejidos biológicos.
Resonancia Magnética:
MRI
Resonancia Magnética:
MRI
Un campo magnético oscilante
aplicado como un pulso puede
rotar la magnetización en la
muestra y colocarla en el plano
transverso. Cuando el pulso de
excitación termina, la
magnetización transversa en la
muestra precesa alrededor del
campo constante.
Resonancia Magnética:
MRI
Ecografía
El ultrasonido para uso
diagnóstico utiliza sonido de
alta frecuencia y una técnica
simple de pulso-eco. Cuando
un haz de ultrasonido se
extiende a través de un
volumen de interés, se puede
formar una imagen transversal
a partir de un mapeo de
intensidades de eco.
Ecografía
Las imágenes se obtienen mediante el
procesamiento de los haces
ultrasónicos (ecos) reflejados por las
estructuras corporales. Luego,
mediante un complejo proceso
electrónico se transforma en una
imagen en la pantalla. El porcentaje
del haz que es reflejado, se determina
mediante la diferencia en la
impedancia acústica entre los dos
medios.
Ecografía
El ultrasonido se define como una
serie de ondas mecánicas,
generalmente longitudinales,
originadas por la vibración de un
cuerpo elástico (cristal
piezoeléctrico) y propagadas por
un medio material (tejidos
corporales) cuya frecuencia
supera a la del sonido audible por
el humano.
Ecografía
Cuando un haz ultrasónico es
propagado de un medio a otro,
parte de él se propaga a través del
segundo medio, mientras que un
pequeño porcentaje es reflejado a
manera de «eco» y llega al
transductor ( receptor) en donde
se transforma en un pequeño
pulso de voltaje.
Ecografía
Las imágenes ecográficas están
formadas por una matriz de
elementos fotográficos. Las
imágenes en escala de grises
están producidas por la
visualización de los ecos
regresando al transductor como
elementos fotográficos ( píxeles)
variando en brillo en proporción
a la intensidad del eco.
Ecografía
Procesamiento de Imágenes
Biomédicas
Mejoramiento de Imágenes I: Dominio
Espacial
¿Qué significa mejorar
una imagen?
Muestreo y
Cuantización
Si deseamos pasar una imagen
continua f(x,y) a forma digital,
tenemos que muestrear la función
en ambas coordenadas y en
amplitud. La digitalización de los
valores de coordenadas se llama
muestreo. La digitalización de los
valores de amplitud se llama
cuantización.
Aliasing
g(x,y)=f(x,y)+η(x,y)
g(x,y)=f(x,y)+f(x,y)η(x,y)
g(x,y)=f(x,y)(1+η(x,y))
Toma valores en un
determinado intervalo de
forma equiprobable. Se
da en un menor número
de situaciones reales.
Imagen Mejorada
➔ Para la percepción visual humana:
◆ La evaluación de la calidad de una imagen es un
proceso bastante subjetivo.
◆ Es difícil normalizar la definición de lo que es una
buena imagen.
➔ Para un programa:
◆ La evaluación es más fácil.
◆ Una buena imagen es la que produce el mejor
resultado del algoritmo de reconocimiento.
Filtrado Digital
g(x,y) = T[f(x,y)]
Produce un imagen
(binaria) con dos niveles,
blanco y negro.
Convolución
Convolución
Convolución
Para poder aplicar también la convolución en los píxeles del
borde de la imagen existen varias alternativas, algunas de
las cuales son:
I. Completar con ceros los valores de alrededor.
II. Repetir los valores en el borde.
III. Completar con los valores de la parte simétrica opuesta.
Filtros
Existen muchos
tipos de filtros,
que cumplen
distintas
funciones.
Filtros
★ Suavizar la imagen: reducir las variaciones de intensidad
entre píxeles vecinos.
★ Eliminar ruido: modificar aquellos píxeles cuyo nivel de
intensidad es muy diferente al de sus vecinos.
★ Realzar la imagen: aumentar las variaciones de
intensidad, allí donde se producen.
★ Detectar bordes: detectar aquellos píxeles donde se
produce un cambio brusco en la función intensidad.
Máscaras más utilizadas
Filtrado del Ruido
Se prefieren los filtros espaciales:
G(x,y)=1/2πσ2(e -(x2+y2)/2σ2)
Filtro Gaussiano
Algunas Ventajas:
Ventajas:
❖ Filtros Lineales:
➢ Pasa Bajo
➢ Paso Alto
➢ Pasa Banda
❖ Filtros No-Lineales
Otra Clasificación
Basándose en su finalidad:
∇f~[(∂f/∂y)2+(∂f/∂x)2]½
θ=arctg[∂f/∂x/∂f/∂y]
Detección de Borde
Detectar los bordes de una imagen se
trata de localizar los cambios
abruptos en la función intensidad de
la imagen y resaltarlos.
La mayoría de las técnicas para
detectar bordes emplean operadores
locales basados en distintas
aproximaciones discretas de la
primera y segunda derivada entre los
niveles de grises de la imagen.
Detección de Bordes
Por lo tanto, detectar un borde
consiste en encontrar, para cada
(x, y):
➢ La magnitud de ∇f (x, y)
∇ƒ≈[(I6-I8)2+(I5-I9)2]1/2
∇ƒ≈|(I7+I8+I9)-(I1+I2+I3)|+
|(I3+I6+I9)-(I1+I4+I7)|
PREWITT SOBEL
Ejemplo Filtro Roberts
Ejemplo Filtro Prewitt y
Sobel
Filtros Diferenciales: Método
de Derivadas Segundas
Si solamente nos interesa la magnitud (sin la orientación)
definimos el operador lineal Laplaciano:
∇2f(x,y)=∂2f/∂x2 + ∂2f/∂y2
h( rk)=nk
p( rk)=h( rk)/n=nk/n
Histograma Acumulado
Un escáner de Tomografía
Computarizada consta de una
estructura circular, denominada
gantry, que contiene una fuente de
rayos X y los detectores. Esto nos
permite medir la radiación luego de
atravesar al paciente, quien se
encuentra recostado en una camilla
que se mueve lentamente a través
del gantry.
Un poco de Historia...
El problema trataba de
determinar, en primer lugar, los
niveles de atenuación de los
rayos X, al atravesar una sección
del cuerpo, y en segundo lugar,
con la información obtenida,
reconstruir el objeto
desconocido determinando su
densidad en cada punto.
Transformada de Radon
Si expresamos a 𝜇𝑐(𝑥,𝑦)=𝑓(𝑥,𝑦).
Al interactuar el haz de rayos X con la
sección transversal su intensidad
disminuirá satisfaciendo la ley de
Beer:
La representación en el plano de la
transformada de Radon se suele
llamar sinograma: es la
representación gráfica de una
matriz en la que el índice de las filas
depende del ángulo θ y el índice de
las columnas depende de la
distancia t de la línea de medida al
centro de coordenadas del sistema
de detección.
Sinograma
Unidades Hounsfield
Resultado de la
transformación de la escala
de coeficientes de atenuación
lineal de rayos X en una
nueva escala en la cual el
valor de atenuación del agua
destilada en CNPT, se define
como 0 unidades de
Hounsfield (HU), mientras
que la radiodensidad del aire
se define como -1000 HU.
Algoritmos de Reconstrucción
En la práctica, ni el ángulo θ ni el
parámetro t resultan ser variables
continuas. Por lo tanto, la
medición experimental es un
conjunto discreto de proyecciones
para un número finito de ángulos.
A partir de este conjunto, la
cuestión es buscar un algoritmo
para reconstruir la imagen f’(x, y). {Pθj(tk), j, k = 0, 1, 2,..., n-1}
Algoritmos:Retroproyección
Simple
El problema de la reconstrucción
consiste, entonces, en calcular la
distribución del objeto f(x,y) (o lo
que llamamos antes μ), dadas las
proyecciones, es decir, las
transformadas de Radon.
➔ Aunque es posible retroproyectar
el sinograma al espacio de la
imagen, esto conduce a una
imagen borrosa.
Algoritmos:Retroproyección
Simple
Para brindar una aproximación mejorada a la solución del
problema anterior, se propuso el teorema de la proyección,
también llamado teorema de corte central o teorema de
corte de Fourier, por su traducción del inglés (central slice o
Fourier slice theorem)
La consistencia de esta
representación en forma
de serie de Fourier se
basa en que dicha
función queda
unívocamente definida
mediante la
especificación de los
coeficientes C.
Transformada de Fourier: 1D
● Escribimos la transformada
de fourier de la proyección.
● Por la expresión de la
transformada de Radon
obtenemos la segunda
ecuación.
● Sustituyendo:
x=t cosθ-s senθ ; y=t senθ+s cosθ
Siendo unitario el jacobiano
obtenemos la tercer ecuación.
Teorema de Corte de Fourier
★ Crecimiento de región
★ Umbralización
Segmentación
Clasificación:
➢ Estructural: Trabajan sobre la información
estructural de las regiones de la imagen.
➢ Estocásticas: Trabajan sobre los valores de píxeles
discretos de la imagen
➢ Híbridas: usan la información estructural de regiones
y de píxeles discretos juntas.
Segmentación
Estructural
Estocástica
Segmentación
Algunas de las aplicaciones prácticas de la
segmentación de imágenes son las siguientes:
★ Pruebas médicas:
○ Localización de tumores y otras patologías.
○ Medida de volúmenes de tejido.
○ Cirugía guiada por ordenador.
○ Diagnóstico.
○ Planificación del tratamiento.
○ Estudio de la estructura anatómica.
Segmentación
Comenzaremos estudiando desde el enfoque de las
similitudes entre los niveles de grises. Para ello,
determinaremos algunos conceptos, algoritmos y métodos
fundamentales que nos permitirán segmentar nuestras
imagenes de interés.
Umbralizado
La umbralización es uno de los más importantes métodos de
segmentación. El objetivo es convertir una imagen en escala
de grises a una nueva con sólo dos niveles, de manera que los
objetos queden separados del fondo.
Recordemos...
La binarización de
imágenes es una técnica
del procesamiento de
imágenes que consiste en
un proceso de reducción
de la información digital
a dos valores: Negro (0) y
Blanco (1)
Umbralizado Global
Una forma de extraer el objeto del fondo es seleccionar un umbral de
intensidad T que separe los dos conjuntos de valores. Así, cualquier
punto (x, y), donde f(x,y)>T, será parte del objeto sino será partes del
fondo. Si los valores de gris del objeto y del resto de la imagen difieren
claramente, entonces el histograma mostrará una distribución bimodal.
De esta forma lograremos una separación entre el objeto y el fondo.
Umbralizado Global
Tipos deUmbralizado: Multiple
Con el método global del valor
umbral se elige un valor umbral
para toda la imagen.
Pero si establecemos varios
valores umbral se puede modificar
el método de manera tal que
tengamos más de dos segmentos
en la misma imagen.
Tipos deUmbralizado: Invertido
Aquí se invierten los valores de los píxeles, por lo que
esperamos que los más brillantes, que el valor de umbral,
sean negros y los valores más oscuros de la imagen sean
los blancos.
Tipos deUmbralizado: A cero
Esta vez, esperamos que los píxeles más oscuros ( por
debajo del umbral) se volverán completamente negros,
mientras que los píxeles con valor mayor que el umbral
mantendrán su valor original.
Umbralizado Local
Con el método local del valor umbral se divide la imagen original en
regiones y se establece un valor umbral para cada una de ellas.
Una extensión del método local es el método del valor umbral dinámico,
en el que se define para cada pixel una zona vecina N a la que se asigna
un valor umbral adecuado t(N).
Umbralizado Local
Método de Otsu
En general el punto central, de la
segmentación por umbralización,
es encontrar el valor umbral más
adecuado. Un método
ampliamente utilizado es el
método de Otsu. Llamado así en
honor a Nobuyuki Otsu que lo
inventó en 1979, y utiliza técnicas
estadísticas, para resolver el
problema.
Método de Otsu
El método de Otsu calcula el valor umbral de forma que la
dispersión dentro de cada segmento sea lo más pequeña
posible, pero al mismo tiempo que sea lo más alta posible
entre segmentos diferentes. Para ello se calcula el cociente
entre ambas varianzas y se busca un valor umbral
maximizando el cociente.
Método de Otsu
Definimos dos distribuciones de probabilidad,una para los
objetos y otra para el fondo. Se tienen en cuenta que la
probabilidad de que ocurra un nivel de gris dado es:
Interación 6 Interación 7
k-means
k-means
k-means
Las principales ventajas del método k-means son que es un
método sencillo y rápido. sin embargo, es necesario decidir
el valor de k y el resultado final depende directamente de la
inicialización de los centroides,que en principio, no converge
al mínimo global sino a un mínimo local.
k-means
Procesamiento de Imágenes
Biomédicas
Segmentación II: Contornos Activos,
Etiquetado, Bounding Box.
¿A qué nos referimos
cuando hablamos de
modelos deformables?
Modelos Deformables
Los modelos deformables son curvas
( para imágenes 2D), o superficies
( para 3D), compuestas de un material
elástico definidas por ecuaciones
diferenciales que determinan su forma
y su movimiento.
La interpretación física de un modelo
deformable es la de un cuerpo elástico
que responde a fuerzas y restricciones
que sobre él se aplican.
Modelos Deformables
Consideramos entonces la aplicación de modelos de
contornos deformables como un método para extraer formas
“suaves” en una región u objeto de la imagen.
Es un proceso de segmentación, se interpreta como una curva
elástica que, introducida en la imagen, se despliega hasta
alcanzar la frontera del contorno correspondiente al objeto
que se desea segmentar.
Modelos Deformables
La filosofía del enfoque es lograr que
la curva se acomode moviéndose
desde su posición inicial hasta el
borde deseado, a partir de la acción
de dos tipos de fuerzas:
★ Internas, restricciones de suavidad
y fuerzas de presión.
★ Externas, fuerzas de atracción de
aristas y fuerzas de peso.
Contornos Activos
Específicamente, en el
método de segmentación
por Contornos Activos, se
propone una estimación
inicial de una curva
(“Snake”) y luego se usa un
sistema de optimización,
para refinar la estimación
inicial a partir de los datos
de la imagen.
Contornos Activos
dE(ν)/dν=
0
Contornos Activos
Estos modelos deformables tienen dos tipos de energías
asociadas: una energía interna, que caracteriza los
atributos deseados del contorno; y una energía externa,
que ata el contorno con lo esencial de la imagen. El
objetivo es la minimización de la suma de estas energías.
Contornos Activos
Eint(ν) aporta las características de deformación del contorno
elástico, y tiende a mantener la forma de la curva. La primera
componente, trata de minimizar la energía de tensión sobre el
contorno que controla el estiramiento, permitiendo que se
comporte como una cuerda. La segunda componente,
introduce características de rigidez al contorno para lograr
que este sea suave.
Contornos Activos
Los parámetros w1(s) y w2(s), determinan el grado
de tensión y rigidez del contorno respectivamente.
Al variar estos coeficientes, la curva puede cambiar
su comportamiento durante la evolución. Estos
parámetros pueden depender de s, aunque en la
práctica se suelen especificar valores constantes
para toda la curva.
Contornos Activos
Eext(ν) representa la energía potencial del modelo y se define
generalmente a partir de un campo de potenciales P(ν), que
se diseñan de forma tal que sus mínimos locales coincidan
con extremos de intensidad, bordes u otra característica de
interés en la imagen que resulten relevante.
Contornos Activos
Se han propuesto varias alternativas para lograr el
acoplamiento de la curva a las características de la imagen.
Un ejemplo de una función de energía potencial para atraer
el contorno deformable hacia los bordes de la imagen I(x,y)
puede ser:
2 2
∂ ν/∂t = ∂ν/∂t = 0
Contornos Activos
Un modelo simplificado donde μ(s)=0 y el sistema logra el
equilibrio cuando las fuerzas externas se equilibran con las
fuerzas internas y de amortiguación. Será posible
determinar una curva ν que minimice la energía y
represente el borde más cercano al del objeto de interés a
segmentar, resolviendo la ecuación de movimiento.
Contornos Activos
Las ecuaciones que rigen la evolución del modelo no
poseen solución analítica y se requiere la aplicación de
métodos numéricos discretos para su aproximación. El
modelo más utilizado es el T-Snakes.
Contornos Activos
1. Un contorno bidimensional formado por un conjunto de N nodos,
indexados por i=0,1,...,N-1 conectados en serie por N arcos.
2. Asociando a cada nodo una posición si(t)=(xi(t),yi(t)), junto a un vector
normal y las componentes de fuerza que actúan sobre él.
3. Se establece la condición s0(t)=sN(t) para cerrar la curva.
Contornos Activos
La evolución del modelo
deformable se realiza Ecuación de movimiento
moviendo cada nodo si, de
la superficie, por medio de
una versión simplificada y
discreta de la Ecuación de
Movimiento.
donde αi(t), βi(t), ρi(t) y fi(t) son magnitudes vectoriales que
representan las fuerzas de tensión, flexión, inflación y externa
respectivamente y γi es un coeficiente de amortiguación que
regula la velocidad ṡi del i-ésimo nodo.
Contornos Activos: Eint
● La fuerza de tensión
representa la resistencia al
estiramiento, manteniendo un
espaciado uniforme entre los
nodos.
● La fuerza de flexión es la
Ambas se calculan a partir del
resistencia a deformaciones Laplaciano y el Laplaciano
de curvatura. cuadrático. Donde N(i) es el conjunto
de nodos sj vecinos al nodo si y m es
el número de nodos vecinos.
Contornos Activos: Eext
● La fuerza de inflación se
aplica para guiar la
superficie hacia los bordes
del objeto.
2) PÍXEL_NO_ACTIVO
En la salida podemos identificar valores de
PÍXEL_NO_ACTIVO y las etiquetas para cada uno de los
PÍXELES_ACTIVOS.
Etiquetado
Por cada píxel P, mediante una máscara, se evalúa en forma horizontal:
I. Si P tiene etiqueta y todos los vecinos tienen el mismo valor, se
marcan lo vecinos no etiquetados con la misma etiqueta; sino se
obtiene la lista de vecinos presentes y se hace el cambio de
etiqueta(MERGE).
II. Si P no tienen etiqueta y todos sus vecinos no están etiquetados, o
no tiene vecinos, se marca el pixel con la etiqueta siguiente
(incrementando en una unidad a la anterior) y así con todos los
vecinos.
III. Si todos los vecinos etiquetados son diferentes, se obtiene la lista
ordenada de vecinos etiquetados presentes y se hace el cambio de
etiqueta (MERGE); sino se marca a P con la etiqueta del vecino.
Etiquetado
Etiquetado
La desventaja de este proceso es que depende
absolutamente de la segmentación. Si dos objetos
diferentes muy cercanos en la imagen quedan conectados
al binariazarla les corresponderá la misma etiqueta.
Etiquetado
Bounding Box
Los cuadros delimitadores,
conocidos como Bounding Box, son
utilizados para detectar objetos en
el entorno de una imagen. Así, se
representa una posible región de
interés. En general, cada rectángulo
de reconocimiento, o detección de
características, devuelve la región
en forma de coordenadas de
píxeles: el ancho y la altura.
Bounding Box
Usando las coordenadas iniciales junto con el ancho y la
altura (en píxeles), codificamos nuestro algoritmo para
dibujar cuadros. La detección de objetos combina dos
tareas:
1) Dibuja un cuadro delimitador alrededor de cada objeto
de interés.
2) Le asigna una etiqueta de clase a cada cuadro.
Bounding Box
Básicamente, para detectar un objeto
debemos advertir su presencia,
delimitando y separándolo de los
demás objetos ubicados en la imagen.
Eso supone que debemos tener una
imagen con uno o más objetos que al
procesarla nos devuelva uno o más
cuadros delimitadores (definidos por
dos puntos: ancho y alto) y una etiqueta
de clase para cada uno.
Bounding Box
Para construir el rectángulo sobre
la región simplemente se recorre
la imagen binaria pixel por pixel
fila a fila de la imagen hasta
detectar un uno, ymax. De la misma
manera se determinarán las
coordenadas ymin, xmax y xmin.
Bounding Box
Procesamiento de Imágenes
Biomédicas
Segmentación III: Morfología
Matemática, Esqueletización, Métricas
de Calidad de Segmentación .
¿A qué nos referimos
cuando hablamos de
Morfología Matemática?
Morfología Matemática
Las operaciones morfológicas pueden
ser usadas para remover imperfecciones
de la imagen segmentada, para luego
obtener información de la estructura y
forma de los objetos.
La idea del enfoque morfológico es
transformar la imagen, mediante
diversos elementos estructurales, en
otra que preserve las formas esenciales
de los objetos. Facilitando así su
posterior análisis e interpretación.
Morfología Matemática
La morfología matemática nació en
los años sesenta en Francia. George
Matheron estudiaba la relación
entre la geometría de los medios
porosos y sus permeabilidades. A
su vez, Jean Serra cuantificaba la
petrografía de los minerales de
hierro. A partir de estos estudios se
construyeron las bases teóricas
para el análisis morfológico de las
imágenes binarias.
Morfología Matemática
★ La Morfología Matemática en imágenes, describe
un conjunto de técnicas que tratan con la forma
( morfología) de las características de la imagen.
★ Las operaciones morfológicas, son aplicadas para
reducir las imperfecciones que aparecen luego de la
segmentación.
★ Los filtros morfológicos, tienen efectos sobre las
estructuras de la imagen.
Morfología Matemática
Morfología Matemática
El procesamiento morfológico de
imágenes es muy similar al filtrado
espacial. El elemento estructural
recorre cada píxel de la imagen
original para obtener el de la imagen
procesada. El valor de este píxel
nuevo depende de la operación
ejecutada. Hay varias operaciones
morfológicas básicas. Sin embargo,
las de mayor interés en imágenes
son la erosión y la dilatación.
Repasemos...
Teoría básica de conjuntos:
● Unión A∪B
● Intersección A∩B
● Complemento (A)c
● Diferencia A-B
Reflexión
La Reflexión de B se define
de la siguiente manera:
Traslación
La traslación de A por z se
define de la siguiente
manera:
Operaciones Lógicas
Operaciones lógicas entre
imágenes binarias: aquí el negro
representa el uno y blanco el cero.
Morfología Matemática
Los filtros morfológicos se especifican mediante la definición
de dos aspectos: la operación que desempeñan y su
correspondiente estructura de referencia. El tamaño y la forma
de la estructura son dependientes de la aplicación.
Morfología Matemática
El elemento de estructura puede tener “cualquier” forma y
tamaño. Por simplicidad vamos a usar estructuras
rectangulares con origen en el punto central de la estructura.
Donde:
★ i es el número de filas y j el número de columnas
★ V es el valor de la celda (i,,j) en la ventana
★ Ci,j es la probabilidad en la celda i,j
★ N es el número de filas o columnas
Análisis de Texturas
Considerando la imagen de
prueba de 4 x 4 píxeles, y la
relación (1,0), el número total de
posibles pares es de 12; y para
una relación horizontal (derecha
más izquierda) ese número se
duplica (24).
Análisis de Texturas
De esta manera colocando los
valores de probabilidad
normalizamos la matriz.
Aplicando la ecuación a la matriz
simétrica se obtiene el resultado,
donde el sumatorio de todos los
elementos debe ser igual a 1.
Pues, como dijimos, debemos
0,25+0,166x2+0,083x3+0,042x4=1
normalizarla.
Análisis de Texturas
Análisis de Texturas
Análisis de Texturas
Análisis de Texturas
Algunos aspectos a resaltar:
1. Los elementos de la diagonal representan pares de
píxeles que no tienen diferencias en su nivel de gris. Si estos
elementos tienen probabilidades grandes, entonces la
imagen no muestra mucho contraste, la mayoría de los
píxeles son idénticos a sus vecinos.
2. Sumando los valores de la diagonal tenemos la
probabilidad que un píxel tenga el mismo nivel de gris que su
vecino.
Análisis de Texturas
3. Las líneas paralelas a la diagonal separadas una celda,
representan los pares de píxeles con una diferencia de 1 nivel
de gris. De la misma manera sumando los elementos
separados dos celdas de la diagonal, tenemos los pares de
píxeles con dos valores de grises de diferencia, y así
sucesivamente.
4. Sumando los valores de estas diagonales paralelas
obtenemos la probabilidad que un píxel tenga 1, 2, 3...
niveles de grises de diferencia con su vecino.
Análisis de Texturas
Las principales propiedades de la matriz:
★ Cuadrada: El rango de los niveles de gris de los píxeles de
referencia y el de los vecinos es el mismo.
★ Tiene el mismo número de filas y columnas que el número
de bits de la imagen.
★ Es simétrica con respecto a la diagonal: significa que los
mismos valores ocurren en las celdas opuestas a la
diagonal.
Análisis de Texturas
Las funciones GLCM caracterizan la textura de
una imagen calculando la frecuencia con la que
se producen pares de píxeles con valores
específicos y en una relación espacial
especificada en una imagen. Creando un GLCM y,
a continuación, extrayendo medidas estadísticas
de esta matriz.
Análisis de Texturas
El cálculo de las métricas (features) de co-ocurrencia se basa
en la matrix GLCM de niveles de gris. La misma, es calculada
para cada vecindad de un píxel. Si llamamos g(i,j) al
elemento (i,j) de la matriz de co-ocurrencia de niveles de
gris. Podemos definir los siguientes atributos basados en
esta matriz
Análisis de Texturas
La matriz de co-ocurrencia describe la frecuencia de un nivel
de gris que aparece en una relación espacial específica con
otro valor de gris, dentro del área de una ventana
determinada. Es un resumen de la forma en que los valores
de los pixeles ocurren al lado de otro en una pequeña
ventana.
Análisis de Texturas
Respecto del tamaño de la
ventana, esta debe ser cuadrada
y con número impar de píxeles. El
resultado del cálculo de la textura
es un único número que
representa la ventana completa,
el cual es colocado en el lugar del
píxel central.
Análisis de Texturas
Luego, la ventana se mueve un píxel y el cálculo se repite
calculando una nueva matriz de co-ocurrencia para esta
nueva ventana; resultando un nuevo valor, para el píxel
central, de esta nueva posición de la ventana. De este modo
se construye toda una nueva imagen con valores de
texturas.
Análisis de Texturas
Cada pixel en la ventana se va
convirtiendo sucesivamente en el
pixel de referencia. Empezando por
el ubicado arriba a la izquierda y
finalizando abajo a la derecha. Los
píxeles ubicados en el margen
derecho de la imagen original, no
tienen vecino a la derecha, por lo
tanto, no son usados en el cómputo.
Análisis de Texturas
El tamaño relativo de la ventana y de los objetos en la
imagen determinan la utilidad de ésta medida para la
clasificación. Es recomendable que la ventana sea menor
que el objeto y lo suficientemente grande como para
capturar la variabilidad del mismo. El mejor tamaño de la
ventana se podrá estimar inspeccionando visualmente la
imagen.
Análisis de Texturas
μ y σ son la media y desvío estándar de la
suma de una fila (o columna, debido a la
simetría)
Análisis de Texturas
La Energía mide la uniformidad local. Mientras
más alto es el valor, más uniforme es la textura.
Análisis de Texturas
La Entropía mide el nevel de organización de
una textura. Si es completamente aleatoria, va a
tener una muy alta entropía.
Análisis de Texturas
La Correlación mide la dependencia lineal de los
valores de gris en la matriz de co-ocurrencia.
Análisis de Texturas
Momento de diferencia inversa (IDM) mide
homogeneidad de la imagen. Valores bajos para
imágenes poco homogéneas y altos para
imágenes homogéneas.
Análisis de Texturas
El Contraste mide la variación local de niveles de
gris en la matriz. Si los píxeles vecinos son muy
similares, el contraste es bajo.
Análisis de Texturas
Cluster Shade se cree que mide la uniformidad
percibida de la textura. Un valor alto significa
que hay asimetría en la textura.
Análisis de Texturas
Cluster Prominence métrica relacionada a la
simetría perceptual de la textura. Si el valor es
alto, la textura es menos simétrica.
Análisis de Texturas
Correlación de Haralick es la correlación original
diseñada por Haralick in 1973, y mide la
dependencia lineal de los píxeles entre sí.
Análisis de Texturas
Los atributos basados en
la matriz de
co-ocurrencia calculados
se asignan al punto
central de la ventana de
análisis. Este
procedimiento se repite
para todos los puntos.