FUNDAMENTOS DE LA IMAGEN
Percepción visual
Ojo:
- Conos: Color
- Bastones: Intensidad
Tenemos muchos más bastones que conos, somos más sensibles a la luz que al color.
Percepción:
- El entorno determina el efecto de intensidad
- Lo percibido y lo real no es siempre lo mismo
Así como nosotros tenemos un periodo de adaptación a la
intensidad, las máquinas no.
Monocromo: escalas grises
- Se usa matriz de 2D para representar imagen monocromática.
Cromáticos: escalas de colores
- Ej: RGB (el más usado, red, green, blue)
Imágenes monocromáticas:
- Resolución 8-bit = 256 (28) valores en escala de grises en una matriz de tamaño
[nxm]
Dependiendo de cuantos bits se tengan se pueden
definir diferentes números de valores 2n.
Ejemplo: con 6 bits → 26 = 64
Cada pixel tiene un valor de 0 a 256 en la escala de
grises si usamos una cuantificación de 8-bits
Si la imagen es de 1024 pixeles habrá una matriz de
1024 x 1024, con un valor de 0 a 256 en cada posición
con cuantificación de 8-bits.
Primero se va hacia la derecha y después hacia abajo.
el pixel 50 x 25 estaría 50 píxeles a la derecha y 25
hacia abajo.
Si estamos utilizando RBG tendremos 3 matrices, una para la escala de rojos, otra para la
de verdes y otra para la de azules. La imagen cromática del mono tendrá [n x m x 3]
dimensiones. (es como 3 imágenes de cada color superpuestas, nxm rojo,nxm verde y nxm
azul)
1
,1024 x 1024 x 3(RGB) Sería el tamaño de una imagen en color de 1024 x 1024 píxeles.
En RGB necesitamos 3 puntos para cada pixel, por eso se hace x3.
Digitalización:
Pasar una imagen del espacio continuo al discreto.
- Muestreo: Tamaño del pixel, cuantos pixeles va a tener la imagen, cuantos pixeles
vamos a usar para definir un espacio concreto. División de la imagen en 2D.
Directamente relacionado con la resolución. Cuanto menor tamaño de píxel,
mejor resolución, pero más espacio de memoria se consume. Con más píxeles se
aprecian más los detalles. Discretización del espacio.
- Cuantificación: Número de valores que va a tener cada píxel, depende del número
de bits, 8 bits serían 256 valores, sería 2 ber n, siendo n el número de bits. Más
valores, más definición. Discretización de las intensidades.
Interpolación:
Estimar nuevos puntos en la imagen al cambiar de tamaño (resampling).
Ejemplo: Al pasar de 500x500 píxel a 750x750 pixel hay que completar los nuevos
espacios.
Tanto como para crear puntos como para eliminarlos.
Diferentes interpolaciones:
- Lineal - Cúbica
- Nearest neighbor interpolation
Vecindad del píxel: se suele utilizar la información de los píxeles vecinos para la
interpolación.
Vecinos de (𝑥, 𝑦)
- Horizontal y vertical
▪ (𝑥, 𝑦 + 1) , (𝑥, 𝑦 − 1) , (𝑥 + 1, 𝑦) , (𝑥 − 1, 𝑦 )
- Diagonal
▪ (𝑥 + 1, 𝑦 + 1 ), (𝑥 + 1, 𝑦 − 1) ,( 𝑥 − 1, 𝑦 − 1 ),( 𝑥 − 1, 𝑦 + 1)
Operaciones matemáticas:
2
,- Suma: para la eliminación de ruido Gaussiano. Ruido en la imagen que se
distribuye aleatoriamente por toda la imagen. Una imagen con x pixeles desviados,
se pueden adquirir unas cuantas imágenes y como el ruido cae aleatoriamente por
la imagen solo en algunos pixeles, al sumarlas todas el efecto del ruido Gaussiano
va a anularse y el valor del pixel desviado va a acercarse hacia la media. Si
hacemos una suma continua y hacemos la resta, eliminamos el ruido gaussiano.
𝑠 (𝑥, 𝑦) = 𝑓 (𝑥, 𝑦) + 𝑔(𝑥, 𝑦)
- Resta: para el contraste. Si restamos una imagen con contraste a una sin contraste
se queda solo el contraste en sí (porque es la única diferencia entre las imágenes).
Se usa mucho en medicina cuando te sacan una foto con un tumor por ejemplo y
luego sin él, en la resta de ambas fotos aparecería únicamente el contraste.
d (𝑥, 𝑦) = 𝑓 (𝑥, 𝑦) − 𝑔(𝑥, 𝑦)
- Multiplicación y división: Corrección de sombras. Eliminar la imagen que hemos
obtenido y dividirla o multiplicarla por la sombra. ROI masking. Es más o menos para
recortar solo la parte que nos interesa.
𝑝 (𝑥, 𝑦) = 𝑓 (𝑥, 𝑦) * 𝑔 (𝑥, 𝑦)
𝑝 (𝑥, 𝑦) = 𝑓 (𝑥, 𝑦) / 𝑔(𝑥, 𝑦)
- Operaciones espaciales:
▪ Uni-pixel: un píxel cambia el valor de otro, solo cambia el valor del pixel
objetivo.
3
, ▪ Vecindad: Se selecciona un píxel, se ve el valor de todos sus vecinos y, en
base a eso, se selecciona su valor. Es decir, no es solamente un pixel el
que afecta al que vamos a cambiar.
Para hacer escalados:
Si cx > 1, se hace más ancha y, si cy > 1, se hace más larga.
Como las transformaciones se hacen con matrices de 3x3, podremos combinar las matrices
y en una sola se harán múltiples transformaciones.
Calidad e información en la imagen
A veces hay dificultades en la adquisición de imágenes.
- Órganos superpuestos
4