Anterior
Imagen digital: conceptos básicos

Siguiente


La imagen digital

    Vivimos una era en la que todas las formas de la información están sufriendo un proceso de digitalización. Las imágenes, por supuesto, no han podido escapar a este proceso. La fotografía, el cine, la televisión, el diseño gráfico e, incluso, el diseño industrial producen miles de imágenes digitales, que son almacenadas en algún soporte físico, enviadas por un medio de transmisión electrónico, presentadas en una pantalla o impresas en papel en algún dispositivo.

    Muchas personas, cuando se quieren comprar una cámara de vídeo o un escáner, escuchan atentamente los consejos del vendedor pero no entienden bien lo que les dice: “megapíxeles”, “puntos por pulgada”, “profundidad de color de 32 bit”. Vaya un lío. ¡Qué lejos están las películas fotográficas de 35 milímetros y el positivado en papel fotográfico!

    Cuando producimos imágenes, tomando fotos o escaneando un documento, por ejemplo, tenemos que tomar algunas decisiones para alcanzar un compromiso entre la calidad de la imagen y el tamaño del archivo. Para tomar bien esas decisiones hay que tener claros algunos conceptos básicos y con ese objetivo he redactado estos apuntes.

    La primera decisión que debemos tomar es si queremos producir una imagen vectorial o una imagen bitmap. Cada uno de estos tipos de imagen se produce y edita con programas diferentes y tiene aplicaciones diferentes. Conviene comprender bien en qué se diferencian y cuáles son las ventajas e inconvenientes de cada una.

Imágenes vectoriales

    Las imágenes vectoriales están compuestas por entidades geométricas simples: segmentos y polígonos básicamente (de hecho, una curva se reduce a una sucesión de segmentos). Cada una de estas entidades está definida matemáticamente por un grupo de parámetros (coordenadas inicial y final, grosor y color del contorno, color del relleno, etc.) Por compleja que pueda parecer una imagen, puede reducirse a una colección de entidades geométricas simples. La imagen siguiente es una imagen vectorial:

Imagen vectorial de dos grifos

    Al estar compuestas por entidades geométricas simples, las imágenes vectoriales se pueden cambiar de escala, para ampliarlas o reducirlas, sin que la imagen pierda calidad. Observa, por ejemplo la imagen siguiente, obtenida haciendo zoom sobre la imagen anterior: sin perder calidad en los bordes de la imagen tenemos mucho más detalle sobre el sistema de fijación de la cruceta al eje del grifo.

Imagen obtenida haciendo zoom

    Esta es su gran ventaja, porque proporcionan siempre imágenes de colores planos con contornos limpios, sin importar el tamaño al que se muestran.

    De entre los programas utilizados para realizar esta clase de imágenes hay que destacar Corel Draw, todo un clásico, e Illustrator, que forma parte del producto Creative Suite de la empresa Adobe, el preferido por los profesionales del diseño gráfico. Existe una prometedora alternativa, en el mundo del software libre, para la creación de imágenes vectoriales: se llama Sodipodi y, de momento, sólo está disponible para plataformas Linux.

Imágenes bitmap

Las imágenes de mapa de bits están construidas mediante una gran cantidad de cuadraditos, llamados pixel. Cada uno de estos cuadraditos está relleno de un color uniforme, pero la sensación obtenida es el resultado de integrar visualmente, en la retina, las variaciones de color y luminosidad entre píxeles vecinos.

Hortensia reciente

    Las imágenes de mapa de bits, también llamadas bitmap, son la alternativa ideal para reproducir objetos sutilmente iluminados y escenas con gran variación tonal. De hecho, es el tipo de imagen utilizado para la fotografía y el cine. Obviamente, la calidad de la imagen dependerá de la cantidad de píxeles utilizados para representarla.

    Las imágenes bitmap no permiten el cambio de escala. Observa, en la imagen siguiente, lo que pasa al hacer zoom sobre las flores de la imagen anterior: los píxeles son evidentes y la representación es totalmente irreal. Este efecto, que se conoce con el nombre de pixelado se hace más evidente en las líneas curvas y en las zonas en las que hay cambios bruscos de luminosidad.

Imagen de zoom a la hortensia

    Los programas más utilizados para generar, o editar, este tipo de imágenes bitmap son el famoso Photoshop de Adobe y el Photopaint de Corel. Afortunadamente, existe una alternativa de software libre llamada The Gimp, un programa excelente, potente y profesional, que tiene muy poco que envidiar al costoso Photoshop.

    Así pues, resumiendo, antes de crear una imagen hay que elegir una de las dos tecnologías de imagen digital: vectorial o bitmap. Cada una de ellas tiene unas aplicaciones y su producción exige unos requisitos que hay que conocer.

    Las imágenes vectoriales son ideales para cartelería, diseño de envases, imagen corporativa, logotipos etc., es decir en todas aquellas situaciones en las que una misma imagen, hecha con una gama reducida de tintas planas, debe ser reproducida en distintos soportes y a distintos tamaños.

    Las imágenes en mapa de bits, en cambio, son perfectas cuando la gama de colores cambia sutilmente. En este caso, la imagen debe generarse teniendo muy en cuenta dónde y cómo va a mostrarse, con una cantidad de píxeles y una gama de colores adaptados al soporte en el que va a reproducirse. Una vez hecha, las modificaciones comportarán pérdida de calidad.

La resolución

    Podemos definir la resolución como la capacidad de reproducir fielmente los detalles de una imagen. Utilizaremos esta palabra, lógicamente, al referirnos a la resolución de una imagen digital, pero también, al referirnos a una impresora, un monitor, una cámara o un escáner. Así pues, se trata de un concepto fundamental, que posee distintas acepciones, según el contexto en el que lo utilizamos.

    A partir de ahora nos referiremos a la tecnología bitmap, que es la más exigente en lo que concierne a la resolución. Hay que tener presente este concepto en todas las etapas de la vida de la imagen, desde su captura con una cámara digital o un escáner hasta la reproducción en el soporte elegido.

La resolución de una imagen

    La resolución de una imagen es la cantidad de píxeles que la componen. Suele medirse en píxeles por pulgada (ppi)1 o píxeles por centímetro (pcm). Cuanto mayor es la resolución de una imagen más calidad tendrá su presentación pero, desgraciadamente, más espacio ocupará en el disco el archivo gráfico que la contiene.

    Por ejemplo, una imagen con una resolución de 72 ppi, que es muy común en las páginas web, necesitará 5184 píxeles en cada pulgada cuadrada, que es un cuadrado de 2,54 centímetros de lado (ya sé que es una lata tener que manejar las unidades anglosajonas, pero hay que utilizarlas). Una resolución de 72 ppi es adecuada para imágenes que se muestran en el monitor de un ordenador. La nitidez de los detalles es suficiente y la reproducción de las distintas tonalidades es correcta. Sin embargo, podría ser insuficiente para una impresión en papel.

Foto en alta resolución

    Afortunadamente, muchos de los programas de tratamiento de imágenes nos permiten expresarnos en centímetros y milímetros. así que, para poner otro ejemplo, supongamos que queremos hacer una imagen con una resolución de 30 pixel por centímetro (30 pcm). Cada centímetro cuadrado necesitará 900 píxeles y, si nuestra imagen es una fotografía de 13 x 18 centímetros, cuya superficie es de 234 cm2, necesitará en total 210600 píxeles. Lógicamente cuanto más alta es la resolución de una imagen, más finamente reproduce los detalles y los cambios sutiles de tonalidad pero, a la vez, más pesado será el archivo.

    La misma fotografía de 13 x 18 cm del ejemplo anterior, con una resolución de 20 píxeles por pulgada, sólo necesitaría 14508 píxeles, lo que equivale a un archivo cuyo tamaño es 15 veces menor y muchísimo más ligero que el anterior:

La misma foto en baja resolución

    Pero si observas la imagen, que está hecha a 20 ppp, observarás que ha perdido nitidez y su aspecto es bastante mediocre.

Dimensiones de la imagen

    Las dimensiones de una imagen se expresan, como es habitual, en cm o mm. Por ejemplo, una imagen de 10 x 15 cm medirá 10 cm de ancho y 15 cm de alto.

Cuadro de diálogo de Gimp

    A veces, sin embargo, los programas expresan el tamaño de una imagen en píxeles. La ilustración de la izquierda muestra el modo en que Gimp muestra el tamaño de una imagen: 640 x 480 píxeles. Para calcular el tamaño de una imagen en píxeles basta con multiplicar las dimensiones lineales, en centímetros por ejemplo, por la resolución en píxeles por centímetro. Hay que poner atención para utilizar las mismas unidades de longitud.

Profundidad de color

    Cada uno de los píxeles de una imagen bitmap está coloreado con un color homogéneo. Así pues, el archivo que contiene los datos de la imagen debe contener la información del color de cada uno de los píxeles. ¿Cuántos bit se emplean para albergar esta información? Eso es lo que se conoce con el término profundidad de color de una imagen.

    Profundidad de color es el número de bits utilizados para describir el color de cada pixel de la imagen.
Es obvio que, cuanto mayor sea la profundidad de color de una imagen, más colores tendrá la paleta disponible y, por tanto, la representación de la realidad podrá hacerse con más matices, con colores más sutiles.

    Por ejemplo, si sólo disponemos de 1 bit para describir el color de cada pixel, tan sólo podremos elegir entre dos colores: un color si el bit tiene el valor 0 (habitualmente negro) y otro color si el bit vale 1 (habitualmente blanco).

Foto de la Alhambra con 1 bit

    Observa la fotografía superior de la Alhambra, con una profundidad de 1 bit, que tiene el aspecto de una fotocopia de mala calidad.

    Si disponemos de 8 bit para describir el color de cada pixel, podremos elegir entre 256 colores, porque 28=256. Esta es una profundidad de color suficiente para las imágenes construidas en el modo denominado escala de grises, porque con 8 bits cada pixel puede adoptar un tono entre 256 valores posibles de gris, entre el negro absoluto (00000000) y el blanco absoluto (11111111).

    La imagen siguiente es la misma fotografía de la Alhambra, en modo escala de grises, con una profundidad de color de 8 bits, lo que le da una calidad tonal más que suficiente.

La Alhambra en escala de grises

    Si los 8 bit disponibles para la profundidad deben designar colores, entonces se utiliza una tabla con los 256 colores más frecuentes, que incluyen obviamente el negro, el blanco y varios tonos de gris, para componer la imagen. Cada una de las 256 combinaciones posibles de unos y ceros de los 8 bits es un índice que permite acceder a la tabla. Por eso, a este tipo de imágenes se les conoce como de color indexado., que es el más frecuente en la web.

A continuación puedes ver la Alhambra en una imagen de color indexado, con 8 bit de profundidad:

La Alhambra con 8 bits

    Y así, cuanto mayor sea la profundidad se utilizará una cantidad mayor de colores para describir la imagen. En la tabla siguiente tienes el cálculo de los colores disponibles para cada profundidad:

Profundidad
Colores
1 bit 2
4 bit 16
8 bit 256
16 bit 65536
32 bit 4294967296

    Una imagen bitmap de calidad está compuesta por varias capas: una para cada color básico (rojo, verde y azul, por ejemplo) y una para la luminosidad (de oscuro absoluto a luz absoluta).

    Por encima de 16 bits de profundidad, la descripción del color se divide por capas. Si la profundidad de color es de 16 bits, por ejemplo, se dedican 4 bits (128 niveles) a cada capa. Y si la profundidad es de 32 bits, cada capa utiliza 8 bits (256 niveles) para ajustar el color.

La Alhambra a 16 bits
   
Observa la misma foto de la Alhambra, con una profundidad de 16 bits. La superposición del color de las cuatro capas proporciona la delicadeza de matices de la imagen.

La resolución del monitor

Hacemos imágenes para mostrarlas, muy frecuentemente, en un monitor. La pantalla del monitor está compuesta también por puntos o dots muy próximos entre si. Esos puntos se corresponden con los agujeros de la máscara, en un monitor de tubo catódico, o con los puntos de una matriz en las pantallas planas.
Nuestro ojo integra la luz recibida de cada punto para componer una imagen que parece continua. En la imagen siguiente puedes ver una fotografía de los agujeros en las máscaras de un monitor de tubo catódico:

Máscar de un tubo catódico

    La resolución del monitor es el número de puntos por unidad de longitud en la pantalla. Normalmente se mide en puntos por pulgada (dpi). Si, ¡otra vez las unidades anglosajonas! La resolución normal de un monitor es de 96 dpi.

    La resolución del monitor determina el tamaño con el que se muestra la imagen en la pantalla. Pero el tamaño de la imagen en la pantalla no debe confundirse ni con la resolución de la imagen ni con sus dimensiones.

    Por ejemplo, una imagen con una resolución de 192 ppi se verá al doble de su tamaño real en un monitor con una resolución de 96 dpi, debido a que cada pixel de la imagen ocupará dos de los puntos de la pantalla.

El tamaño del archivo

    El tamaño del archivo es una cifra, en bits o en bytes, que describe la cantidad de memoria necesaria para almacenar la información de la imagen en un soporte (disco duro, CD, tarjeta de memoria, etc). Y, como ya te imaginas, el tamaño del archivo dependerá de varios factores y, especialmente, de la resolución (R), las dimensiones de la imagen (Largo x Ancho) y la profundidad de color (P). Puedes calcular el tamaño de un archivo con la siguiente fórmula:

Tamaño = R²*L*A*P

    Por ejemplo, una imagen de 10 x 15 cm (3,94 x 5,91 pulgadas), con una resolución de 96 ppi (38 pcm) y una profundidad de color de 32 bits, tendrá un tamaño bruto de:

9216 x 3,94 x 5,91 x 32 =    6.857.144 bits
es decir:                               858.393 Bytes
o, lo que es lo mismo:           838 KBytes

    Recuerda que 1 byte son 8 bits y que 1 Kilobyte equivale a 1024 bytes.

Compresión de archivos

    Una vez creada nuestra imagen, ya sea capturada con la cámara o creada a mano, la guardamos en un archivo. El archivo, con un nombre y una extensión, no sólo contiene la información de cada pixel. Tiene también una cabecera en la que se guarda información destinada al programa encargado de abrir la imagen y mostrarla en el monitor.

    Aunque, por regla general, los archivos vectoriales tienen tamaños mucho menores que los archivos bitmap, todos los archivos gráficos suelen tener tamaños muy grandes. Este gran consumo de espacio en disco hizo necesario el desarrollo de tecnologías capaces de comprimir archivos gráficos.

    Cada sistema de compresión utiliza un algoritmo matemático propio para reducir la cantidad de bits necesarios para describir la imagen, y marca el archivo resultante con una extensión característica: bmp, wmf, jpg, gif, png, etcétera.

    Algunos de estos algoritmos están patentados, son propiedad de una empresa, y hay que pagar por utilizarlos. Otros algoritmos, en cambio, son de dominio público y pueden utilizarse libremente. También se distinguen entre si por las pérdidas producidas en la información de la imagen durante el proceso de compresión. Así pues hay algoritmos con pérdidas y sin pérdidas. Veamos algunos de los formatos de compresión más utilizados:

Formato JPG

    Es un formato de compresión con pérdidas, pero que desecha en primer lugar la información no visible, por lo que las pérdidas apenas se notan.

    El algoritmo jpg está basado en el hecho de que el ojo humano percibe peor los cambios de color que las variaciones de luminosidad. jpg divide la información de la imagen en dos partes: color y luminosidad y las comprime por separado.

    Admite modos en escala de grises con una profundidad de 8 bits y en color hasta 24 bits. Permite la carga progresiva en un navegador, lo que lo ha convertido en el formato estándar en la web. No es un formato adecuado para imágenes con alto contraste de color.

    Además, hay que tener en cuenta que la compresión se produce automáticamente cada vez que se guarda el archivo, por lo que es aconsejable guardar en este formato una única vez, cuando la imagen esté ya terminada.

Formato GIF

    Es un formato que devuelve imágenes de tamaño muy reducido. Esa reducción se consigue indexando los colores, es decir, asimilándolos a uno de los 256 colores de su tabla. Su profundidad de color máxima, por tanto, es de 8 bits.

    El formato gif permite hacer algunas cosas curiosas: puede hacerse transparente uno de los colores indexados en la tabla, lo que permite suprimir fondos. También permite enlazar varias imágenes gif en una secuencia, lo que se conoce con el nombre gif animado.

    El pequeño tamaño de los archivos gif hizo que fuera el formato más extendido en los primeros tiempos de Internet. Pero su principal defecto consiste en que es un formato propietario (CompuServe Inc.), lo que ha provocado la aparición del formato libre png que, además, comprime mejor que gif.

Formato PNG

    Es el formato de más rápido crecimiento en la web, porque reúne lo mejor de jpg y gif.

    Se trata de un formato de compresión sin pérdidas, con una profundidad de color de 24 bits. Soporta hasta 256 niveles de transparencia, lo que permite fundir la imagen perfectamente con el fondo.

    Entre sus inconvenientes hay que citar que no soporta animaciones y que el tamaño de los archivos png, debido a la capa de transparencia, siempre es mayor que el de los archivos jpg.

Formato BMP

    Es un formato de compresión sin pérdidas. Admite cualquier tipo de resolución y una profundidad de color máxima de 24 bits.

    Es el formato nativo de Microsoft y se usa en todas sus aplicaciones (Windows, Office, etc.). Por esta razón es muy frecuente encontrar archivos bmp, pero su tasa de compresión es ridículamente baja. Entre los navegadores, sólo es soportado por Internet Explorer.

    Para saber más sobre formatos de ficheros gráficos pulsa aquí.

El modo de color

    El ojo humano percibe los colores según la longitud de onda de la luz que le llega. La luz blanca contiene todo el espectro de color, mientras que la ausencia de luz es percibida por nuestro ojo como el color negro.

    Los programas de edición de imágenes utilizan varios modos de color para definir y clasificar todos los colores posibles. La mayoría de los programas utilizan uno de estos tres modos de color: HSB (tono, saturación y brillo), RGB (rojo, verde y azul) y CMYK (cyan, magenta, amarillo y negro).

El modo HSB

    El modo HSB clasifica los colores de acuerdo a tres características básicas: tono, saturación y luminosidad.

El tono (Hue)

    Esta propiedad se refiere a la longitud de onda dominante en la luz emitida o reflejada por un objeto. Para asignar un valor al tono se utiliza una rueda de color normalizada, en la que los tres colores primarios (rojo, verde y azul) y los tres colores secundarios (cyan, magenta y amarillo) se alternan a lo largo de una circunferencia.
La rueda de colores HSB

    De este modo, cada color está ubicado en el extremo opuesto a su complementario, es decir, el magenta está en el extremo opuesto al verde, el amarillo al azul y el cyan al rojo. El tono se mide en grados, de 0º a 360º, según su posición en la periferia de la rueda de color.

    Cuando un programa de edición de imágenes trabaja en este modo, para añadir la proporción de un color en una zona de la imagen, lo que hace es rebajar la cantidad de su complementario.

La saturación

    La saturación es la propiedad que describe la viveza del color. Un color muy saturado es un color con una tonalidad intensa y pura. Por el contrario, un color poco saturado es el que tiene una tonalidad apagada.

    La saturación de un color se expresa en porcentaje y oscila entre el 100%, que corresponde a los colores puros, saturados al máximo y el 0%, que corresponde a los colores apagados en los que ya no se distingue la tonalidad.

    En la rueda de color HSB, la saturación se representa a lo largo del radio de la circunferencia. Los colores muy saturados se encuentran cerca del borde y los colores poco saturados son los que están cerca del centro del círculo.


La luminosidad (brilliance)

    La luminosidad describe la cantidad de luz reflejada. Se trata por tanto de una magnitud relativa, que se expresa también en forma de porcentaje, desde el 100% (luminosidad total) hasta el 0%  (oscuridad total).

Mapa de luminosidad HSB

    En la imagen superior puedes ver cómo evolucionan los colores con la luminosidad, desde los colores poco luminosos, en la parte inferior de la imagen, hasta los colores muy luminosos, en la parte superior.

El modo RGB

    Este modo de color es el que se utiliza en todos los procesos en los que el color se obtiene por mezcla aditiva de luces: televisión, pantallas gráficas, iluminación artificial, etc. En todos estos dispositivos, la gama completa de colores se obtiene a partir de la mezcla de tres colores primarios: rojo, verde y azul.

Mezcla aditiva RGB

    En este caso, cualquier color se obtiene mezclando dos o más luces: al mezclarse luz verde y luz azul, por ejemplo, se obtiene el color cyan, al mezclarse rojo y azul se obtiene el magenta, y así sucesivamente. La mezcla de proporciones variables de colores primarios produce la gama completa de color. La mezcla de los tres colores básicos produce el color blanco, mientras que la ausencia de los tres colores produce el color negro.

    Las aplicaciones de edición de imágenes suelen expresar las cantidades de cada color primario con un número que puede adoptar cualquier valor entre 0 (ausencia absoluta de ese color) y 255 (cantidad máxima). Así, por ejemplo, pueden describir un color RGB con las cifras (127, 52, 209).

El modo CMYK

    El modo de color CYMK es el que se utiliza para describir el color que se obtendría si tiñésemos un papel con tintas de colores. Es el modo en que hemos aprendido a colorear cuando éramos niños: rojo y amarillo dará naranja.

    La razón estriba en que la tinta absorbe una parte de las longitudes de onda de la luz que recibe, de modo que la parte del espectro no absorbido se refleja. Dicho de otro modo, la tinta sustrae al espectro de la luz blanca una parte de la radiación, por eso a este modo de obtener colores se le llama método sustractivo.

Mezcla sustractiva CMYK

    Una mancha de tinta cyan dejará pasar las longitudes de onda azules y verdes (que son las que componen el color cyan), pero bloqueará la luz roja.

    Teóricamente, si pintásemos una hoja de papel con tinta cyan, magenta y amarillo debería absorber todo el espectro, produciendo, en consecuencia, el color negro. Pero en la práctica las tintas no son de color puro y sólo conseguimos un marrón oscuro, que tenemos que ajustar con tinta negra para mejorar la calidad de la reproducción.

    Este modo de color es el preferido cuando hay que ajustar el color para imprimir una imagen sobre papel. De hecho es el modo utilizado en las imprentas bajo el nombre técnico de cuatricromía.

Arriba


Anterior Inicio
Tecnologías de la Información
Imagen digital

Siguiente