lunes, 8 de abril de 2019

EL PROCESAMIENTO DE IMÁGENES


BigDL [2] es un marco de aprendizaje profundo distribuido para Apache Spark, creado por Jason Dai en Intel.











Una imagen binaria es una imagen digital que tiene solo dos valores posibles para cada píxel . Normalmente, los dos colores utilizados para una imagen binaria son blanco y negro. El color utilizado para el objeto (s) en la imagen es el color de primer plano, mientras que el resto de la imagen es el color de fondo. [1] En la industria de escaneo de documentos, a menudo esto se conoce como "bicolor".
Las imágenes binarias también se llaman de dos niveles o de dos niveles . Esto significa que cada píxel se almacena como un solo bit, es decir, un 0 o 1. Los nombres en blanco y negro , B / N , monocromo o monocromático se usan a menudo para este concepto, pero también pueden designar cualquier imagen que tenga solo una muestra por píxel, como imágenes en escala de grises . En el lenguaje de Photoshop , una imagen binaria es lo mismo que una imagen en modo "Mapa de bits". [2] [3]
Las imágenes binarias a menudo surgen en el procesamiento de imágenes digitales como máscaras o como resultado de ciertas operaciones como la segmentación , el umbral y el tramado . Algunos dispositivos de entrada / salida, como impresoras láser , máquinas de fax y pantallas de computadora de dos niveles , solo pueden manejar imágenes de dos niveles.
Una imagen binaria se puede almacenar en la memoria como un mapa de bits , una matriz de bits empaquetada. Una imagen de 640 × 480 requiere 37.5 KiB de almacenamiento. Debido al pequeño tamaño de los archivos de imagen, la máquina de fax y las soluciones de gestión de documentos suelen utilizar este formato. La mayoría de las imágenes binarias también se comprimen bien con simples esquemas de compresión de longitud de ejecución .

Las imágenes binarias se pueden interpretar como subconjuntos de la celosía entera bidimensional 2 ; El campo del procesamiento de imágenes morfológicas se inspiró en gran medida en esta visión.

Una fotografía de un letrero de Vigilancia Vecinal en blanco y negro (binario)

Operaciones en imágenes binarias editar ]

Una clase completa de operaciones en imágenes binarias opera en una ventana 3 × 3 de la imagen. Esto contiene nueve píxeles, por lo que 2 9 o 512 valores posibles. Teniendo en cuenta únicamente el píxel central, es posible definir si permanece establecido o no establecido, en función de los píxeles circundantes. Ejemplos de tales operaciones son adelgazamiento, dilatación, búsqueda de puntos de ramificación y puntos finales, eliminación de píxeles aislados, desplazamiento de la imagen un píxel en cualquier dirección y ruptura de las conexiones H. El juego de la vida de Conway también es un ejemplo de una operación de ventana de 3 × 3.
Otra clase de operaciones se basa en la noción de filtrado con un elemento estructurante. El elemento estructurante es una imagen binaria, generalmente pequeña, que se pasa sobre la imagen de destino, de manera similar a un filtro en el procesamiento de imágenes en escala de grises. Dado que los píxeles solo pueden tener dos valores, las operaciones morfológicas son erosión (cualquier píxel no establecido dentro del elemento estructurante hace que el píxel no se establezca) dilatación (cualquier píxel establecido dentro del elemento estructurante hace que se establezca el píxel). Las operaciones importantes son la apertura morfológica y el cierre morfológico.que consisten en erosión seguida de dilatación y dilatación seguida de erosión, respectivamente, utilizando el mismo elemento estructurante. La apertura tiende a agrandar agujeros pequeños, eliminar objetos pequeños y separar objetos. El cierre retiene objetos pequeños, elimina agujeros y une objetos.
Una característica muy importante de una imagen binaria es la transformada de distancia . Esto da la distancia de cada píxel establecido desde el píxel no establecido más cercano. La transformada de distancia puede ser calculada eficientemente. Permite el cálculo eficiente de los diagramas de Voronoi , donde cada píxel de una imagen se asigna al más cercano de un conjunto de puntos. También permite la esqueletización, que difiere del adelgazamiento en que los esqueletos permiten la recuperación de la imagen original. La transformación de distancia también es útil para determinar el centro del objeto y para hacer coincidir en el reconocimiento de imágenes.
Otra clase de operaciones es reunir métricas sin orientación. A menudo, esto es importante en el reconocimiento de imágenes donde es necesario eliminar la orientación de la cámara. Las métricas sin orientación de un grupo de píxeles conectados o rodeados incluyen el número de Euler , el perímetro, el área, la compacidad, el área de los orificios, el radio mínimo, el radio máximo.

Segmentación de imágenes editar ]

Las imágenes binarias se producen a partir de imágenes en color por segmentación. La segmentación es el proceso de asignar cada píxel en la imagen de origen a dos o más clases. Si hay más de dos clases, el resultado habitual es varias imágenes binarias. La forma más simple de segmentación es probablemente el método de Otsu, que asigna píxeles al primer plano o al fondo según la intensidad de escala de grises. Otro método es el algoritmo de cuenca . La detección de bordes a menudo también crea una imagen binaria con algunos píxeles asignados a los píxeles de borde, y también es un primer paso en la segmentación adicional.

Esqueletos editar ]

La dilución o esqueletización produce imágenes binarias que consisten en líneas de píxeles de ancho. Los puntos de ramificación y los puntos finales se pueden extraer, y la imagen se puede convertir en un gráfico. Esto es importante en el reconocimiento de imágenes, por ejemplo en el reconocimiento óptico de caracteres .

Interpretación editar ]

La interpretación del valor binario del píxel también depende del dispositivo. Algunos sistemas interpretan el valor de bit de 0 como negro y 1 como blanco, mientras que otros invierten el significado de los valores. En la interfaz de PC estándar TWAIN para escáneres y cámaras digitales , el primer sabor se llama vainilla y el chocolateinvertido .
El dithering se usa a menudo para mostrar imágenes de medios tonos . [4]

Sensor de imagen captura imágenes binarias editar ]

El sensor de imagen binaria de gran tamaño es un nuevo sensor de imagen que recuerda a la película fotográfica tradicional. Cada píxel en el sensor tiene una respuesta binaria, que proporciona solo una medida cuantificada de un bit de la intensidad de luz local.









 balance de negro que calibra la señal para que no haya luz, al igual que tienen una función de " balance de blanco " que hace referencia al blanco verdadero a los CCD . A diferencia del balance de blancos , el balance de negros no se ajusta cada vez. Esta función se encuentra en las cámaras "profesionales" de nivel superior en lugar de en las cámaras para aficionados.

Propósito editar ]

El objetivo principal del balance de negros es eliminar cualquier corriente residual que se emita desde los sitios de píxeles en condiciones de oscuridad total, a menudo denominada ruido térmico . Esta es la razón por la que la cámara cierra automáticamente el iris por completo cuando hace el balance de negro.
Las condiciones bajo las cuales se realiza el balance de negro generalmente son cuando la cámara experimenta un gran cambio en la temperatura de operación , especialmente de más frío a más cálido. De lo contrario, es una cosa periódica permitir otros factores menores que podrían entrar en juego.
Con la tecnología de sensor CMOS , el balanceo de negro puede no ser tan necesario como con los dispositivos tipo CCD. Es común hablar sobre el diseño de los sensores CMOS limpios y relativamente libres de ruido. cita requerida ]

Disponibilidad editar ]

El balanceo negro se realiza solo en cámaras profesionales. Los usuarios aficionados de handycam no deben preocuparse por el balance de negros. Las videocámaras profesionales como la Sony DSR 400, Panasonic DVC Pro, etc. tienen un interruptor que tiene que ser movido hacia arriba para hacer el balance de blancos. El mismo interruptor cuando se presiona hacia abajo hace un balance de negro. En la serie Panasonic 102 3ccd, el interruptor de balance de blancos cuando se presiona una sola vez activa el balance de blancos y cuando se presiona y se mantiene presionado por unos segundos, completa el balance de negros. La mayoría de los operadores de cámaras nunca tocan el balance de negro. El balance del negro se puede hacer si los colores no parecen estar realmente representados incluso después de hacer el balance del blanco.

Frecuencia de ajuste de balance de negro editar ]

Hay mucho debate sobre si es necesario hacer el balance de negros cada vez.
El manual de instrucciones de funcionamiento de la cámara Panasonic 102 XB sugiere que se realice el balance de negro cuando:
  • La cámara se utiliza por primera vez.
  • La cámara se utiliza por primera vez después de un largo período de desuso.
  • La temperatura ambiente cambia mucho.
  • Cuando se cambia al obturador normal o al obturador lento
  • Al cambiar entre los modos progresivo y entrelazado.












No hay comentarios:

Publicar un comentario