Processamento de imagem

Em ciência da computação e engenharia elétrica, processamento de imagem é o processamento de sinais que representam imagens, por exemplo, fotografias ou imagens individuais de vídeos. O resultado do processamento da imagem pode, por sua vez, ser uma imagem ou um conjunto de recursos da imagem de entrada (consulte reconhecimento de imagem ). Na maioria dos casos, as imagens são vistas como um sinal bidimensional, de modo que métodos comuns de processamento de sinal podem ser usados.

O processamento de imagens deve ser diferenciado do processamento de imagens , que trata da manipulação de imagens para exibição posterior.

Exemplos de aplicação de processamento de imagem

O processamento de imagens agora é usado em quase todas as disciplinas científicas e de engenharia, como microscopia moderna , diagnóstico médico, astronomia , engenharia mecânica e sensoriamento remoto (observação ambiental, espionagem). Usando métodos de processamento de imagem, os objetos são contados e medidos em máquinas, os objetos são inspecionados ou as informações codificadas são lidas. Dispositivos de raio-X e ultrassom usam processamento de imagem para fornecer imagens que o médico pode interpretar mais facilmente. As máquinas de raio-X com análise de imagem integrada examinam automaticamente bagagens e roupas em busca de materiais e objetos perigosos (armas, etc.) nas zonas de segurança. Outro campo é a garantia de qualidade nos processos de fabricação e produção . O chamado picking na caixa em robótica também é suportado pelo processamento de imagens.

Inspeção e medição de objetos

Medição de chips na produção de semicondutores : por exemplo, a posição do canto de um chip é medida em uma imagem. Com essas informações, esse chip pode ser posicionado com precisão para montagem. Durante a inspeção final do chip, os erros de soldagem e ligação são detectados movendo um chip na frente da câmera e comparando-o com uma amostra de ouro que foi previamente ensinada pelo sistema de processamento de imagem. Ou é feita uma pesquisa por padrões geométricos claramente definidos (círculo, canto), por rachaduras ou rupturas.

Processamento de imagens em um sistema de envase de bebidas: Para verificar se a mesma quantidade foi enchida em cada garrafa, uma imagem do gargalo da garrafa é obtida e a borda do líquido é medida. Antes do enchimento, verifica-se se o gargalo da garrafa apresenta fissuras ou estilhaços.

Medição de cola em micromecânica: Ao fabricar módulos de câmera para telefones celulares, a cola é aplicada ao suporte da lente. Para garantir uma qualidade consistente de produção, a forma desse adesivo é verificada em uma foto. Se a aplicação do adesivo não estiver dentro de certas tolerâncias, o componente é rejeitado.

Leitura de informação codificada

Por meio do processamento de imagens, as informações codificadas podem ser lidas automaticamente das imagens. Por exemplo, um texto codificado em formato de matriz de dados pode ser lido ou as informações podem ser extraídas como texto simples usando OCR . Essas funções também são usadas na identificação de cartas e encomendas.

Na produção de automóveis, os números de série dos componentes são codificados na forma de matriz de dados . Quando uma montagem chega a uma área de produção, uma câmera tira uma foto do código e o código é lido. Com esse número de série, as máquinas da área de produção recebem de um servidor informações sobre como será feita a montagem.

Objetos de processamento de imagem

Os métodos de processamento de imagem geralmente esperam dados de imagem como entrada. Esses dados de imagem podem ser diferenciados tanto na forma como foram criados quanto em sua codificação . O tipo de criação descreve o princípio técnico usado para criar a imagem. As mais difundidas aqui são as imagens de reflexão , como as produzidas por uma câmera ou ultrassom. Além disso, existem imagens de projeção , como raios-X, e imagens esquemáticas , como mapas e documentos. Na codificação, os gráficos raster são a forma mais comum em que os dados da imagem são representados por uma grade bidimensional de pixels. Outra forma são os gráficos vetoriais , que não consistem em uma grade, mas contêm instruções sobre como criar uma imagem a partir de primitivas geométricas.

Delimitação de áreas relacionadas

Áreas relacionadas de processamento de imagem são processamento de imagem , visão computacional e computação gráfica . Com o processamento de imagens, é colocada uma visão mais abstrata da mudança nas imagens, enquanto o processamento de imagens fornece a base matemática e algorítmica para isso, que é então usado na implementação de software gráfico para processamento de imagens. O processamento de imagens também fornece isso para a visão baseada em computador . Enquanto o processamento de imagem gera dados de imagem ou informações simples de dados de imagem, a visão baseada em computador gera descrições de imagem a partir de dados de imagem. A computação gráfica, por sua vez, produz a partir de descrições de imagens dados de imagem.

Operações de processamento de imagem

Em operações de processamento de imagem, uma distinção deve ser feita primeiro entre os métodos que geram uma nova imagem e aqueles que fornecem informações sobre a imagem. Os métodos que geram uma nova imagem podem ser diferenciados com base no tamanho da região dos dados de entrada. Também deve ser feita uma distinção se o processo preserva a estrutura básica da imagem ou a altera.

Um método comum de geração de informações de uma imagem é calcular o histograma , que fornece informações sobre a distribuição estatística de brilho na imagem. Tal histograma pode servir, por exemplo, como uma configuração para outras etapas de processamento de imagem ou como informação para um usuário de software humano. Outras informações calculáveis ​​sobre uma imagem são, por exemplo, sua entropia ou brilho médio.

Os métodos que geram uma nova imagem podem ser divididos em operações de ponto , operações de vizinhança e operações globais com base em seus dados de entrada . As operações de ponto usam as informações de cor ou luminosidade em um determinado ponto da imagem como entrada, calculam um novo valor de luminosidade como resultado e o armazena no mesmo ponto na imagem alvo. As aplicações típicas de operações pontuais são, por exemplo, a correção de contraste e brilho, uma correção de cor girando o espaço de cores ou o uso de diferentes métodos de valor limite . Uma operação de ponto pode ser homogênea , o que significa que a coordenada dos dados fonte não é levada em consideração no cálculo, ou pode ser não homogênea , o que permite a correção adaptativa do valor tonal, por exemplo. As operações de vizinhança usam um ponto e um determinado conjunto de seus vizinhos como entrada, calcule um resultado a partir deles e grave-o na coordenada do ponto de referência na imagem alvo. Filtros de convolução são um tipo muito comum de operação de vizinhança . Aqui, os valores de brilho ou cor são compensados ​​uns com os outros de acordo com um núcleo de filtro para formar o resultado. Com este método, por exemplo, filtros de foco suave , como o filtro de valor médio, filtro Gaussiano ou o filtro binomial, podem ser implementados. Filtros de convolução também podem ser usados ​​para destacar as bordas de uma imagem usando filtros derivados ou filtros Laplace . No entanto, as operações de vizinhança não se limitam aos filtros de convolução. Com um tratamento algorítmico mais complexo do ponto de referência e seus vizinhos, outros métodos de suavização, como o filtro de mediana , ou o filtro de amplitude extrema ou o operador Prewitt para detecção de borda, podem ser implementados. As operações de abertura , fechamento e, portanto, alisamento morfológico podem ser definidos a partir de operadores morfológicos como erosão e dilatação . Embora a suavização possa ser alcançada usando operações de vizinhança relativamente simples, a deconvolução e, portanto, a nitidez da imagem é uma tarefa mais complexa. Nem as operações de ponto nem vizinhança alteram uma imagem em seu tamanho ou em sua estrutura básica. Isso é obtido por meio de operações geométricas de imagem , como dimensionamento , rotação ou translação de uma imagem, em que a filtragem anisotrópica é necessária aqui e a interpolação é um critério decisivo para a qualidade da imagem. As operações geométricas de imagem fazem parte das operações globais de imagem que usam a imagem completa como dados de entrada. Outro representante das operações globais de imagem é a transformação de Fourier , em que a imagem é convertida no espaço de frequência em que o uso de filtros lineares significa menos esforço.

Transformações de imagem digital

O tempo necessário para as operações mencionadas depende em grande parte da resolução da imagem . Filtros digitais podem ser usados para desfocar ou aumentar a nitidez de imagens digitais . A filtragem espacial pode ser realizada com matrizes de convolução especiais . Faixas de frequência específicas também podem ser mascaradas usando transformadas rápidas de Fourier . Os exemplos a seguir mostram os dois métodos:

filtro Núcleo de filtro ou máscara de filtro exemplo
Imagem original Affine Transformation Original Checkerboard.jpg
Passagem baixa espacial Spatial Mean Filter Checkerboard.png
Passagem alta espacial Spatial Laplacian Filter Checkerboard.png
Representação de Fourier Fourier Space Checkerboard.png
Fourier - passe baixo Lowpass Butterworth Checkerboard.png Lowpass FFT Filtered checkerboard.png
Fourier - passe alto Highpass Butterworth Checkerboard.png Highpass FFT Filtered checkerboard.png

Transformações afins

A transformação afim é um método de mapeamento linear no qual pontos , linhas e planos são preservados. Isso também se aplica ao paralelismo , que é mantido após uma transformação afim. Em contraste, uma transformação afim muda as escalas e ângulos .

As transformações afins são normalmente usadas para corrigir distorções geométricas ou deformações que ocorrem em ângulos de câmera não ideais. Por exemplo, para corrigir distorções de perspectiva de imagens de satélite , são usadas transformações afins ( retificação ), que são causadas por uma direção de gravação oblíqua. Ao compor uma imagem panorâmica a partir de uma pluralidade de quadros ( costura ), e no registro de imagem, áreas de imagem sobrepostas de imagens vizinhas precisam ser ajustadas, onde também transformações afins podem ser usadas. Transformar e mesclar as imagens em um sistema de coordenadas de plano comum é desejável para evitar distorção. Isso permite interações e cálculos mais simples que não precisam mais considerar a distorção da imagem.

A tabela a seguir mostra as várias transformações afins usando o exemplo de um padrão quadriculado : mapeamento idêntico , deslocamento paralelo , espelhamento , dimensionamento , rotação e cisalhamento :

Transformação afim Matriz afim exemplo
Figura idêntica Checkerboard identity.svg
Deslocamento paralelo Checkerboard identity.svg
reflexão Checkerboard reflection.svg
Dimensionamento Checkerboard scale.svg
rotação Checkerboard rotate.svg
Cisalhamento Checkerboard shear.svg

Exemplos

Melhoria de imagem

Detecção e rastreamento de objetos

Veja também

literatura

  • Wilhelm Burger, Mark J. Burge: Digital Image Processing: An Algorithmic Introduction Using Java . Primeira edição. Springer, 2008, ISBN 978-1-84628-379-6 .
  • Helge Moritz: Lexicon of image processing . Hüthig, Heidelberg 2003, ISBN 3-7785-2920-X .
  • Bernd Jähne : Processamento digital de imagens . 6ª edição revisada e ampliada. Springer, Berlin et al. 2005, ISBN 3-540-24999-0 .
  • Pedram Azad, Tilo Gockel, Rüdiger Dillmann: Computer Vision. O livro de prática . Elektor, Aachen 2007, ISBN 978-3-89576-165-2 .
  • Gerhard A. Weissler (Ed.): Introdução ao processamento de imagens industriais (=  biblioteca de eletrônica e engenharia elétrica . Volume 1. ). Franzis, Poing 2007, ISBN 978-3-7723-4028-4 .
  • Michael Sackewitz (Ed.): Manual para processamento industrial de imagens. Garantia de qualidade na prática, 3ª edição totalmente revisada e atualizada . 3. Edição. Fraunhofer Verlag Stuttgart, Stuttgart 2017, ISBN 978-3-8396-1226-2 .
  • Johannes Steinmüller: Do processamento de imagens à interpretação espacial de imagens . 1ª edição. Springer, Berlin / Heidelberg 2007, ISBN 978-3-540-79742-5 .
  • Kristian Bredies, Dirk Lorenz: Mathematical Image Processing. Introdução aos fundamentos e teoria moderna . Vieweg + Teubner, Wiesbaden 2011, ISBN 978-3-8348-1037-3 .
  • Rafael C. Gonzalez e Richard E. Woods (Eds.): Processamento de Imagem Digital . Pearson Education, New Jersey 2008, ISBN 978-0-13-168728-8 .
  • Michael Sackewitz (Ed.): Guia para o processamento de imagens industriais (Volume 13). Fraunhofer-Verlag Stuttgart, 2013, ISBN 978-3-8396-0447-2

Evidência individual

  1. ^ The MathWorks, Inc.: Método de mapeamento linear usando transformação afim