Reconhecimento de imagem

O reconhecimento de imagens ( análise de imagens em inglês ) é um ramo do reconhecimento de padrões e processamento de imagens . No reconhecimento de imagem, tenta-se segmentar objetos em uma imagem . Uma descrição simbólica é atribuída a eles, mas as conexões entre os objetos não são pesquisadas, como é usual na análise de padrões .

definição

O reconhecimento de imagens no contexto do processamento de imagens é a capacidade do software de identificar objetos, lugares, pessoas, escritos e ações em imagens. Os computadores podem usar tecnologias de processamento de imagem em combinação com uma câmera e software de inteligência artificial para obter objetos nas imagens.

Embora os cérebros de humanos e animais reconheçam objetos facilmente, os computadores ainda têm dificuldades com essas tarefas. O software para reconhecimento de imagem requer aprendizado de máquina aprofundado . Os processadores de convolução de rede neural artificial têm melhor desempenho porque, de outra forma, a tarefa específica requer enormes recursos de hardware devido à sua natureza computacionalmente intensiva . Algoritmos de reconhecimento de imagem podem funcionar com a ajuda de modelos 3D comparativos , aparências de diferentes ângulos com a ajuda de reconhecimento de bordas ou por meio de componentes. Esses algoritmos são frequentemente treinados por máquina em milhões de imagens pré-rotuladas .

Formulários

Existem inúmeras áreas de aplicação para reconhecimento de imagem digital:

  • Rotular e marcar objetos automaticamente em imagens em grandes bancos de dados de imagens, e . B. em flickr.com ou Cloud Vision API do Google.
  • Reconhecer imagens ou seções de imagens de produtos de mídia e atribuí-las ao produto correspondente. Informações sobre os produtos, por exemplo, informações de conteúdo, gênero, atribuição, crítica, comentários ou comparações de preços, podem então ser consultadas.
  • reconhecimento de rosto
  • Controle de robôs autônomos , carros autônomos e sistemas de prevenção de acidentes.
  • Reconhecimento de marca de registro na indústria. Componentes eletrônicos e marcas de registro são medidos para obter a montagem mais precisa possível.
  • Classificação e detecção de erros, por ex. B. de produtos a granel, placas de circuito, impressão de fotos.
  • OBIA de análise de imagem baseada em objeto como um método de geografia
  • Detecção automatizada de "comportamento anormal" de pessoas nos fluxos de dados de vídeo de câmeras de vigilância pública para prevenção do crime, consulte o polêmico projeto da UE INDECT
  • Com o aplicativo TapTapSee, pessoas cegas podem tirar fotos de seus arredores. Uma voz então diz o que pode ser visto na imagem. Por exemplo, pessoas cegas podem descobrir a cor de uma peça de roupa. O aplicativo é gratuito, então você mesmo pode testar essa tecnologia.

literatura

  • H. Niemann: Análise e compreensão de padrões. Springer Series in Information Sciences, Berlin 1990
  • A. Pinz: Compreendendo as imagens. Livros didáticos de ciência da computação, Springer-Verlag

Links da web

Evidência individual

  1. TechTarget: reconhecimento de imagem
  2. Um aplicativo gratuito mostra aos cegos o mundo chip.de.