2.1 Áreas correlatas

O processamento de imagens se sobrepõe a diferentes campos de atuação da ciência da computação e principalmente da visão computacional. Uma breve introdução às principais áreas correlatas é dada a seguir:

  • Processamento de imagem: compreende o processo de aplicar filtros e operações sobre uma imagem digital que resultam em uma nova imagem digital. Técnicas de processamento digital de imagem podem ser utilizadas para enfatizar características de uma imagem (por exemplo, ajustar brilho, contraste, nitidez), restaurar imagens que sofreram algum tipo de degradação por ruído, mudar cores e tons, comprimir e quantizar, entre diversas outras operações. O escopo do processamento de imagens frequentemente se intersecta com aquele das técnicas de visão computacional.

    A figura 2.3 mostra um exemplo de processamento de imagem: a aplicação de filtros de remoção de ruído em uma imagem renderizada pelo método de traçado de raios estocástico. O ruído é inerente ao método de Monte Carlo utilizado nesse tipo de renderização.

Uso dos filtros de processamento de imagem do [Intel Open Image Denoise](https://www.openimagedenoise.org/) para remoção de ruído de uma imagem de traçado de raios ([fonte](https://github.com/OpenImageDenoise/oidn)).

Figura 2.3: Uso dos filtros de processamento de imagem do Intel Open Image Denoise para remoção de ruído de uma imagem de traçado de raios (fonte).

  • Visão computacional: compreende o processo de adquirir, processar e interpretar dados visuais para gerar as especificações de uma cena. A partir de uma imagem digital, técnicas de visão computacional podem ser utilizadas para tarefas como a reconstrução dos modelos geométricos vistos na imagem, o particionamento dos pixels em segmentos correspondentes aos diferentes objetos da cena, reconhecimento de texturas, identificação dos atributos da câmera e da iluminação, e extração de outras informações semânticas.

    A visão computacional com frequência se relaciona com a visão de máquina, que compreende as técnicas e ferramentas voltadas a aplicações de visão em inspeção automática, controle de processos industriais e orientação de robôs.

    A figura 2.4 mostra um exemplo de aplicação de visão computacional: uma técnica de segmentação semântica utilizando aprendizagem profunda para identificar objetos em uma imagem.

Segmentação semântica usando o sistema [YOLO](https://pjreddie.com/darknet/yolo/) ([fonte](https://pjreddie.com/darknet/yolo/)).

Figura 2.4: Segmentação semântica usando o sistema YOLO (fonte).

  • Síntese de imagem: é o que geralmente se entende por computação gráfica. Compreende o processo de rendering (imageamento ou renderização) que consiste em converter especificações de geometria, cor, textura, iluminação, entre outras especificações de características de uma cena, em uma imagem exibida em um display gráfico.

    A figura 2.5 mostra o resultado da síntese de imagem de uma cena fotorrealista usando técnicas combinadas de traçado de raios e radiosidade.

Imagem gerada no renderizador [POV-Ray](http://www.povray.org/), por Gilles Tran ([fonte](http://www.oyonale.com/modeles.php?lang=en&page=40)).

Figura 2.5: Imagem gerada no renderizador POV-Ray, por Gilles Tran (fonte).

  • Modelagem geométrica: está relacionada com a criação e processamento de representações matemáticas de formas. Técnicas de modelagem geométrica podem ser utilizadas para criar modelos compostos de curvas e superfícies a partir de aquisição de dados (por exemplo, a partir de uma nuvem de pontos de uma aquisição por scanner 3D), construir e manipular modelos sintéticos através da combinação de primitivas geométricas, converter uma representação geométrica em outra, e realizar operações geométricas e topológicas diversas.

    A figura 2.6 mostra um exemplo de reconstrução de malha geométrica usando o software MeshLab. O modelo à esquerda é o modelo original. Na reconstrução (à direita), os buracos foram preenchidos e o resultado é uma única malha de triângulos.

Reconstrução de malha geométrica usando o MeshLab ([fonte](https://www.meshlab.net/)).

Figura 2.6: Reconstrução de malha geométrica usando o MeshLab (fonte).

Todo o conjunto envolvendo as áreas acimas podem ser agrupadas na área chamada de Computação Visual.

Neste curso teremos como foco a manipulação de imagens. Em partícular, iremos explorar técnicas para realçar, aprimorar, modificar e transformar imagens digitais, como também iremos estudar técnicas para extrair informações e dados uteis de imagens.

Na UFABC, os tópicos de visão computacional e computação gráfica são abordados nas disciplinas “ESZA019-17 Visão Computacional” e “MCTA008-17 Computação Gráfica”.