8.1 Fundamentos
As transformadas de imagens são operações que alteram o espaço de representação de uma imagem para outro domínio, de forma que a informação presente na imagem seja necessariamente preservada no domínio da transformada e que a a transformada seja reversível. Uma implicação relativa a transformada é que a informação da imagem no domínio transformado normalmente é representada de forma mais compacta que a informação no domínio original.
Existem uma infinidade de transformadas aplicadas à imagens, sendo as mais comuns as transformadas de cosseno, seno, Fourier, Walsh, Hadamard, Haar e Hartley.
Dentre essas, vale a pena destacar a transformada de Fourier. Como fundamento teórico, iremos explorar a formula de Fourier definida para um sinal continuo e posteriormente iremos definir a função para o domínio discreto, como nas imagens digitais.
A transformada de Fourier para um sinal contínuo é definida como :
já a transformada inversa de Fourier é definida como :
A formula de Euler é uma relação entre uma função exponencial e funções trigonométricas :
Substituindo a formula de Euler na transformada de Fourier, temos que :
A partir disso, podemos perceber que devido ao segundo termo , se é real, a transformada de Fourier na maioria dos casos será complexa.
Outra interpretação a transformada de Fourier é que ela consiste da extensão de multiplicada por termos senoidais, cuja a frequência é definida pelos valores de .
Após a integração, a única variável restante é a frequência, por isso, dizemos que o domínio da transformada de Fourier é o domínio da frequência. O espectro de Fourier é formado por duas componentes, a componente de magnitude e de fase da transformada, Onde a magnitude, ou amplitude, da transformada é dada por:
e o ângulo da fase da transformada pode ser definida como:
A transformada discreta de Fourier (DFT - Discrete Fourier Transform) converte um conjunto finito de amostras uniformemente espaçadas de uma função em um conjunto de coeficientes de uma combinação finita de senoides complexas. A DFT de um sinal discreto é definida por:
e a sua inversa é definida como:
Como em boa parte do tempo estamos trabalhando com imagens, ou seja, funções discretizadas em duas dimensões, podemos extender a definição para duas variáveis, onde é uma imagem digital de tamanho :
de forma análoga, a transformada inversa da DFT em duas dimensões é dada por:
O espectro de Fourier obtido a partir da DFT bidimensional, além de prover informações sobre a orientação das estruturas presentes na imagem de entrada, também fornece um mapeamento das variações nos tons de cinza dos pixels.
Um número pequeno de variações de intensidade de cinza em um determinado espaço indica a presença de regiões de baixa frequência, enquanto um número maior de variações indica a presença de regiões de frequência alta na imagem. Essas características são essenciais para a operação de filtragem de imagens digitais.
Outro fundamento essencial da filtragem espacial e em frequência é a convolução.
A convolução entre dois sinais contínuos e é denotada pelo simbolo e pode ser definida como:
Para o caso discreto, a convolução 2D resulta em:
O teorema da convolução 2D também específica uma relação importante. Esta relação diz que a DFT da convolução no domínio do espaço gera o produto das transformadas no domínio de frequência. Essa propriedade pode ser utilizada ao nosso favor durante o processamento de imagens digitais.
A convolução é a base para as técnicas de filtragem que serão discutidas na próxima seção.