Image colorization (from Grayscale to RGB)

Membros do projeto

Lucas Sobral Fontes Cardoso
Ewerton Patrick Silva do Amaral
Marcelo Temoteo de Castro

Objetivos do projeto (Abstract)

Esse projeto busca utilizar aprendizado de máquina, utilizando um modelo para transformar imagens originalmente em escala de cinza em imagens colorizadas. Usaremos uma base de dados pública com imagens de paisagens variadas. Serão aplicadas técnicas de pré-processamento nas imagens, preparando-as para o treinamento do modelo de redes neurais. Uma vez que o modelo tenha sido treinado, utilizaremos algumas imagens da base, convertidas para preto e branco para poder gerar versões colorizadas. Normalmente é necessário a assistência humana para colorização de imagens, uma aplicação desse projeto é automatizar o processo de colorização de imagens buscando reduzir a perda de informação.

Descrição da imagem de entrada

As imagens foram obtidas no kaggle, nele temos uma pasta com um conjunto de imagens panoramicas coloridas contendo ruas, edifícios, montanhas, geleiras, árvores e entre outras coisas, as imagens correspondentes em escalas de cinzas estão separadas em outra pasta. Será utilizada apenas a pasta que contem imagens coloridas, a partir dessas imagens obteremos as imagens correspondentes em escalas de cinzas em uma etapa do próprio código. As imagens estão com tamanho de 150x150.

Descrição dos passos

Redimensionaremos a imagens para o tamanho de 256x256
Etapa associada a análise de cor: convertemos a imagem para Lab pois assim as reduzimos o número de canais que representam cor, sendo 3 em RGB para 2 em Lab. Por consequencia essa etapa de conversão para Lab reduz a complexidade do problema permitindo a colorização das imagens até mesmo com redes mais simples
A partir da conversão para Lab, obtemos o canal L de luminosidade para obtenção da imagem em escala de cinza que será usada como entrada no modelo de rede neural. Já os outros 2 canais (ab), que contem informação de cor, serão utilizadas para avaliar o modelo durante o treinamento.
Pensamos em explorar alguns modelos de redes neurais para avaliar o impacto na colorização das imagens. Os modelos testados serão redes neurais convolucionais, que combinam técnicas de processamento de imagem com aprendizado de redes neurais. Para o problema de colorização consideramos utilizar os seguintes tipos de camadas:
- Camadas de convolução 2D: Ao invés de ajustar pesos de uma função, como é feito em redes neurais tradicionais, neste tipo de camada são ajustados os valores de filtros que são aplicados na imagem da mesma forma que os filtros observados na disciplina. Em cada camada, diversos filtros são ajustados e tem como objetivo extrair características importantes da imagem que não são conhecidas, como encontrar a melhor cor.
- Camadas de Max Pooling: Esta camada consiste em técnicas de diminuição da resolução da imagem. Este tipo de processo é importante para o treinamento de redes neurais em aplicações de imagem, pois permitem reduzir o custo computacional do treinamento. Espera-se que com o treinamento e a redução de dimensões seja adquirido as cores desejadas na imagem, embora seja reduzido a informação dessas cores. Esta redução de dimensão é feita aplicando um filtro de Max, onde apenas o valor máximo dos dados, na janela do filtro, seja apresentado no resultado.
- Camadas de upsampling: Essas camadas incrementam a resolução dos dados, buscando retornar a dimensão original da imagem de entrada, permitindo que as cores selecionadas pela rede sejam atribuidas novamente a cada pixel da imagem de entrada.
Utilizaremos o RMSE para estimar o erro obtido entre a imagem colorizada pelo modelo e imagem original, sendo que essas duas imagens estarão no espaço de cor Lab.
Converteremos a imagem em RGB depois para a exibição dos resultados.

Após a colorização e avaliação dos resultados, pretendemos estudar a possibilidade de inclusão do erro gaussiano nas imagens de treinamento como uma forma de aperfeiçoar o modelo. Seguiremos essa linha de estudo, pois ao nos aprofundar mais sobre o tema de colorização vimos que esse método pode melhorar a predição dos resultados colorização das imagens.

Resultados obtidos

Com 9 imagens de treinamento e 1 de teste
- Original/Saída colorizada pelo modelo
- Original/Saída colorizada pelo modelo
Com 135 de treinamento e 15 de teste
- Original/Saída colorizada pelo modelo
Modelo Treinado com 1500 imagens - Imagem não contida no dataset:
- Original/Saída 1
- Original/Saída 2
- Original/Saída 3

Podemos observar que nos resultados de colorização para imagens de paisagens urbanas o modelo possui bastante dificuldade, o que possivelmente ocorre por dois fatores: a maior complexidade de objetos nestas imagens em relação as demais, assim como por uma maior quantidade de imagens de paisagens não urbanas no treinamento. Além disso, nos cenários urbanos existem casos em que uma mesma imagem em preto e branco pode possui diferentes cores plausíveis. Por exemplo, no resultado 3, para o modelo treinado com 1500 imagens, o carro que aparece na imagem poderia ser tanto vermelho ou amarelo sem muitas diferenças em sua versão em escala de cinza. Para as demais paisagens, como de florestas e montanhas o modelo já obtém melhores resultados, conseguindo identificar de forma satisfatória a cor de árvores, do ceu e montanhas.

Papel dos membros no projeto

Para a realização deste projeto, eram feitas reuniões e o desenvolvimento tanto do código quanto da documentação foram feitos de forma conjunta e síncrona. Portanto, todos os membros participaram de todas as etapas do projeto.

Name		Name	Last commit message	Last commit date
Latest commit History 33 Commits
modelo		modelo
1o.png		1o.png
1p.png		1p.png
2o.png		2o.png
2p.png		2p.png
3o.png		3o.png
3p.png		3p.png
4i.jpg		4i.jpg
4o.jpg		4o.jpg
5i.jpg		5i.jpg
5o.jpg		5o.jpg
6i.jpg		6i.jpg
6o.jpg		6o.jpg
Demo.ipynb		Demo.ipynb
ImageColorization.ipynb		ImageColorization.ipynb
README.md		README.md
example0-colorized.jpg		example0-colorized.jpg
example0-grayscale.jpg		example0-grayscale.jpg
example1-colorized.jpg		example1-colorized.jpg
example1-grayscale.jpg		example1-grayscale.jpg
example1021-colorized.jpg		example1021-colorized.jpg
example1021-grayscale.jpg		example1021-grayscale.jpg
example2-colorized.jpg		example2-colorized.jpg
example2-grayscale.jpg		example2-grayscale.jpg
out1.jpg		out1.jpg

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Image colorization (from Grayscale to RGB)

Membros do projeto

Objetivos do projeto (Abstract)

Descrição da imagem de entrada

Descrição dos passos

Resultados obtidos

Papel dos membros no projeto

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

mtc-blueberry/Project-ImageProcessing-2021

Folders and files

Latest commit

History

Repository files navigation

Image colorization (from Grayscale to RGB)

Membros do projeto

Objetivos do projeto (Abstract)

Descrição da imagem de entrada

Descrição dos passos

Resultados obtidos

Papel dos membros no projeto

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages