Autor/-in:
Hüglin Lukas
Entwicklung und Vergleich von Methoden zur Vergrösserung der Auflösung von digitalen Bildern (Super-Resolution)
Bader Jörg
Mutsanas Nikolaus
Kantonsschule Zürich Nord
Fach: Informatik
Abstract
In dieser Maturitätsarbeit wurde eine modulare Software entwickelt, mit welcher verschiedene Methoden zur Vergrösserung der Auflösung digitaler Bilder (Super-Resolution) implementiert und getestet werden können. Standardmethoden für Super-Resolution (SRResNet und SRGAN) beruhen auf Deep Learning, einem Teilgebiet des maschinellen Lernens, bei dem Zusammenhänge mit Hilfe von neuronalen Netzen modelliert werden. Beide Methoden, SRResNet und SRGAN, wurden in dieser Arbeit weiterentwickelt, indem eine Verlustfunktion eingebaut wurde, die auf einer zweidimensionalen Fourier-Transformation beruht (SRResNet Fourier und SRGAN Fourier). Ausserdem wurde der Trainingsprozess von SRGAN optimiert und eine Methode mit dem Namen SRGAN Limited entwickelt. Der Vergleich von meinen eigenen Methoden mit bestehenden Methoden für Super-Resolution zeigt, dass SRGAN Fourier und SRGAN Limited am besten sind. Das Training des normalen SRGAN ist zu instabil, um zuverlässig bei jedem Trainingsdurchgang ein gutes Resultat zu liefern. Welche Methode man zwischen SRGAN Fourier und SRGAN Limited bevorzugt ist situationsabhängig. SRGAN Fourier erzeugt leicht bessere Resultate, hat aber auch über die doppelte Trainingszeit. Hat man nur beschränkt Zeit, um die neuronalen Netze zu trainieren, dann ist SRGAN Limited sicherlich die bessere Lösung. Allerdings könnte man in zukünftigen Arbeiten die Trainingszeit von SRGAN Fourier nochmals stark reduzieren. SRResNet Fourier lohnt sich nicht. Diese Methode liefert eher schlechtere Resultate als die anderen Methoden und benötigt auch eine lange Trainingszeit. Für Anwendungen, bei denen es wichtig ist keine, bzw. nur wenige Artefakte in einem Bild zu haben, ist SRResNet auch eine Option. Generell funktionieren alle Methoden für verschiedene Bilder unterschiedlich gut. Deshalb werden die besten Resultate erzielt, wenn das gewünschte Bild mit verschiedenen Methoden generiert und dann das beste ausgewählt wird.