바로가기메뉴

본문 바로가기 주메뉴 바로가기

ACOMS+ 및 학술지 리포지터리 설명회

  • 한국과학기술정보연구원(KISTI) 서울분원 대회의실(별관 3층)
  • 2024년 07월 03일(수) 13:30
 

RAPGAN와 RRDB를 이용한 Image-to-Image Translation의 성능 개선

Performance Improvement of Image-to-Image Translation with RAPGAN and RRDB

한국사물인터넷학회논문지 / Journal of The Korea Internet of Things Society, (P)2466-0078;
2023, v.9 no.1, pp.131-138
https://doi.org/https://doi.org/10.20465/kiots.2023.9.1.131
윤동식 (고려대학교)
곽노윤 (백석대학교)
  • 다운로드 수
  • 조회수

초록

본 논문은 RAPGAN(Relativistic Average Patch GAN)과 RRDB(Residual in Residual Dense Block)을이용한 Image-to-Image 변환의 성능 개선에 관한 것이다. 본 논문은 Image-to-Image 변환의 일종인 기존의pix2pix의 결점을 보완하기 위해 세 가지 측면의 기술적 개선을 통한 성능 향상을 도모함에 그 목적이 있다. 첫째, 기존의 pix2pix 생성자와 달리 입력 이미지를 인코딩하는 부분에서 RRDB를 이용함으로써 더욱 더 깊은 학습을 가능하게 한다. 둘째, RAPGAN 기반의 손실함수를 사용해 원본 이미지가 생성된 이미지에 비해 얼마나 진짜 같은지를 예측하기 때문에 이 두 이미지가 모두 적대적 생성 학습에 영향을 미치게 된다. 마지막으로, 생성자를 사전학습시켜 판별자가 조기에 학습되는 것을 억제하도록 조치한다. 제안된 방법에 따르면, FID 측면에서 기존의 pix2pix보다 평균 13% 이상의 우수한 이미지를 생성할 수 있었다.

keywords
GAN, pix2pix, Conditional GAN, RRDB, Relativistic Average Patch GAN, 적대적 생성 신경망, pix2pix, Conditional GAN, RRDB, Relativistic Average Patch GAN

Abstract

This paper is related to performance improvement of Image-to-Image translation using Relativistic Average Patch GAN and Residual in Residual Dense Block. The purpose of this paper is to improve performance through technical improvements in three aspects to compensate for the shortcomings of the previous pix2pix, a type of Image-to-Image translation. First, unlike the previous pix2pix constructor, it enables deeper learning by using Residual in Residual Block in the part of encoding the input image. Second, since we use a loss function based on Relativistic Average Patch GAN to predict how real the original image is compared to the generated image, both of these images affect adversarial generative learning. Finally, the generator is pre-trained to prevent the discriminator from being learned prematurely. According to the proposed method, it was possible to generate images superior to the previous pix2pix by more than 13% on average at the aspect of FID.

keywords
GAN, pix2pix, Conditional GAN, RRDB, Relativistic Average Patch GAN, 적대적 생성 신경망, pix2pix, Conditional GAN, RRDB, Relativistic Average Patch GAN

한국사물인터넷학회논문지