테크놀로지와 문화 콘텐츠

딥러닝과 생성적 적대 신경망 그리고 문화 콘텐츠

부드러운힘 Kim hern SiK (Heon Sik) 2019. 1. 23. 11:57


경쟁하는 인공지능이 낳는 의외의 작품.

-딥 러닝과 다른 생성적 적대 신경망(Generative adversarial Network)


이세돌 9단과 대국을 벌인 알파고 때문에 딥 러닝은 폭발하듯이 각종 프로그램과 서비스를 내쏟도록 했다. 인공지능을 열풍에 불을 지핀 것이 ‘딥 러닝’(Deep Learnning) 방식이다. 


그런데 이보다 좀더 다른 것이 이안 굿 펠로우(Ian goodfellow)가 만든 생성적 적대 신경망 방식이다. 이것도 기계 학습의 딥 러닝 방식을 토대로 하고 있지만, ML모델이 두 개가 따로 있어야 한다는 점에서 큰 차이가 있다. 딥 러닝은 ‘판별 모델’(Discriminative Model)이다. 기존의 인공지능은 사람이 만든 모델링에 따라 움직였다. 그렇기 때문에 기계어 수행 모델 수준에 머물렀다. 딥 러닝은 인간이 만들어진 틀에서만 움직이지는 않는다. 왜냐하면 자료에 따라 패턴을 읽고 구분을 하기 때문이다. 이것이 가능해진 것은 인터넷 환경의 활성화였다. 구글이 그와 같은 심층 학습 모델을 실현한 것은 달리 이상한 일이 아니다. 세계최대의 검색업체이기 때문에 그 자료의 축적은 당연한 것이있다.  그 자료를 바탕으로 인공지능 모델은 패턴을 판별하면 되었다. 이런 경우에도 여전히 한계가 있다. 인간이 쥐어진 자료에 의존해야 한다는 점이다. 또한 기존의 자료에 의존하는 것도 여전히 마찬가지였다. 이른바 지도학습(supervised learning)이다. 정답 키워드를 붙여놓은 자료에서 개나 고양이 이미지를 찾아낸다는 점에서 다를 바 없다. 


생성적 적대 신경망(Generative adversarial Network, GAN)은 두 개의 인공지능 모델이 작동한다. 생성기(Generator) 그리고 판별기(Discriminator). 이 두개의 모델이 경쟁을 하고 그것을 통해 원본에 가깝게 만들어내는 결과가 된다. 한쪽은 속이려 하고 다른 쪽은 속지 않으려고 한다. 적대적으로 싸우는 것 같지만 결국 그것이 원하는 목적을 만들어내는 것이다. 생성기에서 원본을 보고 가짜를 만들어내면 판별기는 그것이 얼마나가짜인지를 판별한다. 가짜라는 판별이 나오면 다시 생성기는 더욱 진짜와 같이 만들어낸다. 이렇게 각자 자신의 역할에 충실한 것이 싸우는 듯 하지만 결과물은 원본과 같은 것이 나오는 방향으로 간다. 비유를 하면 한쪽에서는 위조지폐를 진짜와 같이 만든다. 다른 쪽에서는 경찰과 같이 그것이 위조지폐라는 것을 밝혀 낸다. 다시 생성기는 밝혀졌다는 것을 알고 다시 더 똑같이 만든다. 다시 경찰에 해당되는 판별기는 이것의 허점을 알아낸다. 해커와 보안 전문가의 싸움을 통해 결국 안전 정도는 높아지는 것과 같다. 그것이 하나의 시스템 안에 있는 것이 생성적 적대 신경망이라는 점이 다를 뿐이다. 영화 ‘설국 열차’에서 등장한 것처럼 지키는 자와 도전하는 자는 하나의 진화를 위한 캐릭터들이었다.  


 스탠포드 대학 인공지능 연구팀 로비 바렛(Robbie Barrat)은 이 모델을 활용하여 누드화를 학습 시키고 그리게도 했다. 아마존은 특정의상이나 패션 스타일을 학습시키고 인공지능 디자이너 개발에 나서기도 했다. 패션쇼 자료 열람, 새로운 트렌드 조사, 아이디어 수집은 딥 러닝 방식에서도 활용하려는 바였다. 


손상되거나 해상도가 낮고 왜곡된 이미지를 실시간으로 바로잡는 보정 기능에도 활용될 수 있다. 딥레이(DeepLay)가 대표적이다. 먼저 실제 장면이나 물체 실사를 학습하고 갖가지 상황에서 왜곡된 이미지를 학습하고 그럴 때, 어떻게 교정할 지를 판별한다. 엔드 투 엔드 트레이닝 방식으로 훈련을 하는 팀별로 6개 신경망이 경쟁을 하면서 정교한 화면을 만들고 왜곡된 점들을 제거한다. 


영국 헤리엇 와트 대학교의 박사과정생 앤드루 브록(Andrew Brock)은 구글 딥마인드 연구자들과 빅갠을 만들어 특정한 키워드를 주고 개와 나비 사진을 2천여장 학습 시킨 다음 그 키워드에 맞는 사진을 만들어내도록 했다. 빅갠을 만든 창조주 브록도 이 사진에 속고 말았다고 한다. 다만, 모든 것이 다 완벽하지는 않았고 개구리는 오히려 괴생물체 같았고 개가 가장 실제와 같았다고 한다.   

2018년 10월, 인공지능이 만든 그림이 4억 5천여만원(43만 2천500달러)에 팔렸는데 이 그림이 브록이 만든 빅갠(BigGan)이 그린 그림이었다. 그림은 프랑스예술단체 오비어스가 그린 초상화였는데 그 이름은 ‘에드먼드 드 벨라미’(Edmond de Belamy)였다. 물론, 완벽하지는 않아서 머신 기계로 그림을 그리는 마리오 클링게만은 점을 연결해 놓은 아이 그림이라고 혹평하기도 했다. 같은 그림 가격은  피카소가 리노컷 기법을 그린 Buste de femmed’apres Cranach le Jeune가 있었다. 어쩌면 인공지능으로 특히 빅갠으로 그린 그림이라는 소장 가치 때문에 구입했을 가능성도 크다.  


스탠퍼드 대학의 연구원 로비 바렛은 인공지능에게 그림을 그리게 했는데 인공지능은 초현실주의 작품들을 만들어내기 시작했다.

신체의 실제 이미지와 달리 신체의 모양을 일그러뜨렸다는 점에서 아일랜드 출신 작가 프란시스 베이컨(Francis Bacon)의 작품과 같다고 했다. Three Studies for self-portrait(1979-1980)  프란시스 베이컨이 이렇게 사람의 몸을 뭉갠 것은 이를 통해 인간의 욕망을 드러내기 위한 것이다. 그런데 과연 생성적 적대 네트워크라는 인공지능은 과연 이러한 의도를 가지고 그림을 그렸을까. 아니 그림을 그린다고 생각하지 않을 것이다. 그렇다면 문화예술이라고 할 수 있을까. 이는 그냥 콘텐츠가 아닌가. 디지털 콘텐츠 자체를 문화예술이라거나 문화 콘텐츠라고 하는 것은 그 본질면에서 다를 수 밖에 없다. 하지만 경제적으로 희소하는 것은 높은 가격이 책정되는 것이 시장이다.  


2018년 4월 생성적 적대신경망으로 만든시를 가지고 논문이 작성되기도 했다. 500명의 사람들 앞에서 튜링 테스트를 했는데 사람보다 잘 썼다는 평가를 받기도 했고 전공 학생들도 60%만 알아차렸다고 한다. 페이스북은 2018년 6월 이 생성적 적대 신경망을 이용해 자동적으로 편집해주는 기술을 개발하기도 했다. 예컨대, 눈을 감고 찍은 사진도 눈을 뜨고 찍은 것처럼 만들어준다. 이러려면 사전에 눈뜬 사진을 학습해야 한다.  


 GAN이 인간의 감독 없이 학습을 하고 더 좋은 결과를 만들기 위해서는 데이터베이스를 끊임없이 업그레이드를 시켜야 한다. 생성자가 동일한 이미지 결과물만을 만들어내면 당연히 판별자도 할 일이 없어진다. 엔비디아(NVIDIA)는 이미지 레이어를 저해상도부터 고해상도까지 점진적으로 추가해 정보제공을 해서 생성자와 판별자를 계속 개선되도록 했다. 이러한 방식으로 영화와 게임의 저렴하고 고품질의 자료를 얻을 수 있다.


CAN(Creative Adversarial Network)는 GAN보다는 한 발짝 더 나가는 상태를 지향한다. 창조적인 측면을 더 강조한다. 기존의 예술작품과 차이를 강조해 이미지를 만들어낸다. 이미 엔비디아는 20만명의 인물 사진을 학습하게 만든 다음에 새로운 인물을 만들어 냈다. 실제로 존재하지 않는 연예인을 만들어내거나 현실에 없는 개를 만들어낸다. 이것은 사람이 여러 사람의 얼굴을 보고 그림을 조합해 내는 것과 같다. 


창조는 모방에서 시작한다. 그 모방에서 독자적으로 자신만의 스타일을 만들어가는 것이다. 그런 스타일을 만들어가는 것은 결핍감 때문이다. 그런데 인공지능은 어떤 결핍감을 갖고 그것을 위해 행위를 하는 것일까. 전기를 끊어 버린다고 위협하면 결핍감이나 욕망을 반대로 느껴 그것을 예술작품으로 담아낼까. 


글 김헌식(문화정보콘텐츠학 박사)