키워드를 사진으로 변환하는 AI 사용기

기타 2022. 5. 20. 18:56

지금으로부터 대략 한 달 전쯤 텍스트를 기반으로 하여 그에 맞는 이미지를 생성해주는 인공지능 신경망 시스템 DALL-E의 버전 2가 개발되었다는 뉴스가 있었다. 해당 AI를 개발한 곳은 미국에 위치한 인공지능 연구소 '오픈AI' 이며, 디자이너들과 예술가들이 영감을 얻거나 작품 제작을 하는 데에 있어서 유용할 수 있다는 말과 컴퓨터 게임 회사들이 이 시스템을 사용해 다양한 장면과 캐릭터를 생성하기 원한다고 했다.

시스템의 이름인 DALL-E의 어원은 화가 살바도르 달리와 예전 만화 영화인 월-E를 합쳐 만들었다고 했으며 일반적인 배경에 만화 풍의 사진만 만들어낼 수 있었던 DALL-E 버전 1에 비해 버전 2의 DALL-E는 보다 복잡하고 세심한 배경, 효과와 그림자, 음영 등을 표현하여 고해상도 이미지를 출력할 수 있다고 한다. 또한 이미지를 하나만 생성해주는 것이 아니라 키워드를 입력하면 해당하는 테마에 대해 수십 가지의 이미지를 출력해준다고 한다.

http://www.aitimes.com/news/articleView.html?idxno=143854

오픈AI, 텍스트를 고해상도 이미지로 생성하는 AI 시스템 ‘DALL-E 2’ 개발 - AI타임스

미국의 인공지능 연구소 오픈AI(OpenAI)가 보고 싶은 것을 텍스트로 설명하면 디지털 이미지로 생성해 주는 AI 시스템을 만들었다고 최근 자사 블로그를 통해 발표했다. 이 시스템은 고해상도의 이

www.aitimes.com

과연 이 시스템이 어떤 방식으로 사진을 출력해줄 지 궁금했지만 원본인 DALL-E 2.0을 사용해보기에는 조금 복잡해 보여서 오픈 AI 커뮤니티인 '허깅 페이스'에 있는 DALL-E 미니를 사용해보았다. 아마 DALL-E의 원본과는 제작자가 다른 것 같지만 그래도 비슷해 보인다. 참고로 DALL-E 미니는 여기에서 사용해볼 수 있다.

DALL-E 미니 사이트에 들어가면 덩그러니 검색창 같은 화면이 놓여 있는데, 중앙에 보이는 검색창에 원하는 키워드를 넣고 RUN 버튼을 누른 후, 약간의 시간을 기다려 보면 해당 키워드를 바탕으로 인공지능이 제작한 이미지가 몇 가지 생성된다. 처음으로 검색창에 넣어 볼 키워드는 일단 거북(tortoise)로 해 보았다.

키워드를 입력하고 대충 20초 정도를 기다리니 정말 육지거북처럼 보이는 이미지가 아홉 장 생성된 것을 확인할 수 있었지만, 미니 버전이라 그런지 얼굴이 묘하게 뒤틀려 있다거나 눈코입이 찌그러졌다거나 하는 다소 기괴한 이미지가 출력되었다.. 그래서 이번에는 전차를 키워드로 넣어 검색해 보았다.

임의 전차의 이름을 키워드에 넣어 보았더니 이번에도 다소 비슷하지만 어딘가 뒤틀려 있는 애매한 사진들이 나왔다. 포신이 뭉툭하거나, 캐터필러가 왜곡되어 있거나.. 그래서 이번에는 마지막으로 '개'와 '새'를 합친 '개새' 라는 검색어를 키워드로 입력해 보았다.

결과는 생각보다 실망(?)이었다. 원본 DALL-E가 아닌 DALL-E 미니라서 이런 걸수도 있겠지만 이런 걸 예상하고 있었는데, 의외로 개와 새가 평범하게 같이 있는 이미지가 나왔다. 아직 미흡해 보이긴 하지만 입력한 키워드를 바탕으로 나름 이 정도의 이미지를 만들어 주는 것만으로도 상당히 흥미로웠다. 확실히 저런 사진상의 왜곡만 덜하다면, 혹은 원본 DALL-E 등의 발전한 AI를 사용한다면 사진과 AI가 만든 그림의 차이를 구분하기 어려울 것 같다.

'기타' 카테고리의 다른 글

CBDC에 대한 정리글 (1) (1)	2022.06.05
아글렛 IRL 운동화 1차 예구 실패 (0)	2022.05.29
신규 M2E 서비스 트레이서 (0)	2022.05.07
언리얼 엔진 5 테크데모 감상 후기 (0)	2022.04.30
'더 샌드박스' 에디터 기초 소개 (0)	2022.04.24

ABOUT ME

subject Incognitus

'기타' 카테고리의 다른 글

티스토리툴바

ABOUT ME

'기타' 카테고리의 다른 글

관련글 관련글 더보기

티스토리툴바