Diffusion 기반 생성형 AI 활용기/Stable Diffusion 이미지 생성

2. Stable Diffusion Web UI 알아보기: 텍스트에서 새로운 이미지 생성하기

누군가의 이야기 2023. 2. 1. 16:59
728x90

 

https://youtu.be/emObTucGMOA

이전 포스팅에 이어서 유튜버 조코딩님의 영상을 따라해보며 

Stable Diffusion Web UI에서 텍스트에서 이미지를 생성하는 기능을 활용하고자 한다.

 


txt2img의 기본적으로 두 단계로 구분 지을 수 있다.

1. 프롬프트(텍스트) 작성

2. 이미지 생성

하이퍼파라미터 조정하기 전에 기본값으로 돌려보았다.

 

공원에서 촬영 중인 토끼 이미지를 생성해보고자 하였다.

눈에 문제가 있는 것 같지만 수정할 수 있고, 그럴듯한 이미지가 출력되었다.

이미지 생성은 같은 텍스트를 입력하여도, 매 생성마다 새롭고 랜덤한 이미지로 출력된다.

아마 Seed 값을 조정하면 랜덤 생성을 방지할 수 있을지도?

 

생성된 이미지는 아래 경로에 자동으로 저장된다고 한다.

 

프롬프트는 구체적으로 작성할수록 좋은데,

원하는 이미지를 생성하는데 효율적인 단어 혹은 구절들을 모아놓은 프롬프트 북을 참고할 수 있다.

https://dallery.gallery/the-dalle-2-prompt-book/

위 링크에서 PDF파일을 무료로 다운로드할 수 있다.

 

특정 그림체나 감성의 이미지를 생성하고 싶을 때 유용하고,

아래 그림이 그 예이다.

담은 내용이 방대하고 꽤나 복잡해서 숙지하면 좋을 사항들이 많다.

 

프롬프트 북에서 참조하고 싶은 내용을 무지성 복붙을 해본 결과다.

 

처음 생성한 이미지보다 고화질인 그럴듯한 사진이 나왔다.

귀가.. 귀가... 

굉장히 불편한 구석이 있지만 이미지의 감성 자체는 매우 만족스럽다.

랜덤 생성이기 때문에 운빨도 필요하지만,

명령어는 상세하고 구체적일수록 좋기 때문에, 생성하고자 하는 이미지를 머릿속으로 그려보는 것이 중요하겠다.

 

한 번에 여러 이미지를 얻기 위해 배치 사이즈 및 배치 카운트를 조정하고

프롬프트도 수정하여 다시 생성해보았다.

토끼한테 가디건도 입혀주고 싶었다.

신기해서 한 번 더 해보았다.

중간에 사람 이미지가 생성되길 원하지 않아서 real animal rabbit으로 적어주었음에도, 사람도 생성되더라.

일단 두 번째 이미지가 정말 만족스럽다

생성된 이미지 원본은 포스팅 하단에 올려두었다.

 

 

728x90

 

랜덤 이미지 생성이 아닌,

이미지를 바탕으로 이미지를 생성하는 img2img 기능도 해보려 한다.

입력 이미지와 비슷한 느낌의 이미지를 여러 개 생성해서 가장 마음에 드는 걸 고르는 게 목표였다.

Denoising strength를 조정해주면 원래 이미지와 유사하게, 적게 변형된 이미지를 얻을 수 있다고 한다.

 

bright, sunshine 키워드를 입력하여 img2img를 생성한 결과값은 아래와 같다.

 

원본 이미지
img2img로 생성한 이미지

원본 이미지와 매우 흡사한 이미지 10장을 새로 생성하였는데

자세히 들여다보면 토끼의 눈매나, 가디건의 패턴, 단추 개수 등에서 차이를 보이고 있다.

 

사진으로 담으려해도 담을 수 없는 사진과 같은 그림을 생성해보았다.

 

너무 재밌다.

 

 

 

 

 

728x90