Diffusion 기반 생성형 AI 활용기/Stable Diffusion 이미지 생성

1. Stable Diffusion Web UI 알아보기: 설치 및 실행

누군가의 이야기 2023. 2. 1. 15:34
728x90

https://youtu.be/emObTucGMOA

유튜버 조코딩님의 영상을 따라해보며 Stable Diffusion Web UI를 알아보고자 한다.

api 등을 활용하여 코드를 작성할 수도 있겠지만,

최신 인공지능 동향을 알아보며 즐거운 마음으로 실습해보는게 본 포스팅의 취지이기 때문에

Web UI를 통해 어떤 기능을 사용할 수 있을지 가볍게 알아보려 한다.

 


설치 및 실행

무료 오픈 소스로 공개된 웹 UI 중 하나이다.

https://github.com/AUTOMATIC1111/stable-diffusion-webui

 

GitHub - AUTOMATIC1111/stable-diffusion-webui: Stable Diffusion web UI

Stable Diffusion web UI. Contribute to AUTOMATIC1111/stable-diffusion-webui development by creating an account on GitHub.

github.com

 

위 링크로 들어가서 설치 방법을 확인한다.

로컬 환경에 설치시 운영체제마다 설치 방법이 상이하다.

이번 실습은 별도의 설치 없이 코랩 환경에서 진행하고자 한다.

깃허브 업데이트가 잦은 편이므로 본 포스팅 내용과 설치 방식이 달라질 수 있다.

꼭 밑줄 친 링크 아니어도 활용 방식은 비슷하다고 한다.

링크를 따라 들어가면 코랩 실행창으로 연결 된다

순서대로 셀을 실행하다 보면

중간에 위 사진과 같은 모델 다운로드 / 로드 셀이 나오는데,

아래 두 개의 경우 기존의 모델을 로드할 때 사용하는 것이기 때문에

가장 위의 체크박스만 체크해주었다.

 

가장 마지막 셀까지 실행하면, WebUI를 이용할 수 있는 서버 링크가 주어진다.

접속해서 스테이블 디퓨전 모델을 활용할 수 있다.

코랩 환경에서 실행할 경우, 서버와의 연결이 끊어지면 다시 셀을 실행해서 서버를 열어야 하는 번거로움이 있다.

다만 로컬 환경에서 요구하는 GPU 성능 수준이 높기 때문에 코랩에서 실습하려 한다.

 

 

728x90

메뉴 및 기능 소개

Web UI 서버를 열면 아래와 같은 실행창이 열린다.

가장 상단에서 ckpt 파일로 저장된 stable diffusion 모델을 사용할 수 있다.

 

주요 기능들을 간략하게 소개해보자면

1. txt2img: 텍스트 내용을 바탕으로 새로운 이미지를 생성해내는 기능

2. img2img: 입력값으로 주어진 이미지를 바탕으로 새로운 이미지를 만들어내는 기능

3. Extras: 이미지 사이즈 변경 등 이미지 처리를 수행할 수 있다.

4. Checkpoint Merger: stable diffusion 모델 뿐만 아니라 다른 ckpt 파일로 저장된 모델을 특정 비율로 섞어서 새로운 모델 만들 때.

5. Extensions: 확장 파일을 적용하여 다양한 새로운 기능 활용 가능

 

기능을 수행하는데에 있어서 조정해야하는 하이퍼파라미터 값들이 정말 다양한데,

stable diffusion에 관련된 정보는 구글링을 통해 그때 그때 찾아보는 습관을 들여야할 것 같다.

뭐가 그렇게  많고 생소해서..

 

직접 이미지 생성해보는 건 다음 포스팅에서 이어서 진행 예정.

 

 

728x90