1. Stable Diffusion Web UI 알아보기: 설치 및 실행
유튜버 조코딩님의 영상을 따라해보며 Stable Diffusion Web UI를 알아보고자 한다.
api 등을 활용하여 코드를 작성할 수도 있겠지만,
최신 인공지능 동향을 알아보며 즐거운 마음으로 실습해보는게 본 포스팅의 취지이기 때문에
Web UI를 통해 어떤 기능을 사용할 수 있을지 가볍게 알아보려 한다.
설치 및 실행
무료 오픈 소스로 공개된 웹 UI 중 하나이다.
https://github.com/AUTOMATIC1111/stable-diffusion-webui
GitHub - AUTOMATIC1111/stable-diffusion-webui: Stable Diffusion web UI
Stable Diffusion web UI. Contribute to AUTOMATIC1111/stable-diffusion-webui development by creating an account on GitHub.
github.com
위 링크로 들어가서 설치 방법을 확인한다.
로컬 환경에 설치시 운영체제마다 설치 방법이 상이하다.
이번 실습은 별도의 설치 없이 코랩 환경에서 진행하고자 한다.
깃허브 업데이트가 잦은 편이므로 본 포스팅 내용과 설치 방식이 달라질 수 있다.
링크를 따라 들어가면 코랩 실행창으로 연결 된다
순서대로 셀을 실행하다 보면
중간에 위 사진과 같은 모델 다운로드 / 로드 셀이 나오는데,
아래 두 개의 경우 기존의 모델을 로드할 때 사용하는 것이기 때문에
가장 위의 체크박스만 체크해주었다.
가장 마지막 셀까지 실행하면, WebUI를 이용할 수 있는 서버 링크가 주어진다.
접속해서 스테이블 디퓨전 모델을 활용할 수 있다.
코랩 환경에서 실행할 경우, 서버와의 연결이 끊어지면 다시 셀을 실행해서 서버를 열어야 하는 번거로움이 있다.
다만 로컬 환경에서 요구하는 GPU 성능 수준이 높기 때문에 코랩에서 실습하려 한다.
메뉴 및 기능 소개
Web UI 서버를 열면 아래와 같은 실행창이 열린다.
가장 상단에서 ckpt 파일로 저장된 stable diffusion 모델을 사용할 수 있다.
주요 기능들을 간략하게 소개해보자면
1. txt2img: 텍스트 내용을 바탕으로 새로운 이미지를 생성해내는 기능
2. img2img: 입력값으로 주어진 이미지를 바탕으로 새로운 이미지를 만들어내는 기능
3. Extras: 이미지 사이즈 변경 등 이미지 처리를 수행할 수 있다.
4. Checkpoint Merger: stable diffusion 모델 뿐만 아니라 다른 ckpt 파일로 저장된 모델을 특정 비율로 섞어서 새로운 모델 만들 때.
5. Extensions: 확장 파일을 적용하여 다양한 새로운 기능 활용 가능
기능을 수행하는데에 있어서 조정해야하는 하이퍼파라미터 값들이 정말 다양한데,
stable diffusion에 관련된 정보는 구글링을 통해 그때 그때 찾아보는 습관을 들여야할 것 같다.
뭐가 그렇게 많고 생소해서..
직접 이미지 생성해보는 건 다음 포스팅에서 이어서 진행 예정.