생성형ai 기술 기반 미드저니 사용법 - part1

이번 글에서는 최근 가장 핫한 기술 중 하나인 이미지 생성형ai 기술 기반 ‘미드저니 사용법’에 대해 살펴보겠습니다. 제가 직접 한 달 이상 사용하면서 생각해 본 경험 중심으로 정리해 보려 합니다.

생성형ai 기술 – 미드저니 (Midjourney) 사용법

미드저니 홈페이지에서는 다음과 같이 설명하고 있어요.

Midjourney is an independent research lab exploring new mediums of thought and expanding the imaginative powers of the human species. We are a small self-funded team focused on design, human infrastructure, and AI.

대략 한국말로 의미를 옮겨보면, 미드저니는 새로운 사고 매체를 탐구하고 인류의 상상력을 확장하는 독립적인 연구소입니다. 우리는 디자인, 인류 체계와 인공지능에 초점을 맞춘 작은 조직입니다.라고 설명했어요. 자신들의 목적과 아이덴티티를 분명히 하고 있는 것 같은데요. 왠지 설명문의 말투와 미드저니의 출력물이 주는 느낌이 비슷한 것 같습니다.

미드저니는 무엇에 쓰는 도구인가를 한 마디로 정의하면, 자신이 생각하는 디자인이나 이미지를 text를 통해 만들어 낼 수 있는 도구라고 할 수 있을 것 같습니다. 즉, 기존에 전문적인 사진가나 디자이너를 통해서만 얻을 수 있었던 사진이나 이미지를 미드저니를 통해 생산해 낼 수 있다는 것이죠.

실제 예시를 위해 다음과 같은 text를 프롬프트에 입력해 보겠습니다.

Different types of books and a woman, looking at them with curiosity, professional photography –ar 16:9 –style raw –stylize 200

문자 그대로, ‘여러 가지 책과 그것들을 궁금하게 바라보는 여자’에 대한 전문적인 사진을 요구했습니다. 문구 뒤 16:9나 style 등은 사진과 관련한 매개변수들입니다. 이 매개변수들은 미드저니 도큐먼트를 참고해야 합니다. 정해진 규칙이니까요.

상기 프롬프트에 대한 출력물은 다음과 같습니다.

생성형ai 기술 미드저니 사용 방법 01 — 생성형ai 미드저니 사용 방법 01

프롬프트를 입력하면 4장의 서로 다른 사진(이미지)을 출력합니다. 이 중 마음에 드는 이미지를 선택하면 다음과 같은 화면이 나오고, 또 다른 옵션을 통해서 원하는 이미지로 결과를 만들어 갈 수 있습니다.

Vary는 말 그대로 약간 또는 강한 변화에 따라 현재 이미지를 변경하여 결과를 만드는 옵션입니다.

Upscale은 이미지 확대 및 마무리 정리를 의미합니다. 거의 변화 없는(Subtle) 마무리 정리 또는 변화(creative)를 주는 옵션 2 가지가 있습니다. 이때 creative를 선택하면 인물의 얼굴도 바뀔 수 있습니다.

Remix는 거의 다시 그린다고 보면 되고요, Pan은 해당 방향으로 이미지를 폭을 증가하는 거예요. 옵션 순서대로 출력물을 보면, 먼저 위쪽 방향 옵션은 다음과 같이 출력되었어요.

다음은 아래 방향 옵션.

위 방향이나 아래 방향 등 옵션이 의미하는 바는 직관적으로 알 것 같죠? 때문에 좌, 우 역시 예상됩니다.

그런데, 위나 아래 방향 옵션은 처음 프롬프트 파라미터 중 –ar 16:9를 입력해 화면비율을 16:9로 하라고 했지만, 해당 방향 옵션을 선택하니 화면 비율이 바뀌어 출력되었습니다. 이 부분은 미드저니에서 앞으로 좀 수정이 되어야 할 부분 같아요.

다음으로 Zoom 옵션은 1.5x 만큼, 또는 2x 만큼 Zoom out 한 결과물을 원할 때 선택합니다. 아래 사진은 2x 옵션의 결과입니다.

Change AR은 말 그대로 화면 비율을 바꾸는 거고요.

Vary Region은 제가 가장 쓰게 된 옵션이었어요. 출력된 이미지에 일정 부분만 수정하거나 애니메이션 효과 같은 여러 장의 이미지가 필요할 때 사용하기 좋았습니다.

Vary Region 옵션을 선택하면 위와 같은 화면이 열립니다. 화면 좌측 아래 점선 사각형이나 목줄 형태의 옵션을 선택하여 수정하고자 하는 영역을 지정합니다. 아래 그림처럼 말이죠. 또 기존 프롬프트에 원하는 내용을 추가합니다.

저는 에메랄드 빛의 눈동자가 너무 이질적이어서 갈색 빛 눈동자로 변경하기 위해 눈동자 영역을 지정하고 프롬프트에 다음과 같이 추가했습니다.

has large bright brown eyes,

이제 결과물을 볼까요?

총 4개의 결과물 중 4번을 선택하여 업스케일 옵션을 선택합니다.

자 이제 결과물의 눈동자 색상이 원하는 데로 바뀐 것을 확인할 수 있습니다.

미드저니 프롬프트 구조

여기까지 간단한 미드저니의 옵션에 관한 것이었고요, 이제부터 조금은 부담스러운 미드저니 프롬프트에 대해 간단히 이야기해 보도록 하겠습니다.

프롬프트는 크게 text만을 사용하는 베이직 프롬프트와 이미지+text 형태의 고급 프롬프트로 2가지로 구분됩니다. 오늘은 프롬프트 입력 방식만 간단하게 다루고, 다음 포스팅에서 각 프롬프트 구성에 따른 자세한 내용을 정리해 보도록 하겠습니다.

프롬프트 입력 방법에는 두 가지가 있습니다.

하나는 아래 그림과 같이 ‘디스코드’를 통한 입력 방식이 있습니다. 미드저니 디스코드 채널에서 ‘/imagine’을 입력하고 나서 프롬프트를 작성합니다.

두 번째는 미드저니 웹페이지에서 프롬프트를 입력하는 방법입니다. 이 방법은 현재 알파 버전입니다.

미드저니 웹페이지에 접속하면 위 그림과 같이 상단에 프롬프트 입력란이 보입니다. 여기에 원하는 이미지를 설명하는 문구를 입력하면 됩니다. 그림 우측 상단에 빨간색 박스를 누르면 그림에 표기된 매개변수들이 나타납니다. 웹페이지 프롬프트가 디스코드보다 훨씬 직관적으로 컨트롤할 수 있도록 구성되어 있습니다.

그리고, 개인적인 느낌적인 느낌인지는 모르겠지만, 출력 속도면에서도 디스코드보다 웹페이지가 더 빠르게 반응하고 있지 않나 싶습니다. GPU 사용량에 따라 과금이 결정된다고 할 수도 있는 워낙 큰 높은 수준의 이미지를 얻을 수 있는 미드저니라 최종 결과물을 얻을 때까지 소요되는 시간을 무시할 수 없기 때문에 조금이라도 더 속도가 빨라지기를 바랄 뿐입니다.

다음 포스팅에서 조금 더 상세하게 다루게 될 테지만, 미드저니는 생성형ai 기술 기반이지만, 대화형 ai처럼 자연어 처리 기술을 사용하지는 않는다고 하더군요. 그래서 그런지 text로 원하는 이미지를 묘사하다 보면 아무리 상세히 설명하려 해도 결과물은 전혀 다르게 나타날 때가 있습니다. 때문에 전체 문자의 문맥이나 구조를 파악하기 보다는 단어 중심의 연결 관계 정도를 기준으로 판단하는 것이 아닌가 싶고, 또 이 때문에 복잡한 문장보다는 간단한 문자의 프롬프트가 효과적이라는 이야기들을 하는 것 같습니다.

지금까지 미드저니 사용법에 대해 간단히 살펴 봤습니다. 아직 살펴보지 못한 부분이 많기 때문에 계속해서 미드저니 사용법과 관련한 내용을 이어갈 예정입니다.

인간과 대화하는 미래의 기술 #1 ▶ 바로가기

생성형ai 기술 기반 미드저니 사용법 – part1

생성형ai 기술 – 미드저니 (Midjourney) 사용법

미드저니 프롬프트 구조

답글 남기기 응답 취소