네이티브 Thinking Mode, 95% 이상의 텍스트 렌더링 정확도, 생성 중 웹 검색, 최대 16개의 참조 이미지를 지원하는 OpenAI의 가장 진보된 이미지 생성 모델입니다. 정밀한 타이포그래피, 일관된 캐릭터, 다국어 텍스트 지원으로 프로덕션 준비가 완료된 비주얼을 생성하세요.
GPT Image 2(ChatGPT Images 2.0)는 GPT-4o 이미지 생성의 후속 모델로 2026년 4월에 출시된 OpenAI의 최신 이미지 모델입니다. 내장 추론 기능을 갖춘 최초의 OpenAI 이미지 모델로, 라틴 문자와 비라틴 문자 모두에서 95% 이상의 텍스트 렌더링 정확도를 달성했습니다. 2K 해상도 출력, 3:1에서 1:3까지의 연속 종횡비를 지원하며, 단일 프롬프트에서 최대 8개의 일관된 이미지를 생성합니다. Thinking Mode를 사용하면 생성 중 웹을 검색하고, 업로드된 브랜드 가이드라인을 분석하며, 렌더링 전에 출력 결과를 자체 검증할 수 있습니다.

내장 추론 기능을 갖춘 최초의 OpenAI 이미지 모델입니다. 웹을 검색하고, PDF 및 브랜드 가이드라인 같은 업로드된 자료를 분석하며, 그리기 전에 레이아웃을 추론하고, 결과를 반환하기 전에 자체 검증합니다.
타이포그래피를 핵심 요소로 처리하는 획기적인 텍스트 렌더링. 선명한 헤드라인, 읽기 쉬운 작은 캡션, 정확한 SKU 및 가격 — 더 이상 생성물에서 깨진 텍스트는 없습니다.
일본어, 한국어, 중국어, 힌디어, 벵골어 및 모든 라틴 문자에서 네이티브 품질의 텍스트 렌더링. 글로벌 마케팅 자료, 메뉴판 및 국제적 크리에이티브 작업을 위한 혼합 스크립트 처리.
최대 16개의 참조 이미지를 업로드하여 생성된 모든 출력에서 캐릭터 일관성, 제품 디테일 유지, 다중 요소 융합 및 스타일 정렬을 구현합니다.
최대 2048x2048(2K) 출력 해상도와 3:1 초광각부터 1:3 초장형까지 연속 종횡비 지원. 더 이상 고정 프리셋은 없습니다 — 필요한 모든 비율을 지정하세요.
단일 프롬프트에서 최대 8개의 일관된 이미지를 생성하며, 캐릭터, 객체 및 조명이 전체 세트에서 유지됩니다 — 스토리보드, 변형 제품 및 배치 생산에 이상적입니다.
GPT Image 2 FAQ
GPT Image 2(ChatGPT Images 2.0)는 2026년 4월에 출시된 OpenAI의 최신 이미지 생성 모델입니다. DALL-E 3와 달리 네이티브 Thinking Mode 추론, 95% 이상의 텍스트 렌더링 정확도, 생성 중 웹 검색, 최대 16개 참조 이미지, 2K 해상도 출력, 그리고 일본어, 한국어, 중국어, 힌디어, 벵골어를 위한 다국어 텍스트 지원을 갖추고 있습니다.
Thinking Mode는 이미지 생성 전에 추론 과정을 추가합니다. 모델이 최신 참고 자료를 위해 웹을 검색하고, 업로드된 PDF 및 브랜드 가이드라인 같은 자료를 분석하며, 레이아웃과 구성을 계획한 다음 렌더링 전에 출력 결과를 자체 검증합니다. 복잡한 프롬프트의 경우 최대 2분이 소요되지만, 브랜드 준수, 정보 집약적 또는 다단계 크리에이티브 요청에 대해 훨씬 더 우수한 결과를 제공합니다.
GPT Image 2는 지원되는 모든 스크립트에서 95% 이상의 텍스트 렌더링 정확도를 달성하며, 이는 이전 모델의 약 60-70%에 비해 크게 향상된 수치입니다. 헤드라인, 작은 캡션, SKU, 가격 및 라벨이 모두 프롬프트를 정확히 따릅니다. 텍스트 렌더링이 프로덕션 사용에 충분히 신뢰할 수 있는 최초의 AI 이미지 모델입니다.
GPT Image 2는 일본어, 한국어, 중국어(간체 및 번체), 힌디어, 벵골어, 그리고 영어, 프랑스어, 독일어, 스페인어 등을 포함한 모든 라틴 기반 문자에서 네이티브 품질의 텍스트 렌더링을 제공합니다. 단일 생성에서 혼합 스크립트 콘텐츠를 처리할 수 있습니다.
GPT Image 2는 단일 요청에서 최대 16개의 참조 이미지를 지원합니다. 참조 이미지는 별도 설정을 조정할 필요 없이 자동으로 고충실도로 처리됩니다. 이를 통해 생성된 모든 출력에서 캐릭터 일관성, 제품 디테일 및 시각적 스타일을 유지할 수 있습니다.
GPT Image 2는 최대 2048x2048(2K)의 출력 해상도와 3:1(초광각)부터 1:3(초장형)까지의 연속 종횡비를 지원합니다. 고정 프리셋이 있는 이전 모델과 달리, 이 범위 내에서 원하는 모든 비율을 지정할 수 있습니다. 또한 직접 파이프라인 통합을 위한 투명 배경 내보내기도 지원합니다.
GPT Image 2는 토큰 기반 가격을 사용합니다. 표준 1024x1024 해상도에서 비용은 이미지당 약 $0.006(저품질)에서 $0.211(고품질)까지입니다. 입력 토큰은 백만 개당 $8, 출력 토큰은 백만 개당 $30입니다. 모델 ID는 'gpt-image-2'이며 자동 업데이트 별칭 'chatgpt-image-latest'도 사용할 수 있습니다.
네. GPT Image 2의 Thinking Mode는 렌더링 전에 QR 코드 인코딩을 계산하여 모든 휴대폰 카메라로 스캔 가능한 기능성 QR 코드를 생성할 수 있습니다. 브랜드 색상으로 스타일링하고, 중앙에 로고를 삽입하며, 완전히 디자인된 포스터 내에 배치하는 등 세 단계를 하나의 프롬프트로 통합할 수 있습니다.
네. 기존 이미지를 업로드하고 동일한 채팅 내에서 자연어 프롬프트를 통해 수정할 수 있습니다. 여기에는 스타일 전환, 요소 교체, 디테일 향상, 레이아웃 업데이트 및 다중 이미지 블렌딩이 포함됩니다. 텍스트-투-이미지와 이미지-투-이미지 워크플로우 모두 단일 엔드포인트에서 지원됩니다.
GPT Image 2는 배너 광고 및 소셜 그래픽을 제작하는 마케팅 팀, 제품 카탈로그를 생산하는 E커머스 판매자, 인포그래픽 및 프레젠테이션을 작업하는 디자이너, 썸네일 및 포스터를 만드는 콘텐츠 크리에이터, 일관된 캐릭터와 읽기 쉬운 대사 풍선이 필요한 만화가, 그리고 정확한 텍스트가 포함된 프로덕션 품질의 AI 이미지가 필요한 모든 사람에게 이상적입니다.
“텍스트 렌더링만으로도 업그레이드할 가치가 있습니다. 이제 정확한 라벨과 가격이 포함된 제품 목업을 한 번에 생성할 수 있어, Photoshop에서 텍스트를 따로 추가할 필요가 없어졌습니다.”
“제품 사진에 16개의 참조 이미지를 사용하면 카탈로그의 모든 항목이 일관된 조명과 스타일을 갖게 됩니다. 사진 촬영 비용을 80% 절감했습니다.”
“텍스트 렌더링만으로도 업그레이드할 가치가 있습니다. 이제 정확한 라벨과 가격이 포함된 제품 목업을 한 번에 생성할 수 있어, Photoshop에서 텍스트를 따로 추가할 필요가 없어졌습니다.”
“제품 사진에 16개의 참조 이미지를 사용하면 카탈로그의 모든 항목이 일관된 조명과 스타일을 갖게 됩니다. 사진 촬영 비용을 80% 절감했습니다.”
“텍스트 렌더링만으로도 업그레이드할 가치가 있습니다. 이제 정확한 라벨과 가격이 포함된 제품 목업을 한 번에 생성할 수 있어, Photoshop에서 텍스트를 따로 추가할 필요가 없어졌습니다.”
“제품 사진에 16개의 참조 이미지를 사용하면 카탈로그의 모든 항목이 일관된 조명과 스타일을 갖게 됩니다. 사진 촬영 비용을 80% 절감했습니다.”
“텍스트 렌더링만으로도 업그레이드할 가치가 있습니다. 이제 정확한 라벨과 가격이 포함된 제품 목업을 한 번에 생성할 수 있어, Photoshop에서 텍스트를 따로 추가할 필요가 없어졌습니다.”
“제품 사진에 16개의 참조 이미지를 사용하면 카탈로그의 모든 항목이 일관된 조명과 스타일을 갖게 됩니다. 사진 촬영 비용을 80% 절감했습니다.”
GPT Image 2 — OpenAI의 가장 진보된 AI 이미지 생성기를 무료로 체험해보세요
참조 이미지를 드래그 앤 드롭하거나 파일 찾아보기
지원 형식: JPG, PNG, WEBP • MAX 10MB