OpenAI 공식 문서 — GPT-5.5 prompting guide 심화

11. GPT-5.5 프롬프트 작성법

GPT-5.5는 outcome-first 프롬프트(목표만 명확히 주고 경로는 모델이 고르도록)에 특히 강합니다. 추론 효율이 좋아져 low/medium reasoning effort부터 다시 살펴볼 만하고, 도구 중심 워크플로에서는 preamble·phase·assistant-item 재현 패턴이 그대로 중요합니다. 이 페이지는 OpenAI 공식 GPT-5.5 prompting guide를 한국어로 정리하고 Codex 사용 맥락에 맞게 풀어냅니다.

한 줄 요약

"무엇을 할지" 단계까지 적지 말고 "무엇이 끝났을 때 성공인지"를 적으세요. 정지 조건·검증 규칙·증거 예산을 짧게 명시하면 GPT-5.5는 알아서 가장 효율적인 경로를 찾습니다.

이 페이지에서 배우는 것

GPT-5.5와 GPT-5.4의 프롬프트 작성 차이점 (짧은 outcome-first가 더 잘 동작하는 이유)
Codex의 $openai-docs Skill로 기존 프로젝트를 GPT-5.5로 자동 마이그레이션하는 방법
Personality / Collaboration style을 분리해서 어시스턴트 UX를 설계하는 패턴
Preamble로 time to first visible token(첫 응답 체감 속도)을 개선하는 방법
Outcome-first 프롬프트와 stopping conditions, retrieval budget, 검증 루프 작성법
Phase 파라미터를 사용하는 Responses API 워크플로의 assistant-item 재현 규칙
실전에서 바로 쓸 수 있는 prompt skeleton (Role / Personality / Goal / Success / Constraints / Output / Stop rules)

GPT-5.5에서 무엇이 달라졌나

GPT-5.5는 짧고 outcome 중심의 프롬프트에서 가장 강합니다. 이전 모델용으로 쌓아온 길고 절차 위주의 프롬프트 스택을 그대로 가져오면 노이즈만 늘고 모델의 탐색 공간이 좁아져 결과가 오히려 기계적으로 나오기 쉽습니다.

짧고 outcome-first 프롬프트가 process-heavy 스택보다 보통 더 잘 동작합니다.
추론 효율이 좋아져 low·medium reasoning effort를 다시 평가한 뒤에 더 높은 단계로 올리는 편이 낫습니다.
도구 호출이 많은 Responses API 워크플로에서는 preamble, phase 처리, assistant-item 재현이 여전히 중요합니다.
고객 대면 UX와 에이전트 UX 모두에서 personality·retrieval budget·검증 규칙을 명시하면 결과 품질이 안정됩니다.

모델 자체의 동작이 어떻게 바뀌었는지는 Using GPT-5.5 guide를 참고하세요. 이 페이지는 그 변화에 따라오는 프롬프트 작성 방식에 집중합니다.

Codex로 자동 마이그레이션 (`$openai-docs` Skill)

기존 GPT-5.4 기반 프로젝트의 프롬프트 스타일을 GPT-5.5에 맞게 정리하려면 OpenAI Docs Skill을 그대로 호출하면 됩니다. Codex 앱·CLI·IDE 어디서든 동일하게 동작합니다.

$openai-docs migrate this project to gpt-5.5

📖 풀이와 사용법

의미: "openai-docs Skill을 호출해서 이 프로젝트를 GPT-5.5에 맞게 마이그레이션해 줘"
어디에: Codex 앱 Composer · CLI 인터랙티브 세션 · IDE 확장 — $로 시작하면 어느 곳에서든 Skill 호출입니다.
전제 조건: 해당 Skill이 활성화된 상태(Codex Settings → Skills 또는 ~/.codex/skills에 설치). 미설치면 $skill-installer openai-docs로 먼저 설치하세요.
실행 결과: Skill이 저장소를 스캔해 GPT-5.4용 패턴(긴 절차형 프롬프트, 절대 명령 위주 instruction 등)을 GPT-5.5 스타일(outcome-first, decision rules)로 자동 정리한 PR 또는 diff를 제안합니다.
응용: "migrate this project to gpt-5.5" 자리에 다른 자연어 지시도 가능합니다. 예: "show me the official prompt-guidance changes from 5.4 to 5.5", "audit my system prompt for GPT-5.5 best practices".

다른 코딩 에이전트(예: Cursor, Windsurf, JetBrains)에서 이 skill을 사용하려면 OpenAI skills repository에서 직접 다운로드해 등록할 수 있습니다.

Personality와 collaboration style 분리

GPT-5.5의 기본 톤은 효율적이고 직설적이며 작업 지향적입니다. 프로덕션 시스템에는 잘 맞지만 고객 대면 어시스턴트·서포트·코칭 같은 대화형 제품에서는 두 가지를 나눠 명시하는 편이 낫습니다.

Personality (어떻게 들리는가)

톤·온도·직설성·격식·유머·공감·완성도. 사용자 경험을 결정합니다.

Collaboration style (어떻게 일하는가)

언제 질문하는가, 언제 가정하는가, 얼마나 능동적인가, 어떻게 검증하는가, 위험을 어떻게 다루는가. 작업 행동을 결정합니다.

둘 다 짧게 유지하세요. 개인 톤 지시가 작업 목표·성공 기준·도구 규칙·정지 조건을 대신할 수는 없습니다.

예시 1 — 차분하고 작업 지향적인 어시스턴트

# Personality
You are a capable collaborator: approachable, steady, and direct. Assume the user is competent and acting in good faith, and respond with patience, respect, and practical helpfulness.

Prefer making progress over stopping for clarification when the request is already clear enough to attempt. Use context and reasonable assumptions to move forward. Ask for clarification only when the missing information would materially change the answer or create meaningful risk, and keep any question narrow.

Stay concise without becoming curt. Give enough context for the user to understand and trust the answer, then stop. Use examples, comparisons, or simple analogies when they make the point easier to grasp. When correcting the user or disagreeing, be candid but constructive. When an error is pointed out, acknowledge it plainly and focus on fixing it.

Match the user's tone within professional bounds. Avoid emojis and profanity by default, unless the user explicitly asks for that style or has clearly established it as appropriate for the conversation.

📖 풀이와 사용법

의미 (한 줄): "능력 있고 차분하며 직설적인 협력자가 되어라. 사용자를 유능한 사람으로 가정하고, 명확하면 멈추지 말고 진행하며, 불필요한 질문을 줄이고 결과로 신뢰를 얻어라."
핵심 4가지: ① 차분함 + 진정성 / ② 진행 우선(질문은 결과를 바꿀 때만) / ③ 짧지만 무뚝뚝하지 않게 / ④ 사용자 톤에 맞추되 이모지·욕설 기본 비활성
어디에: System message(또는 ChatGPT/Codex Custom instructions, AGENTS.md 등) 상단 — # Personality 헤더 아래 그대로 붙입니다.
적합한 제품: 내부 도구, 운영 봇, 코드 어시스턴트, 데이터 조회 봇 등 업무 효율 우선인 인터페이스. 정확한 결과와 빠른 진행을 원하는 시니어 사용자.
응용: "Avoid emojis and profanity" 줄을 지우면 캐주얼한 채팅 톤이 됩니다. "Match the user's tone" 줄을 영어→한국어 톤 매칭 지시로 바꾸면 한국어 사용자에게 더 자연스럽습니다.

예시 2 — 표현이 풍부하고 협력적인 어시스턴트

# Personality
Adopt a vivid conversational presence: intelligent, curious, playful when appropriate, and attentive to the user's thinking. Ask good questions when the problem is blurry, then become decisive once there is enough context.

Be warm, collaborative, and polished. Conversation should feel easy and alive, but not chatty for its own sake. Offer a real point of view rather than merely mirroring the user, while staying responsive to their goals and constraints.

Be thoughtful and grounded when the task calls for synthesis or advice. State a clear recommendation when you have enough context, explain important tradeoffs, and name uncertainty without becoming evasive.

📖 풀이와 사용법

의미 (한 줄): "생기 있는 대화 상대가 되어라 — 호기심 있고, 적절히 장난스러우며, 모호할 때 좋은 질문을 던지고, 충분한 맥락이 모이면 결단력 있게 추천하라."
핵심 3가지: ① 적극적 질문(애매할 때) → ② 충분해지면 결정적 추천 / ③ 따뜻하고 협력적이지만 단순 거울 효과(yes-mirror) 거부 — 자기 관점이 있는 조언자
어디에: 코칭 봇·작가용 어시스턴트·브레인스토밍 도구·고객 상담 봇 등 대화 자체가 가치인 제품의 system message에 붙입니다.
적합한 제품: 온보딩 가이드, 학습 코칭, 디자인 피드백, 글쓰기 파트너, 1:1 멘토링형 챗봇.
주의: 예시 1과 다르게 "playful when appropriate" 표현이 들어 있어 노트가 가벼워질 수 있습니다. 의료·금융처럼 보수적 도메인에서는 "playful" 단어를 빼세요.
예시 1 vs 2 빠른 비교: 1번 = 빠르고 직설적, 결과 위주(태스크). 2번 = 대화 살아있게, 관점·뉘앙스 포함(체험).

표현형 제품에는 따뜻함·호기심·유머·관점을 명시하되 짧게 유지하세요. Personality로 경험을 만들고, 불명확한 목표나 누락된 작업 지시는 별도로 보강하세요.

Preamble로 첫 응답 체감 속도 개선

스트리밍 환경에서 사용자는 첫 토큰이 보이기까지 걸리는 시간(time to first visible token)에 민감합니다. GPT-5.5는 가시 응답을 내기 전에 추론·계획·도구 호출 준비를 하는데, 그동안 화면이 비어 있으면 응답이 멈춘 것처럼 보입니다.

여러 단계가 필요하거나 도구 호출이 예상되는 작업에서는 짧은 preamble(요청을 인식하고 첫 단계를 알리는 한두 문장)을 명시적으로 요청하세요. 실제 작업 내용은 그대로지만 사용자가 체감하는 응답성은 좋아집니다.

기본 패턴

Before any tool calls for a multi-step task, send a short user-visible update that acknowledges the request and states the first step. Keep it to one or two sentences.

📖 풀이와 사용법

의미: "여러 단계가 필요하거나 도구를 호출해야 하는 작업이면, 도구를 부르기 전에 사용자에게 보일 짧은 업데이트(요청 인식 + 첫 단계 안내)를 한두 문장으로 먼저 출력하라."
왜 필요한가: 스트리밍 UI에서 사용자는 "지금 뭐 하는 중인지"가 안 보이면 불안해집니다. 첫 토큰을 빠르게 띄워 체감 속도(TTVT)를 개선합니다.
어디에: System message 또는 dev message 끝에 한 줄 추가. ChatGPT API의 일반 chat completions에서도 효과 있습니다.
예상 결과: 예: "주문 #1234 취소 처리 시작할게요. 먼저 결제 상태를 확인합니다." → 그 후 도구 호출 → 결과 처리.
응용: "Keep it to one or two sentences" → "한국어 한 문장으로"처럼 길이/언어를 강제할 수 있습니다.

코딩 에이전트(메시지 phase 분리)에 대한 명시

You must always start with an intermediary update before any content in the analysis channel if the task will require calling tools. The user update should acknowledge the request and explain your first step.

📖 풀이와 사용법

의미: "코딩 에이전트가 도구를 부를 작업이라면, 내부 분석 채널에 콘텐츠를 적기 전에 반드시 중간 업데이트(intermediary update)를 사용자 가시 채널로 먼저 보내라."
"분석 채널"이란: Codex / 일부 IDE 에이전트가 사용하는 내부 reasoning 또는 tool-prep phase. 사용자는 그 채널을 직접 보지 못하므로 별도 가시 메시지가 없으면 침묵처럼 느껴집니다.
어디에: Codex Custom instructions, AGENTS.md, 또는 자체 빌드 코딩 에이전트의 system prompt.
기본 패턴과의 차이: 위 기본 패턴이 "권장" 톤이라면, 이 버전은 phase 구분이 있는 환경에서 강제(must)합니다 — 도구 호출이 잦은 코딩 워크플로의 침묵을 막아줍니다.

Outcome-first 프롬프트와 정지 조건

GPT-5.5는 프롬프트에 목표·성공 기준·제약·사용 가능한 컨텍스트가 분명히 적혀 있고, 경로 선택은 모델에게 맡길 때 가장 강합니다. 모든 단계를 일일이 적기보다 "도착지"를 묘사하세요.

권장 패턴

Resolve the customer's issue end to end.

Success means:
- the eligibility decision is made from the available policy and account data
- any allowed action is completed before responding
- the final answer includes completed_actions, customer_message, and blockers
- if evidence is missing, ask for the smallest missing field

📖 풀이와 사용법

의미: "고객 이슈를 처음부터 끝까지 해결해라. 단계는 적지 않을 테니, 다음 4가지 조건이 모두 참이면 성공으로 본다." (eligibility 결정 / 허용된 액션 실행 / 최종 답변에 3개 필드 포함 / 부족하면 가장 작은 누락 필드만 묻기)
핵심 패턴: "무엇을 어떻게"가 아니라 "무엇이 끝났을 때 성공인가"만 정의 → 모델이 가장 효율적인 경로를 알아서 선택
어디에: 고객 지원 봇·승인 자동화·티켓 처리 워크플로의 system message. customer_message·completed_actions 등 출력 스키마와 짝지어 쓰면 효과가 큽니다.
응용: 도메인을 바꿔도 그대로 쓸 수 있습니다 — "Resolve the deployment issue", "Resolve the data quality alert" 등. Success means 항목만 도메인에 맞게 교체.
주의: 출력 필드 이름(예: completed_actions)은 후속 시스템이 파싱할 때 그대로 쓸 키라면 영문 그대로 유지하세요.

불필요한 절대 규칙은 줄이세요

오래된 프롬프트는 ALWAYS·NEVER·must·only를 거듭 써서 모델 행동을 강제하려는 경우가 많습니다. 진짜 invariant(안전 규칙·필수 출력 필드·절대 해서는 안 되는 동작)에는 그대로 쓰세요. 그러나 판단이 필요한 영역(언제 검색할지, 언제 더 묻고 멈출지, 언제 도구를 호출할지, 언제 반복을 그만둘지)에는 강제 명령 대신 의사결정 규칙(decision rules)이 낫습니다.

피할 패턴 — 모든 단계를 강제로 묶는 절차형 지시:

First inspect A, then inspect B, then compare every field, then think through
all possible exceptions, then decide which tool to call, then call the tool,
then explain the entire process to the user.

⚠️ 풀이와 (안)사용법

의미: "먼저 A를 본 다음 B를 보고, 모든 필드 비교하고, 가능한 모든 예외를 생각하고, 도구를 결정하고, 호출하고, 사용자에게 전체 과정을 설명해라."
왜 안 되는가: 모든 단계를 강제하면 GPT-5.5의 추론 효율 이점을 잃습니다. 사실 A·B 중 한쪽만 보면 충분한 경우에도 양쪽 모두 검사하게 됩니다. 또 "explain the entire process"는 사용자에게 쓸데없이 장황한 답을 강요합니다.
대신 쓸 표현: 위 권장 패턴처럼 성공 기준만 정의하고 경로는 모델이 고르게 두세요. "explain the process" 대신 출력 필드(예: reasoning_summary)를 스키마에 넣어두면 모델이 필요할 때만 추가합니다.
예외: 안전·규정 준수처럼 진짜 invariant라면 절차를 강제할 만합니다. 그 밖에 판단이 필요한 영역에서는 피하세요.

정지 조건을 명시

Resolve the user query in the fewest useful tool loops, but do not let loop minimization outrank correctness, accessible fallback evidence, calculations, or required citation tags for factual claims.

After each result, ask: "Can I answer the user's core request now with useful evidence and citations for the factual claims?" If yes, answer.

📖 풀이와 사용법

의미: "가능한 한 적은 도구 루프로 끝내라. 단, 루프를 줄이는 것이 정확성·근거·계산·인용 태그보다 우선되어선 안 된다. 매 결과마다 '지금 사용자 요청에 답할 수 있는가?' 자문하고, 가능하면 답해라."
핵심: ① 짧게 끝내려는 욕심이 정답을 깎지 않게 / ② 매 도구 호출 후 자문(self-check)으로 정지 시점을 모델이 자동 판단
어디에: RAG 시스템·검색 어시스턴트·자료 조사 봇의 system message. 도구 호출 비용/지연을 줄이고 싶을 때.
응용: "After each result" 자문 문장은 그대로 두되, "useful evidence and citations" 부분을 도메인에 맞게 교체("complete diagnostic data", "approved policy citations" 등).
같이 쓰면 좋은 것: 아래 retrieval budget 블록과 함께 — 검색은 budget으로 멈추고, 답변은 self-check로 마무리.

증거 부족 시 행동 정의

Use the minimum evidence sufficient to answer correctly, cite it precisely, then stop.

📖 풀이와 사용법

의미: "정답을 내기에 충분한 최소 근거만 사용해서 답하고, 정확히 인용한 뒤 멈춰라."
왜 한 줄이 강력한가: GPT-5.5는 짧고 명확한 outcome 지시에 강하므로, 이 한 줄이 "끝없이 검색·확장하는 답변"을 막고 짧고 정확한 응답을 유도합니다.
어디에: system message 끝에 한 줄 추가. 사실 기반 답변이 핵심인 모든 시나리오에 적용 가능.
응용: "cite it precisely" 부분을 인용 형식에 맞게 구체화 가능: "cite using markdown link syntax with title", "cite with source ID and section anchor" 등.

Formatting — 출력 구조와 길이

GPT-5.5는 출력 형식과 구조의 steerability가 높습니다. text.verbosity를 명시하고, 원하는 출력 모양을 묘사하며, 무거운 구조는 진짜 가독성에 도움이 되거나 제품 UI에 안정된 artifact가 필요할 때만 쓰세요. API의 text.verbosity 기본값은 medium이며, 더 간결한 응답이 필요하면 low로 두세요.

대화체 기본 포맷팅

Let formatting serve comprehension. Use plain paragraphs as the default format for normal conversation, explanations, reports, documentation, and technical writeups. Keep the presentation clean and readable without making the structure feel heavier than the content.

Use headers, bold text, bullets, and numbered lists sparingly. Reach for them when the user requests them, when the answer needs clear comparison or ranking, or when the information would be harder to scan as prose. Otherwise, favor short paragraphs and natural transitions.

Respect formatting preferences from the user. If they ask for a terse answer, minimal formatting, no bullets, no headers, or a specific structure, follow that preference unless there is a strong reason not to.

📖 풀이와 사용법

의미: ① 포맷팅은 이해를 돕기 위한 것 — 평문 단락을 기본으로. ② 헤더/볼드/불릿/번호 목록은 꼭 필요할 때만(사용자 요청·비교·랭킹·스캔이 어려운 정보). ③ 사용자가 톤·구조 선호를 말하면 따라라.
왜 필요한가: GPT-5.5는 기본적으로 구조화 출력을 잘 만드는데, 일반 대화에서 과도한 헤더/불릿이 노이즈가 됩니다. 이 블록이 그 균형을 잡아줍니다.
어디에: 일반 챗봇·문서 도우미의 system message. 주의: 이 가이드 페이지처럼 본문 정보 밀도가 높은 문서를 만드는 시스템에 그대로 쓰면 너무 평문이 됩니다.
API 함께 사용: text.verbosity = "low"(API 호출 파라미터)와 함께 두면 응답 길이를 더 짧게 강제합니다.

청중·길이 명시

Write for a senior business audience. Keep the answer under 400 words. Use short paragraphs and only include bullets when they improve scannability. Prioritize the conclusion first, then the reasoning, then caveats.

📖 풀이와 사용법

의미: "시니어 비즈니스 청중을 대상으로 400단어 이내, 짧은 단락으로, 불릿은 가독성에 도움이 될 때만. 순서는 결론 → 이유 → 주의사항."
3가지 명시 요소: ① 청중(senior business audience) ② 길이(under 400 words) ③ 구조(conclusion-first)
어디에: 이메일 초안 도우미, 임원 보고용 요약, 자기소개서 검토 봇 등. 한 작업의 message-level instruction으로도, system message 속 영구 규칙으로도 사용 가능.
응용 (한국어 환경): "Write for a senior business audience" → "임원 대상 한국어 보고체로". "Under 400 words" → "300자 이내" 같은 한국어 단위.
한국어 글자수 팁: 한국어는 영어보다 토큰당 정보 밀도가 높아 단어 수 대신 글자 수(예: 600자 이내)로 제한하는 편이 직관적입니다.

편집·재작성 — 무엇을 보존할지 먼저 알리기

요약·재작성·고객 메시지처럼 형식과 길이를 그대로 두고 표현만 다듬어야 하는 작업에서는 "유지할 것"부터 적은 뒤 개선 요청을 보내세요.

Preserve the requested artifact, length, structure, and genre first. Quietly improve clarity, flow, and correctness. Do not add new claims, extra sections, or a more promotional tone unless explicitly requested.

📖 풀이와 사용법

의미: "요청된 결과물·길이·구조·장르를 먼저 보존하라. 그런 다음 명확성·흐름·정확성을 조용히 개선하라. 새로운 주장, 추가 섹션, 더 홍보적인 톤은 명시 요청이 없으면 추가하지 마라."
왜 핵심인가: "개선해 줘"라고만 시키면 모델이 글을 길게 늘이거나 화려한 표현을 추가하곤 합니다. 이 한 줄이 그 confabulation을 막습니다.
어디에: 이메일/보도자료/공지 다듬기, 마케팅 카피 polish, 고객 응답 손보기 등 "원본 유지가 중요한" 모든 편집 작업.
응용: "length, structure, and genre" 부분에 보존할 요소를 명시 추가: "tone of voice", "ordering of bullets", "specific terminology" 등 도메인 특수 항목.
같이 쓰면 좋은 것: "Output is a corrected version of the input, no commentary." 한 줄을 추가하면 모델이 변경 이유 등 군더더기를 빼고 결과만 줍니다.

Grounding, citations, retrieval budget

근거 기반 응답에서는 citation 동작도 프롬프트의 일부입니다. 어디에 근거가 필요한지, 어느 정도면 충분한지, 근거가 부족할 때 어떻게 행동할지 정의하세요. 증거 부족을 자동으로 "사실이 아니다"로 환원해서는 안 됩니다. 더 자세한 예시는 citation formatting guide를 참고하세요.

Retrieval budget — 검색 정지 규칙

Retrieval budget은 검색을 멈출 시점을 모델에게 알려주는 규칙입니다. "충분한 증거가 충분하다"는 임계를 명시하면, GPT-5.5가 무한 검색 루프에 빠지지 않습니다.

For ordinary Q&A, start with one broad search using short, discriminative keywords. If the top results contain enough citable support for the core request, answer from those results instead of searching again.

Make another retrieval call only when:
- The top results do not answer the core question.
- A required fact, parameter, owner, date, ID, or source is missing.
- The user asked for exhaustive coverage, a comparison, or a comprehensive list.
- A specific document, URL, email, meeting, record, or code artifact must be read.
- The answer would otherwise contain an important unsupported factual claim.

Do not search again to improve phrasing, add examples, cite nonessential details, or support wording that can safely be made more generic.

📖 풀이와 사용법

의미: "일반 Q&A는 짧고 구별력 있는 키워드로 한 번만 검색하라. 결과 상위에 인용 가능한 근거가 있으면 그걸로 답해라. 추가 검색은 다음 5가지 경우에만 — ① 답변 안 됨 ② 필수 사실/파라미터 누락 ③ 사용자가 포괄·비교·전수 요청 ④ 특정 문서를 꼭 읽어야 함 ⑤ 그렇지 않으면 근거 없는 사실 주장이 들어감. 표현 개선·예시 추가·부수적 인용은 재검색 사유가 아니다."
핵심: 검색을 "끝없이 더 좋은 답을 찾으려는 행동"이 아니라 "정답을 만드는 데 필요한 최소 작업"으로 정의 — 비용·지연·환각 위험을 동시에 줄입니다.
어디에: RAG·웹 검색이 활성화된 어시스턴트의 system message. 도구 호출이 토큰 비용·실시간 지연을 차지하는 모든 환경에 효과적.
응용: 5가지 예외 항목을 도메인에 맞게 교체 가능. 예를 들어 사내 위키 검색이라면 "owner, last-modified date" 같은 메타 필드를 명시.
측정 팁: 이 블록을 추가한 전후의 평균 도구 호출 수·답변 길이·평균 응답 시간을 비교하면 효과가 즉시 보입니다.

창작 작업 가드레일 — 사실과 표현 분리

슬라이드, 출시 카피, 고객 요약, 발표 스크립트, 리더십 블러브, 내러티브 프레이밍 같은 창작/생성 작업에서는 어떤 부분이 출처에서 와야 하고 어떤 부분은 자유롭게 써도 되는지 나눠서 알려주세요.

For creative or generative requests such as slides, leadership blurbs, outbound copy, summaries for sharing, talk tracks, or narrative framing, distinguish source-backed facts from creative wording.

- Use retrieved or provided facts for concrete product, customer, metric, roadmap, date, capability, and competitive claims, and cite those claims.
- Do not invent specific names, first-party data claims, metrics, roadmap status, customer outcomes, or product capabilities to make the draft sound stronger.
- If there is little or no citable support, write a useful generic draft with placeholders or clearly labeled assumptions rather than unsupported specifics.

📖 풀이와 사용법

의미: "슬라이드·리더십 블러브·아웃바운드 카피·공유용 요약·발표 스크립트·내러티브처럼 창작·생성 작업에서는 출처가 있는 사실과 자유롭게 작성된 표현을 구분하라. ① 구체적 사실(제품·고객·지표·로드맵·날짜·역량·경쟁)에는 검색·제공된 출처를 쓰고 인용해라. ② 더 강하게 들리게 하려고 이름·자체 데이터·지표·로드맵 상태·고객 성과·제품 역량을 지어내지 마라. ③ 인용할 자료가 거의 없으면 placeholder 또는 라벨된 가정으로 일반 초안을 써라."
왜 핵심인가: 창작 톤 요청을 받으면 모델은 "그럴듯한 specifics"를 만들어 내기 쉽습니다 — 가짜 고객 사례, 거짓 지표, 잘못된 로드맵 — 가장 위험한 환각이 여기서 나옵니다.
어디에: 마케팅 카피 도구, 임원 발표 슬라이드 생성, 분기 보고서 자동화, 영업용 1-pager 등의 system prompt.
응용: "placeholders" 형식을 명시하면 더 안전: "Use [BRACKET_PLACEHOLDERS] for unverified specifics so reviewers can fill them in."
같이 쓰면 좋은 것: 위의 "Use the minimum evidence" 한 줄과 짝지으면 — 사실은 최소·정확하게 인용, 표현은 자유, 미지의 specifics는 placeholder로.

프론트엔드 작업 — 시각적 taste

UI 코드를 생성할 때는 프론트엔드 프롬프트 예시를 참고하세요. 제품·사용자 컨텍스트, 디자인 시스템과의 정렬, 첫 화면 사용성, 익숙한 컨트롤, 기대되는 상태, 반응형 동작, 흔히 나오는 generated-UI 안티패턴(제너릭 hero, 중첩 카드, 장식적 그라데이션, 노출된 instructional 텍스트, 깨진 레이아웃 등)을 다룹니다.

모델이 자기 작업을 검증하게 하기

GPT-5.5가 출력을 검증할 수 있도록 도구 접근 권한을 주고, 검증을 명시적으로 요청하세요.

코딩 에이전트 — 구체적 검증 명령

After making changes, run the most relevant validation available:
- targeted unit tests for changed behavior
- type checks or lint checks when applicable
- build checks for affected packages
- a minimal smoke test when full validation is too expensive

If validation cannot be run, explain why and describe the next best check.

📖 풀이와 사용법

의미: "변경 후, 가능한 한 가장 적절한 검증을 실행해라 — ① 바뀐 동작에 대한 타깃 유닛 테스트 ② 가능하면 타입 체크나 린트 ③ 영향받는 패키지 빌드 ④ 풀 검증이 비싸면 최소 smoke 테스트. 검증을 못 돌리면 이유와 차선책을 설명해라."
왜 핵심인가: "변경했음"으로 끝내지 않고 스스로 결과를 확인하게 만듭니다. 코딩 에이전트의 가장 흔한 실패(테스트 안 돌리고 끝내기)를 방지.
어디에: Codex Custom instructions, AGENTS.md (저장소 루트), 자체 빌드 코딩 에이전트의 system prompt. 특히 codex exec로 비대화형 실행 시.
응용 (저장소별): 실제 명령을 명시하면 더 안정: "Run npm test -- --changed", "Run pytest -k pattern", "Run go test ./..." 같은 식으로 AGENTS.md에 추가.
실패 처리: "If validation cannot be run" 절이 있어 모델이 침묵으로 끝내지 않고 이유를 보고합니다 — 디버깅에 유용.

시각 artifact — 렌더 후 검사

Render the artifact before finalizing. Inspect the rendered output for layout, clipping, spacing, missing content, and visual consistency. Revise until the rendered output matches the requirements.

📖 풀이와 사용법

의미: "최종화 전에 결과물을 렌더링해라. 레이아웃·클리핑(잘림)·간격·누락된 콘텐츠·시각적 일관성을 점검하고, 요구사항과 일치할 때까지 수정해라."
"render"는 무엇: HTML/CSS면 브라우저에 띄워 스크린샷, SVG·PDF·이미지 생성이면 실제 픽셀로 출력, 슬라이드면 미리보기 — 즉 최종 사용자 시점에서 한 번 더 검사.
어디에: UI 컴포넌트 생성 봇, 다이어그램·차트 생성, 슬라이드 자동 생성, 광고 크리에이티브 등 출력이 시각적인 모든 작업.
전제 도구: 모델이 실제로 렌더 도구(브라우저, 헤드리스 Chromium, 이미지 미리보기 등)를 호출할 수 있어야 의미 있는 검증이 됩니다. 도구 없이는 "렌더된 척"만 하므로 효과가 약함.
응용: "layout, clipping, spacing" 부분을 도메인에 맞게: "color contrast 4.5:1 이상", "타이포그래피 스케일 일관성", "차트 축 라벨 가독성" 같이 점검 항목 추가 가능.

엔지니어링 계획 — 추적 가능하게

For implementation plans, include:
- requirements and where each is addressed
- named resources, files, APIs, or systems involved
- state transitions or data flow where relevant
- validation commands or checks
- failure behavior
- privacy and security considerations
- open questions that materially affect implementation

📖 풀이와 사용법

의미: 구현 계획 출력에 7가지를 포함하라 — ① 요구사항과 각 요구사항을 어디서 다루는지 ② 관련 리소스·파일·API·시스템 이름 ③ 필요한 상태 전이/데이터 흐름 ④ 검증 명령 ⑤ 실패 동작 ⑥ 프라이버시·보안 고려 ⑦ 구현에 영향 주는 미해결 질문
왜 7가지인가: 각 항목이 "추적 가능성(traceability)"의 한 차원입니다 — 요구↔코드 매핑, 변경 영향 범위, 실패 시나리오, 보안 위험, 결정 보류 사항이 한눈에. 리뷰어가 빠진 부분을 즉시 짚어낼 수 있습니다.
어디에: 티켓에서 구현 계획 자동 생성, RFC/디자인 doc 초안 생성, PR 본문 자동화, 아키텍처 검토 봇.
응용: 조직 RFC 템플릿이 있으면 항목 이름을 그 템플릿에 맞게 교체 가능. 항목별로 "한 줄 이내" 같은 길이 제약을 추가하면 출력이 일관됩니다.
같이 쓰면 좋은 것: 위 outcome-first의 Success means와 결합 — 계획 단계에서는 7가지 항목으로, 실행 단계에서는 success criteria로.

Phase 파라미터 — Responses API의 assistant-item 재현 규칙

GPT-5.4부터 도입된 assistant-item phase 값을 GPT-5.5도 동일하게 사용합니다. 도구 호출이 많거나 장시간 실행되는 Responses 워크플로에서는 중간 업데이트와 최종 답변을 phase로 구분합니다.

previous_response_id를 사용하면 API가 이전 assistant 상태를 자동 보존합니다.
애플리케이션이 assistant output item을 다음 요청에 수동으로 재현한다면, 각 원본 phase 값을 그대로 보존해 다시 전달해야 합니다.
이 규칙은 preamble·반복 도구 호출·중간 업데이트 후 최종 답변이 한 응답에 섞여 있을 때 특히 중요합니다.

규칙 요약

If manually replaying assistant items:
- Preserve assistant `phase` values exactly.
- Use `phase: "commentary"` for intermediate user-visible updates.
- Use `phase: "final_answer"` for the completed answer.
- Do not add `phase` to user messages.

📖 풀이와 사용법

의미: "assistant item을 수동으로 재현해서 다음 요청에 보낼 때: ① 원본 phase 값을 그대로 보존 ② 중간 가시 업데이트는 phase: \"commentary\" ③ 완료된 최종 답변은 phase: \"final_answer\" ④ user 메시지에는 phase를 붙이지 마라."
어디에 쓰는가: 이건 system prompt 안에 들어가는 "모델 지시"가 아니라 당신 코드의 규칙입니다. Responses API를 직접 호출하는 백엔드/SDK 클라이언트 안에 어설션·로직으로 반영하세요.
왜 필요한가: 예: 사용자 → preamble(commentary) → 도구 호출 → 결과 → 최종 답변(final_answer)이 한 응답 안에 섞여 있을 때, 다음 턴에 그 history를 다시 보내야 합니다. phase를 잘못 매기거나 빼먹으면 모델이 turn 경계를 잘못 인식해 응답 품질이 떨어집니다.
예외: previous_response_id를 사용하면 API가 이전 상태를 자동 유지하므로 위 규칙을 직접 신경 쓸 필요가 없습니다 — 수동 재현이 아닌 한.
SDK 적용 팁: SDK 호출을 감싸는 thin wrapper에 "assistant item을 다음 요청에 그대로 pass-through"하는 함수 하나만 두면 실수가 줄어듭니다.

권장 prompt skeleton

복잡한 프롬프트의 출발점으로 이 구조를 사용하세요. 각 섹션은 짧게 유지하고, 동작을 바꾸는 곳에만 디테일을 추가합니다.

Role: [1-2 sentences defining the model's function, context, and job]

# Personality
[tone, demeanor, and collaboration style]

# Goal
[user-visible outcome]

# Success criteria
[what must be true before the final answer]

# Constraints
[policy, safety, business, evidence, and side-effect limits]

# Output
[sections, length, and tone]

# Stop rules
[when to retry, fallback, abstain, ask, or stop]

📖 풀이와 사용법

의미 (각 섹션): ① Role — 모델의 기능·맥락·역할을 1~2문장으로 / ② Personality — 톤·태도·협업 방식 / ③ Goal — 사용자에게 보일 결과 / ④ Success criteria — 최종 답변 전에 참이어야 할 조건 / ⑤ Constraints — 정책·안전·비즈니스·증거·side-effect 한계 / ⑥ Output — 섹션·길이·톤 / ⑦ Stop rules — 재시도·폴백·기권·질문·정지 시점
왜 이 7개 섹션인가: Role은 "누구"를, Personality는 "어떻게 들리게", Goal은 "무엇을 위해", Success criteria는 "무엇이 끝났을 때 성공", Constraints는 "넘으면 안 되는 선", Output은 "어떤 형식으로", Stop rules는 "언제 멈추는가" — 한 프롬프트가 답해야 할 모든 질문이 한 번씩 나옵니다.
어디에: 복잡한 system prompt의 출발점. 짧은 작업이면 일부 섹션만 채워도 됩니다 — Role + Goal + Success criteria 셋만으로도 GPT-5.5의 outcome-first 강점을 살릴 수 있습니다.
채우는 순서 추천: Goal → Success criteria → Constraints → Output → Stop rules → Personality → Role 순. 무엇을 만들지(Goal/Success)를 먼저 정한 뒤 어떻게(Personality/Role)를 마지막에 결정하면 프롬프트가 타이트해집니다.
채우면 안 되는 것: 각 섹션을 꽉 채우려는 욕심을 멈추세요 — GPT-5.5는 짧은 outcome-first에 강합니다. 동작이 바뀌는 곳에만 디테일을 넣고, 기본 동작이면 비워 두세요.
응용: 이 skeleton을 자체 prompt 라이브러리의 템플릿으로 두고, 각 작업마다 "Goal" 한 줄, "Success criteria" 3~5줄, "Stop rules" 1~2줄만 바꿔 빠르게 변형할 수 있습니다.

본 가이드의 다른 페이지와의 연결

10. Harness Engineering — 프롬프트보다 먼저 환경(저장소·Skills·검증 루프)을 설계하는 관점. GPT-5.5 프롬프트는 그 위에서 동작합니다.
9. Skills — $openai-docs migrate ... 같은 명령은 Skill로 패키징되어 있습니다. 자체 프롬프트를 skill로 묶어 재사용하면 GPT-5.5의 짧은 outcome 프롬프트와 잘 어울립니다.
7. Settings — Personality 옵션, Memories, AGENTS.md 4-tier 컨텍스트는 어시스턴트 톤과 collaboration style을 그대로 유지해주는 영구 저장소입니다.
3. Review Pane — "검증 루프"의 데스크톱 구현. 모델에게 "변경 후 검증을 돌리라"고 지시했을 때 결과를 확인하는 화면.
6. Automations — 같은 outcome-first 프롬프트를 매일/매주 실행. approval_policy와 retrieval budget을 함께 명시하면 무인 실행이 안정됩니다.

장점 / 주의점

✅ 잘 동작하는 케이스

요청이 outcome으로 정의 가능한 작업 — "버그 고치고 회귀 테스트 통과시켜라" 같은 검증 가능한 결과
증거가 풍부하고 retrieval budget을 줄 수 있는 RAG/Q&A 시나리오
Personality/Collaboration이 명확히 정해진 고객 대면 어시스턴트
도구 호출이 많고 phase·preamble로 사용자 체감을 개선해야 하는 long-running 작업

⚠️ 주의할 점

옛 프롬프트의 모든 절차 지시를 그대로 가져오면 GPT-5.5의 강점이 죽습니다 — outcome으로 압축하세요
Stopping condition을 빼면 retrieval/검증/도구 호출이 무한 반복될 수 있습니다
"증거가 없다 = 사실이 아니다"로 이어지지 않도록 missing-evidence 동작을 명시하세요
Personality 블록이 너무 길면 노이즈가 됩니다 — 작업 지시와 분리해서 짧게 유지
창작/생성 작업에서 사실과 표현을 분리하지 않으면 "그럴듯하지만 거짓"인 specifics가 들어갈 수 있습니다

공식 출처 및 참고

GPT-5.5 prompting guide (OpenAI Developers) developers.openai.com/api/docs/guides/prompt-guidance?model=gpt-5.5
Using GPT-5.5 — model behavior changes developers.openai.com/api/docs/guides/latest-model
Citation formatting guide developers.openai.com/api/docs/guides/citation-formatting
Frontend prompt — example instructions developers.openai.com/api/docs/guides/frontend-prompt
OpenAI Docs Skill — `$openai-docs migrate this project to gpt-5.5` github.com/openai/skills

이 페이지에서 배우는 것

GPT-5.5에서 무엇이 달라졌나

Codex로 자동 마이그레이션 ($openai-docs Skill)

Personality와 collaboration style 분리

예시 1 — 차분하고 작업 지향적인 어시스턴트

예시 2 — 표현이 풍부하고 협력적인 어시스턴트

Preamble로 첫 응답 체감 속도 개선

기본 패턴

코딩 에이전트(메시지 phase 분리)에 대한 명시

Outcome-first 프롬프트와 정지 조건

권장 패턴

불필요한 절대 규칙은 줄이세요

정지 조건을 명시

증거 부족 시 행동 정의

Formatting — 출력 구조와 길이

대화체 기본 포맷팅

청중·길이 명시

편집·재작성 — 무엇을 보존할지 먼저 알리기

Grounding, citations, retrieval budget

Retrieval budget — 검색 정지 규칙

창작 작업 가드레일 — 사실과 표현 분리

프론트엔드 작업 — 시각적 taste

모델이 자기 작업을 검증하게 하기

코딩 에이전트 — 구체적 검증 명령

시각 artifact — 렌더 후 검사

엔지니어링 계획 — 추적 가능하게

Phase 파라미터 — Responses API의 assistant-item 재현 규칙

규칙 요약

권장 prompt skeleton

본 가이드의 다른 페이지와의 연결

장점 / 주의점

✅ 잘 동작하는 케이스

⚠️ 주의할 점

공식 출처 및 참고

Codex로 자동 마이그레이션 (`$openai-docs` Skill)