2025. 12. 29.조회 9약 2분 읽기

OpenAI JSON-only 응답 강제를 위한 스키마 검증 및 복구 패턴

OpenAI Chat Completions API에서 JSON-only 응답을 강제하는 방법과 런타임 스키마 검증 및 재시도 패턴을 TypeScript 예제와 함께 설명합니다.

#openai#json#타입스크립트#스키마검증#api#백엔드

개요

OpenAI Chat Completions API를 사용할 때, JSON 형식의 응답을 강제하는 것은 데이터의 일관성을 유지하는 데 중요합니다. 하지만 때때로 API가 잘못된 형식의 응답을 반환할 수 있습니다. 이 글에서는 JSON-only 응답을 강제하는 방법과 런타임에서 스키마를 검증하고, 필요할 경우 응답을 복구하는 패턴을 살펴보겠습니다.

JSON-only 응답 강제하기

OpenAI API의 response_format을 json_object로 설정하여 JSON 형식의 응답을 요청할 수 있습니다. 그러나 이 설정만으로는 모든 경우에 JSON 형식의 응답을 보장할 수 없습니다. 따라서 추가적인 검증이 필요합니다.

런타임 스키마 검증

TypeScript를 사용하여 응답의 스키마를 검증하는 간단한 예제를 살펴보겠습니다. 아래는 ajv 라이브러리를 사용하여 JSON 스키마를 검증하는 코드입니다.

import Ajv from 'ajv';

const ajv = new Ajv();

const schema = {
  type: 'object',
  properties: {
    id: { type: 'string' },
    choices: { 
      type: 'array',
      items: { type: 'object', properties: { text: { type: 'string' } } }
    }
  },
  required: ['id', 'choices']
};

const validate = ajv.compile(schema);

function validateResponse(response: any) {
  const valid = validate(response);
  if (!valid) {
    console.error(validate.errors);
    throw new Error('Invalid response format');
  }
}

응답 복구 및 재시도 패턴

응답이 유효하지 않은 경우, 다음과 같은 전략을 사용할 수 있습니다:

재시도: 일정한 횟수만큼 API 호출을 재시도합니다.
기본값 사용: 응답이 유효하지 않을 경우, 미리 정의된 기본값을 사용합니다.
로깅 및 알림: 유효하지 않은 응답이 발생할 때, 이를 로깅하고 개발팀에 알립니다.

체크리스트

response_format이 json_object로 설정되었는가?
응답의 스키마를 검증하는 로직이 포함되어 있는가?
유효하지 않은 응답에 대한 처리 로직이 구현되어 있는가?

트레이드오프

성능: 스키마 검증 로직이 추가됨에 따라 약간의 성능 저하가 발생할 수 있습니다.
복잡성: 응답 처리 로직이 복잡해질 수 있으며, 코드 유지보수가 어려워질 수 있습니다.

주의사항

API 응답의 스키마가 변경될 수 있으므로, 변경 사항에 따라 검증 로직을 업데이트해야 합니다.
JSON-only 응답을 강제하더라도, 외부 API의 신뢰성에 따라 문제가 발생할 수 있습니다. 따라서 항상 예외 처리를 고려해야 합니다.

같이 읽으면 좋은 글

같은 주제이거나 태그가 겹치는 글을 연결해 탐색 흐름을 강화했습니다.

AI 전체 보기

AI2026. 5. 2.

GPU 클러스터 대신 Job 하나: Gemma 4 커스터마이징이 서버리스로 넘어가는 순간

Gemma 4 같은 대형 open model을 다루는 일은 더 이상 거대한 GPU 클러스터의 전유물이 아니다. Cloud Run Jobs와 RTX 6000 Pro 조합은 fine-tuning의 진입장벽을 낮추지만, 메모리 전략·LoRA 설정·체크포인트 운영 같은 실무 함정은 더 선명하게 드러낸다.

#Gemma 4#Cloud Run Jobs#Serverless GPU#Fine-Tuning

AI2026. 5. 2.

GPU 한 대로 끝내는 멀티모달 미세조정의 현실

Gemma 4와 serverless GPU 조합은 대형 멀티모달 모델 fine-tuning의 진입장벽을 낮춘다. Cloud Run Jobs, QLoRA, LoRA 타깃 전략, VRAM 관리까지 함께 짚으며 실전 적용 시의 기대와 함정을 균형 있게 풀어낼 글에 어울리는 메타데이터다.

#Gemma 4#Fine-Tuning#Cloud Run Jobs#Serverless GPU

AI2026. 4. 29.

Q, Slim LLM CLI를 실무에 붙이는 법: 터미널 AI 보조도구를 작게 시작해 크게 쓰기

터미널에서 바로 쓰는 slim LLM CLI는 개발자의 질문, 에러 분석, 최근 세션 컨텍스트 활용을 빠르게 묶어준다. 이 글은 최소한의 설정으로 도입하는 방법, redaction과 provider 분리, 로그 범위 조절, 흔한 보안 함정까지 실무 관점에서 정리하는 deep dive 가이드다.

#LLM#CLI#Terminal#Developer Productivity

Towards AI Enabled Total Economic Management

Y2K 버그 발견 후 IT 팀의 사무실 캠프

불러오는 중…

개요