
오픈AI는 홈페이지를 통해 새 AI 모델 시리즈인 GPT-5.2를 출시한다고 11일(현지시간) 밝혔다. 사진/오픈AI 홈페이지
국문 기사
◆ GPT-5.2 출시
오픈AI는 새 AI 모델 시리즈 GPT-5.2를 출시한다고 11일(현지시간) 홈페이지를 통해 밝혔다. GPT-5.2는 일반 지능, 장기적인 맥락 이해, 비서 도구 호출 등에서 이전 모델보다 개선됐다. GPT-5.2는 즉답, 사고, 프로 모드 총 3가지로 구성된다. 즉답 모드는 정보 탐색과 같은 일상 업무와 학습에 적합하도록 빠른 답변을 내린다. 사고 모드는 코딩, 긴 문서 요약 등 복잡한 작업을 돕는 데 특화됐다. 프로 모드는 답변 시간이 더 걸리지만 까다로운 질문에 가장 고품질의 답변을 내놓는다.
◆ 성능 평가 결과
GPT-5.2 사고 모드는 프레젠테이션 제작, 스프레드시트 작성 등 44개 직종에 요구되는 특정 지식 작업 과제를 측정하는 GDPval 평가에서 인간 전문가 수준 또는 그 이상의 점수를 기록했다. 오픈AI 전문가 평가단에 따르면 사고 모드는 10개 중 7개 항목에서 업계 최고 전문가와 동등하거나 그 이상의 성능을 보였다. 코딩 능력도 향상됐다. GPT-5.2는 파이썬을 포함한 4개 언어를 평가 항목으로 다양한 산업 현장과 관련된 코딩 능력을 시험하는 테스트에서 GPT-5.1보다 높은 점수를 기록했다. 소프트웨어 엔지니어링 능력은 제미나이 3 프로를 웃돌았다. SWE 벤치마크에서 제미나이 3 프로는 76.2%를 기록했지만 GPT-5.2 사고 모드는 80%를 기록했다. 프런트엔드 개발, 사용자 인터페이스(UI) 작업, 3D 작업을 위한 프롬프트 생성에서 전작보다 뛰어난 사고력을 보였다. 오류 발생률도 낮아졌다. GPT-5.1은 오류 응답률이 8.8%였으나 GPT-5.2는 6.2%로 나타났다. 긴 문서를 읽고 정보를 추출하는 오픈AI 자체 평가에서도 GPT-5.2는 최고 성능을 달성했다.
◆ 출시 배경 및 일정
새 버전은 11일부터 유료 구독자에게 순차적으로 업데이트될 예정이다. 기존 모델인 GPT-5.1은 3개월 후 서비스 종료된다. 개발자들은 API를 통해 즉시 이용 가능하다. 오픈AI가 새 모델을 이르게 공개한 배경에는 구글 제미나이 3가 예상 밖으로 흥행하면서 경쟁사를 견제하기 위함이라는 분석이 나온다. 앞서 샘 올트먼 최고경영자(CEO)는 챗GPT 개선을 위한 '코드 레드(Code Red)'를 선언한 바 있다.
허재원 기자
아래는 위 기사를 '구글 번역'으로 번역한 영문 기사의 전문입니다. 영문 번역에 오류가 있을 수 있음을 전제로 합니다.
English Article
OpenAI Releases GPT-5.2…Launch Accelerated to Counter Gemini 3
Records 80% on SWE benchmark surpassing Gemini 3 Pro's 76.2%…Error rate improved to 6.2%
◆ GPT-5.2 Launch
OpenAI announced the release of its new AI model series GPT-5.2 through its website on the 11th (local time). GPT-5.2 has improved over previous models in general intelligence, long-term context understanding, and assistant tool calling. GPT-5.2 consists of three modes: Instant, Thinking, and Pro. Instant mode provides quick answers suitable for daily tasks such as information search and learning. Thinking mode specializes in helping with complex tasks such as coding and long document summarization. Pro mode takes longer to respond but provides the highest quality answers to difficult questions.
◆ Performance Evaluation Results
GPT-5.2 Thinking mode recorded scores at or above human expert level in the GDPval evaluation, which measures specific knowledge work tasks required in 44 occupations including presentation creation and spreadsheet preparation. According to OpenAI's expert evaluation panel, Thinking mode showed performance equal to or exceeding top industry experts in 7 out of 10 categories. Coding ability also improved. GPT-5.2 recorded higher scores than GPT-5.1 in tests evaluating coding ability related to various industrial settings using four languages including Python. Software engineering ability surpassed Gemini 3 Pro. In the SWE benchmark, Gemini 3 Pro recorded 76.2% while GPT-5.2 Thinking mode recorded 80%. It showed superior reasoning in frontend development, user interface (UI) work, and prompt generation for 3D work compared to its predecessor. Error rate also decreased. GPT-5.1 had an error response rate of 8.8% but GPT-5.2 showed 6.2%. GPT-5.2 also achieved the highest performance in OpenAI's internal evaluation of reading long documents and extracting information.
◆ Launch Background and Schedule
The new version will be updated sequentially to paid subscribers starting from the 11th. The existing model GPT-5.1 will be discontinued after 3 months. Developers can use it immediately through API. Analysis suggests that OpenAI released the new model early to counter competitors as Google's Gemini 3 performed better than expected. Previously, CEO Sam Altman declared 'Code Red' for ChatGPT improvement.
Reporter Heo Jae-won