오픈AI가 역대 가장 진보한 추론 모델인 'o3'와 'o4-미니'를 출시했습니다. 이 모델들은 강화 학습을 통해 도구를 사용하는 방법뿐만 아니라 언제 사용해야 하는지 추론하는 능력까지 갖추었습니다. 웹 브라우징, 파이썬 코드 실행, 이미지 처리 등 챗GPT의 도구를 활용해 응답을 생성할 수 있으며, 이미지로 사고할 수 있는 최초의 모델로 소개되었습니다. 기존 모델보다 성능이 향상되었을 뿐만 아니라 속도와 비용 효율성까지 개선되어 더 스마트하고 저렴한 사용이 가능해졌습니다.
오픈AI의 새로운 추론 모델 출시
오픈AI가 지금까지 등장한 모델 중 가장 지능적인 'o3'와 'o4-미니(mini)'를 출시했습니다. 기존 모델과는 달리, 추론 과정에 도구를 사용할 수 있도록 훈련해 성능을 향상함과 동시에 속도와 비용 효율까지 높였다는 것을 특징으로 꼽았습니다.
오픈AI는 2025년 4월 16일(현지시간) 추론 모델 o3와 o4-미니를 공개하고, 이날부터 챗GPT 플러스와 팀, 프로 등 유료 구독자에게 제공한다고 발표했습니다.
o3는 역대 가장 진보한 추론 모델이라고 소개되었으며, 수학과 코딩, 추론, 과학 및 시각적 이해 능력을 측정하는 테스트에서 기존 모델보다 우수한 성능을 발휘합니다. 또한 o4-미니는 개발자들이 AI 모델을 선택할 때 중요하게 생각하는 가격과 속도, 성능을 균형 있게 제공한다고 전했습니다.
도구 활용 능력의 혁신
이번 모델들의 가장 돋보이는 점은 두 모델 모두 강화 학습(RL)을 통해 도구를 사용하도록 훈련했다는 점입니다. 따라서 도구를 사용하는 방법뿐만 아니라, 도구를 언제 사용해야 하는지 추론하는 능력도 가르쳤다는 것이 특징입니다.
이 때문에 이전 추론 모델과 달리 o3와 o4-미니는 웹 브라우징과 파이썬 코드 실행, 이미지 처리, 이미지 생성 등 챗GPT의 도구를 사용해 응답을 생성할 수 있습니다.
오픈AI는 두 모델이 단순히 이미지를 보고 이해하는 것을 넘어, 최초로 '이미지로 사고할 수 있는 모델'이라고 설명했는데, 이 과정에서도 도구 사용이 중요한 역할을 합니다. 이미지가 흐릿하거나 반전됐더라도 모델은 추론으로 도구를 선택하고 이미지를 조작해 이를 해석할 수 있습니다.
에이전트를 위한 도구 사용에도 적합합니다. 챗GPT의 모든 도구를 사용할 수 있을 뿐만 아니라 API에서 함수 호출을 통해 사용자 지정 도구도 사용할 수 있습니다.
성능과 효율성의 향상
모델 개발에는 강화 학습(RL)을 적용했습니다. 특히, 반복된 RL을 통해 추론 성능 향상과 동시에 컴퓨팅과 추론 시간 모두에서 상당한 발전을 이뤘다고 전했습니다. 모델이 더 많이 생각할수록 성능이 향상되는 것은 물론, o1과 동일한 지연 시간과 비용으로 o3는 더 높은 성능을 제공합니다.
이를 통해 기존에는 몇 분까지 걸리던 추론 시간도 1분 이내에 완료한다고 밝혔습니다. 이는 추론 성능이 발전함에 따라 질문의 취지를 정확하게 이해, 문제 해결에 필수적인 부분은 집중적이고 반복적인 검색이나 파이썬 코드 작성, 도구 호출 등의 새로운 기능을 활용하기 때문입니다.
즉, 기존보다 유연하고 전략적인 접근 방식과 멀티모달 능력, 도구 사용 등으로 추론을 더 효율적으로 만든다는 설명입니다. 이로 인해 효율이 훨씬 뛰어나기 때문에 더 스마트하고 저렴한 사용이 가능해졌다고 강조했습니다.
벤치마크 성능과 가격
벤치마크에서는 역대 최고 점수를 기록했습니다.
o3는 코딩 능력을 측정하는 SWE-벤치에서 69.1%를, o4-미니는 68.1%를 기록했습니다. 이는 기존 o3-미니의 49.3%를 크게 앞지르는 수치입니다. 또한 기존 최고였던 앤트로픽의 '클로드 37 소네트'의 62.3%도 넘어섰습니다.
특이한 것은 두 모델 모두 도구를 사용하는 경우와 그렇지 않을 경우 성능 차가 꽤 난다는 점입니다. 예를 들어 o3는 '인류의 마지막 시험(HLE)'이라는 벤치마크에서 도구를 사용하지 않으면 20.32%, 도구를 사용하면 24.9%를 기록했습니다. 또 에이전트 기능인 '딥 리서치'에서는 26.6%까지 성능이 올라갔습니다.
API 가격도 저렴해졌습니다. o3는 입력 토큰 100만개당 10달러, 출력 토큰 100만개당 40달러입니다. o4-미니는 o3-미니와 같은 입력 1.10달러, 출력 4.40달러입니다.
기존의 주력 추론 모델인 o1은 15달러/60달러이며, 지난 2월 공개한 'o1-프로'는 무려 150달러/600달러에 달했습니다.
오픈AI는 몇 주 안에 월 200달러짜리 챗GPT 프로 구독자만을 위해 더 많은 컴퓨팅 리소스를 사용해 답변을 생성하는 'o3-프로'를 출시할 계획이라고 밝혔습니다.
오픈AI의 새로운 모델들은 기존 텍스트 추론에 시각적 추론을 융합, 문제 해결의 새로운 차원을 열었다고 평가받고 있습니다.
이번 모델 출시는 AI 기술 발전에 있어 중요한 이정표가 될 것으로 보입니다. 특히 프로그램 합성 기술이 AGI(인공일반지능) 개발의 열쇠가 될 수 있다는 전망도 있습니다. 오픈AI 'o3'의 인공일반지능(AGI) 테스트를 담당했던 유명 연구원에 따르면, o3의 핵심 기능으로 '프로그램 합성'이 중요하게 작용했습니다.
또한 AI 음성 비서 시장에서도 오픈AI와 구글 간의 경쟁이 더욱 치열해질 전망입니다. 구글은 '구글 어시스턴트'를 '제미나이'로 전면 교체하며 AI 음성 비서 시장에서의 주도권을 확보하려는 움직임을 보이고 있습니다.
한편, 샘 알트먼 CEO는 이날 X(트위터)에 새 모델을 소개하며 "천재 또는 그에 가까운 수준"이라고 설명했습니다. 또한 o3에 감탄했다는 초기 테스터들의 반응도 리포스팅했습니다.
오픈AI의 'o3'와 'o4-미니' 출시는 인공지능 기술의 새로운 장을 열었습니다. 도구를 언제, 어떻게 사용할지 스스로 추론하는 능력을 갖춘 이 모델들은 단순한 텍스트 생성을 넘어 복잡한 문제 해결과 시각적 추론까지 가능하게 했습니다. 특히 성능 향상과 함께 속도와 비용 효율성까지 개선되어 AI 활용의 문턱을 낮췄다는 점에서 큰 의미가 있습니다. 앞으로 이러한 기술이 어떻게 발전하고 우리 일상에 어떤 변화를 가져올지 주목해 보시기 바랍니다. 여러분은 이 새로운 AI 모델들을 어떤 분야에 활용해보고 싶으신가요? 댓글로 여러분의 생각을 공유해주세요!
'IT News' 카테고리의 다른 글
딥시크와 오픈AI의 충격적 유사성 - 74%가 일치하는 AI 모델의 비밀 (3) | 2025.04.21 |
---|---|
지브리 프사 열풍의 이면: AI 이미지 생성이 불러온 전력 대란과 환경 문제 (2) | 2025.04.21 |
오픈AI의 새로운 도전: 8억 사용자 기반으로 소셜미디어 시장 진출 임박 (0) | 2025.04.16 |
채용 담당자 76%가 우려하는 AI 지원서, 어떻게 활용해야 할까? (0) | 2025.04.09 |
AI 탐지기 오판 논란, "챗GPT 안 썼는데 70% 생성률?" 대학생·취준생 '억울함' 호소 (0) | 2025.04.09 |
댓글