▶ 한은 “물가지표 발표 결과 중요성 높아질 것”

오픈 AI[로이터]오오
챗GPT 개발사 오픈AI가 추론이 필요한 지식 업무와 코딩 기능을 통합한 새 AI 모델을 공개했다.
오픈AI는 최상위 AI 모델의 개선판인 'GPT-5.4'와 'GPT-5.4 프로'를 5일 선보였다.
이 모델은 이전에 영역별로 'GPT-5.2 사고(Thinking)'와 'GPT-5.3-코덱스' 등으로 나뉘어 있던 모델을 하나로 통합한 것이 특징이다.
또 이용자의 컴퓨터를 직접 조작해 여러 애플리케이션을 넘나들며 복잡한 작업을 수행할 수 있는 '컴퓨터 제어' 에이전트 기능도 자사 범용 모델 가운데 처음으로 탑재했다.
한 번에 처리할 수 있는 데이터양도 최대 100만 토큰(AI 모델의 입출력 단위)으로 늘려 AI 에이전트가 긴 안목의 계획을 수립하고 실행할 수 있도록 했다.
GPT-5.4 프로 모델은 44개 직종의 지식 업무 수행 능력을 평가하는 "GDPval' 성능지표(벤치마크)에서 82%를 기록해 70% 수준이었던 전작을 뛰어넘었다.
또 정보검색 능력을 측정하는 '브라우즈컴프' 지표에서도 89.3%로 경쟁작인 구글 제미나이3.1 프로(85.9%)나 앤트로픽 클로드 오퍼스 4.6(84%)보다 점수가 높았다.
코딩 능력을 재는 'SWE-벤치 프로 퍼블릭' 지표에서는 GPT-5.4가 57.7%를 받았는데, 이는 제미나이3.1 프로(54.2%)를 상회하는 점수다.
다만 오픈AI는 지금껏 코딩 능력 평가 기준으로 삼아왔던 'SWE-벤치 베리파이드' 지표는 공개하지 않았다. 오픈AI는 이 지표가 AI 훈련 데이터 등에 노출돼 결과가 오염됐기 때문이라고 설명했다.
'SWE-벤치 베리파이드'에서는 지금까지 클로드 오퍼스 4.6이 가장 높은 점수를 유지해오고 있었다.
이날 공개된 GPT-5.4 모델은 챗GPT 유로 가입자들에게 즉시 제공되며, 기존 모델인 'GPT-5.2 사고' 모델은 3개월간 유지된 이후 오는 6월 5일 서비스를 종료할 예정이다.
<연합뉴스>
댓글 안에 당신의 성숙함도 담아 주세요.
'오늘의 한마디'는 기사에 대하여 자신의 생각을 말하고 남의 생각을 들으며 서로 다양한 의견을 나누는 공간입니다. 그러나 간혹 불건전한 내용을 올리시는 분들이 계셔서 건전한 인터넷문화 정착을 위해 아래와 같은 운영원칙을 적용합니다.
자체 모니터링을 통해 아래에 해당하는 내용이 포함된 댓글이 발견되면 예고없이 삭제 조치를 하겠습니다.
불건전한 댓글을 올리거나, 이름에 비속어 및 상대방의 불쾌감을 주는 단어를 사용, 유명인 또는 특정 일반인을 사칭하는 경우 이용에 대한 차단 제재를 받을 수 있습니다. 차단될 경우, 일주일간 댓글을 달수 없게 됩니다.
명예훼손, 개인정보 유출, 욕설 등 법률에 위반되는 댓글은 관계 법령에 의거 민형사상 처벌을 받을 수 있으니 이용에 주의를 부탁드립니다.
Close
x