▶ 단일 모델 대비 모든 지표에서 더 높은 평가…의학 부문은 54.5% 향상
마이크로소프트(MS)가 업무용 심층 연구 에이전트인 '리서처'에 여러 인공지능(AI) 모델을 한꺼번에 이용할 수 있는 기능을 도입했다.
사티아 나델라 MS 최고경영자(CEO)는 30일 링크트인에 "'M365 코파일럿'에서 사용할 수 있는 새로운 멀티모델 심층연구 시스템 '크리틱'(Critique·논평)을 소개한다"며 "여러 모델을 한꺼번에 써서 최적의 답변과 보고서를 생성할 수 있다"고 말했다.
크리틱은 AI 모델 둘을 이용해 하나는 연구와 답변 생성을 담당하고, 나머지 하나는 타당성 검증과 표현력 향상, 구조 강화 등 논평을 맡는 접근 방식을 택했다.
예를 들어 오픈AI의 GPT 모델이 보고서를 작성하면, 앤트로픽의 '클로드' 모델이 그 보고서를 논평해 결과를 향상하는 방식이다.
이때 논평 모델은 정보 출처가 신뢰할 만한지, 보고서가 완성도 있게 작성됐는지, 보고서의 주장이 근거로 뒷받침되는지 등을 검토한다.
MS는 심층 연구의 정확성·완전성·객관성을 평가하는 벤치마크 'DRACO'를 통해 크리틱의 성능을 평가한 결과, 단일 모델 방식과 견줘 ▲ 분석의 폭과 깊이 ▲ 발표 품질 ▲ 사실적 정확도 ▲ 인용 품질 등 4가지 지표 모두에서 더 높은 평가를 받았다고 설명했다.
특히 의학 부문에서는 54.5% 더 높은 점수를 얻었고, 일반지식(+30%)과 기술(+28.7%) 부문에서도 단일 모델 방식보다 더 높은 점수를 기록했다.
MS는 크리틱과 달리 두 모델이 동시에 보고서를 작성하는 '카운슬'(Council·회의)도 함께 선보였다.
GPT와 클로드가 각기 보고서를 작성하면 제3의 전용 심사 모델이 두 보고서를 논평해 주요 결과를 요약하고 두 모델 간 일치하는 내용과 차이가 있는 내용을 강조해 제시하는 방식이다.
MS는 신기능을 우선 체험할 수 있는 '프런티어' 이용자에게 먼저 이들을 선보이고, 이후 적용 대상을 확대해나갈 계획이다.
MS가 이처럼 다양한 모델의 비교·협업 기능 개발에 나설 수 있었던 것은 자사의 클라우드 플랫폼 '애저'가 상당 기간 GPT와 클로드를 함께 제공하는 멀티 모델 체제를 구축해왔기 때문이다.
구글 클라우드는 제미나이를 주요 AI 모델로 쓰고 있고, 아마존웹서비스(AWS)는 클로드를 주요 모델로 쓰다가 지난달 말 GPT 모델을 추가했다.
<연합뉴스>
댓글 안에 당신의 성숙함도 담아 주세요.
'오늘의 한마디'는 기사에 대하여 자신의 생각을 말하고 남의 생각을 들으며 서로 다양한 의견을 나누는 공간입니다. 그러나 간혹 불건전한 내용을 올리시는 분들이 계셔서 건전한 인터넷문화 정착을 위해 아래와 같은 운영원칙을 적용합니다.
자체 모니터링을 통해 아래에 해당하는 내용이 포함된 댓글이 발견되면 예고없이 삭제 조치를 하겠습니다.
불건전한 댓글을 올리거나, 이름에 비속어 및 상대방의 불쾌감을 주는 단어를 사용, 유명인 또는 특정 일반인을 사칭하는 경우 이용에 대한 차단 제재를 받을 수 있습니다. 차단될 경우, 일주일간 댓글을 달수 없게 됩니다.
명예훼손, 개인정보 유출, 욕설 등 법률에 위반되는 댓글은 관계 법령에 의거 민형사상 처벌을 받을 수 있으니 이용에 주의를 부탁드립니다.
Close
x