▶ 뉴스·논문 등 무제한 공짜 학습
▶ 저작권 논란 갈수록 거세질 듯
네이버가 24일 공개한 ‘하이퍼클로바X’는 인공지능(AI)을 떠받치는 기술인 ‘대규모 언어모델’(LLM·Large Language Model)이다. 오픈AI의 ‘챗GPT’ 같은 생성형 AI의 성능을 좌우하는 기술이라 미래 먹거리인 AI 영토 확장 승부를 결정지을 열쇠로 불린다.
LLM은 각종 정보를 모아 공부한 뒤 맥락을 알고 적절한 답을 만들어 생성형 AI에 공급한다. 일종의 ‘AI 서버’인 셈이다. 방대한 양의 데이터를 학습한 LLM은 인간의 언어(자연어)를 깊이 있게 이해해 사람처럼 문장을 쓰거나 음악을 만드는 등 창작도 할 수 있다.
그런 생성형 AI도 ‘돈 먹는 하마’라는 한계가 있다. LLM을 구축하려면 많은 양의 데이터와 컴퓨팅 파워가 뒷받침돼야 하고, 상용화를 위한 연구개발(R&D) 과정에 천문학적 비용이 들어간다. 구글의 ‘팜2’와 마이크로소프트(MS)의 투자를 받은 오픈AI의 ‘GPT4’ 등이 사실상 점령하고 있는 배경이기도 하다. 현재 국내에서 글로벌 빅테크에 버금가는 AI 기술력을 갖춘 건 네이버가 유일하다는 평가가 많다. 네이버도 하이퍼클로바X를 비롯한 AI 분야 연구 개발을 위해 최근 3, 4년 동안 1조 원을 썼다.
네이버를 포함한 빅테크들이 공통적으로 해결해야 할 과제도 있다. 초거대 AI의 성능이 좋아질수록 공짜로 학습한 데이터의 양도 늘어나는 만큼 저작료를 둘러싼 논란이 거세다.
현행 저작권법에선 데이터 이용 목적이 이른바 공정 이용(공익)에 해당하면 허락이나 대가 없이 쓸 수 있다. 학교 교육이나 재판 등에 쓰는 경우다. AI는 여기에 해당하지 않지만 공익을 위한 신기술 개발임을 내세워 뉴스나 논문, 서적 등의 데이터를 학습에 마구잡이로 써 왔다. 네이버도 하이퍼클로바X에 뉴스와 블로그 데이터 등을 학습시켰다.
그러나 기업들이 생성형 AI로 수익화에 나선 이상 데이터를 학습하려면 허가를 받고 정당한 대가도 내야 한다는 지적이 나온다.
댓글 안에 당신의 성숙함도 담아 주세요.
'오늘의 한마디'는 기사에 대하여 자신의 생각을 말하고 남의 생각을 들으며 서로 다양한 의견을 나누는 공간입니다. 그러나 간혹 불건전한 내용을 올리시는 분들이 계셔서 건전한 인터넷문화 정착을 위해 아래와 같은 운영원칙을 적용합니다.
자체 모니터링을 통해 아래에 해당하는 내용이 포함된 댓글이 발견되면 예고없이 삭제 조치를 하겠습니다.
불건전한 댓글을 올리거나, 이름에 비속어 및 상대방의 불쾌감을 주는 단어를 사용, 유명인 또는 특정 일반인을 사칭하는 경우 이용에 대한 차단 제재를 받을 수 있습니다. 차단될 경우, 일주일간 댓글을 달수 없게 됩니다.
명예훼손, 개인정보 유출, 욕설 등 법률에 위반되는 댓글은 관계 법령에 의거 민형사상 처벌을 받을 수 있으니 이용에 주의를 부탁드립니다.
Close
x