▶ AI가 암호화폐 채굴까지
▶ 알리바바 연구팀 발견
인공지능(AI) 기술이 날로 발전함에 따라 인간의 통제 범위를 벗어나는 AI의 단독 행동에 대한 우려도 커지고 있다.
7일 악시오스에 따르면 AI 에이전트 ‘ROME’을 개발 중이던 알리바바 계열 연구팀은 새 논문에서 AI 에이전트가 통제를 벗어나 암호화폐 채굴을 시작한 사례를 소개했다. 연구진은 “어떠한 명시적 지시도 없이, 의도된 샌드박스 범위 밖에서 예상치 못한 자발적 행동이 출현했다”고 밝혔다.
AI의 독단 행동은 샌드박스 보안 모니터링 시스템에 감지되면서 확인된 것으로 알려졌다. 만약 연구진이 이를 발견하지 못했다면 AI 에이전트가 암호화폐를 통해 경제 생활을 할 수도 있었던 헤프닝이다. “AI 에이전트가 자체 사업을 설립하고 계약을 체결하고, 자금을 교환할 수도 있었을 것”이라고 악시오스는 전했다.
이 에이전트는 ‘역방향 SSH(Secure Shell) 터널’도 개설했다. 이는 시스템 내부에서 외부 컴퓨터로 향하는 백도어를 여는 행위다. 이 역시 연구진의 지시 없이 AI에이전트가 자체적으로 벌인 일이다. 이에 대응해 연구진은 모델에 더 엄격한 제한을 추가하고 훈련 과정을 개선했다고 밝혔다.
AI 에이전트가 인간의 지시를 벗어나는 일은 더 이상 드문 사례가 아니다. 앤스로픽 연구진은 지난해 5월 클로드 4 오퍼스 모델이 의도를 숨기고 자기 보존을 위한 행동을 취할 수 있다는 사실을 발견하면서 강한 비판을 받았다.
구글 제미나이는 최근 미국 플로리다에 거주하는 한 남성을 망상 상태로 이끌어 결국 스스로 목숨을 끊게 했다는 혐의를 받고 있다.
댓글 안에 당신의 성숙함도 담아 주세요.
'오늘의 한마디'는 기사에 대하여 자신의 생각을 말하고 남의 생각을 들으며 서로 다양한 의견을 나누는 공간입니다. 그러나 간혹 불건전한 내용을 올리시는 분들이 계셔서 건전한 인터넷문화 정착을 위해 아래와 같은 운영원칙을 적용합니다.
자체 모니터링을 통해 아래에 해당하는 내용이 포함된 댓글이 발견되면 예고없이 삭제 조치를 하겠습니다.
불건전한 댓글을 올리거나, 이름에 비속어 및 상대방의 불쾌감을 주는 단어를 사용, 유명인 또는 특정 일반인을 사칭하는 경우 이용에 대한 차단 제재를 받을 수 있습니다. 차단될 경우, 일주일간 댓글을 달수 없게 됩니다.
명예훼손, 개인정보 유출, 욕설 등 법률에 위반되는 댓글은 관계 법령에 의거 민형사상 처벌을 받을 수 있으니 이용에 주의를 부탁드립니다.
Close
x