+ 팔로우
진화하는 언어
닉 채터 외 1명 지음
웨일북(whalebooks) 펴냄
# 인간들의 언어 무도회에 난입한 몸치 AI
저자들은 언어가 ‘기술적 특이점’에서 우리를 구할 것이라고 한다. 나도 그 부분은 설득이 됐다. 저자들이 우려하는 우려는 ‘수직 성장’, 즉 기술 자체의 혁신으로 특이점으로 나아가는 위험이라면 ‘수직 성장의 위험’ 이라고 칭할 수 있다. 그런데 내가 걱정되는 것은 ‘수평 성장의 위험’이다. 내가 말하는 ‘수평 성장’이란, 기술이 보편화되고 많이 쓰이는 것이다. 옆으로 퍼지는 형태다. 특이점에 도달하지 않은 기술이라도 이런 전파성은 우리에게 큰 위험을 끼친다. 실제로 GPT-3는 2022년 11월 오픈배타 후 2달 만에 월 사용자 1억이라는 경이로운 숫자에 도달했다. 이것은 인스타그램이 1억 명에 도달한 속도보다 15배 빠르다. 그 후 여러 회사에서 AI를 경쟁적으로 발표하고 있고, 인터넷은 AI가 쓴 글들로 범벅이 되고 있다. 너도나도 블로그나 유부트 콘텐츠들을 AI로 자동 생성하기 시작했다. 이러한 경향은 앞으로 더 강해질 것이다.
나는 이제는 진정으로 언어가 오염되지 않을까 하는 걱정이 든다. 그 이유는 AI가 쓴 글을 다시 AI가 학습하고 그것으로 AI가 글을 쓰는 상황이 점점 많아질 것이기 때문이다. 책에도 나오듯이 “기계가 세계 정복에 착수했다”를 여러 단계로 번역했을시 “장비는 세계 지배로 설정된다”라는 어이없는 문장이 나온다. 이 현상을 인터넷에 모든 글에 투영해보자. AI가 글을 쓰고 다시 AI가 그것을 학습하는 행위가 반복된다면 정말 "두 개의 눈을 가진 발(foot)인 주인공인 1600년대 미국의 엘리자베스 1세 여왕이 통치하는 역사를 다룬" 에세이가 나올지도 모른다. 어쩌면 그것보다 더 참혹할 것이다. 왜냐하면 AI는 언어를 진정으로 이해하지 않기 때문이다. 그러니 첫 번째 AI가 글에 사소한 실수를 한다면, 두 번째 AI는 그 실수를 아무 거리낌 없이 학습하고 글을 쓸 것이다. 안타깝게도 거기에 실수들이 누적된다면, 마치 진화처럼 사소한 실수들이 쌓여 언어를 엉망으로 만들어 놓을 수 있다. GPT-3에게는 사람들이 쓴 글들은 ‘자원’이다. 그렇게 본다면 처음으로 콘텐츠 시장에 도약 중인 지금이 가장 ‘자원’이 가장 깨끗한 황금기일 것이다. 앞으로 스스로 더럽혀갈 것이기 때문이다. 마치 처음 깨끗한 물을 찾은 인간은 가장 깨끗한 물을 누리고, 더 많은 사람이 찾으면서 물은 점점 오염되고, 결국에는 발길이 뚝 끊기게 되듯 말이다.
사고실험으로 극한의 상황을 설정해보자. 지구에 사람이 다 사라졌다. 그러나 어떤 이유로 서버들에 전기는 계속 공급되고 있다. AI 들은 사람이 사라지기 전 설정해놨던 주기로 블로그에 글을 올리고 있다. 그리고 또 AI는 그 글들을 가지고 학습한다. 이렇게 백 년이 흐른다고 하자, (저자들이 말했듯 100년이 흐른다고 해도 ‘특이점’에 도달하는 일은 없을 것이다). 전 세계 AI들은 자기들끼리 인터넷에 글을 올리고 또 학습하는 행위를 수도 없이 반복했을 것이다. 그리고 그 마지막 글을 본다면 아마 아무 의미도 없이 형편없을 것이다. 한글일 경우 이런 형태일 지도 모른다. “가 거 당신 하늘 1889초 고양이했다.”
여기에 저항하는 방법은, 사람들의 손에서 나온 글이 AI보다 쓴 글의 양에 밀리지 않는 것이다. 사람들의 손을 타면 ‘제스처 게임’을 거친 언어이기 때문에, 언어의 윤곽이 잡히게 된다. 이 경쟁은 어떻게 보면 언어를 다듬는 것과 흩트려 놓는 측의 싸움이다. 사람이 쓴 글의 양이 우세하다면 AI도 현재 빙산의 숨겨진 부분을 희미하게라도 모방하여 언어의 쓰임을 계속 다듬어 나갈 것이다. 그런데 문제는 AI가 콘텐츠 생산을 도맡으며 사람은 점점 소비만 하는 역할로 밀려나고 있다는 것이다. 사람은 창조 욕구가 있으므로 완전히 밀려나지는 않을 거라고 생각한다. 그러나 만약 인터넷에 업로드되는 글의 비율이 (AI)51:49(인간)만 되더라도, 이 사소한 차이는 시간이 지날수록 엄청난 차이를 만들어 낼 것이고, 결국 인터넷에는 아래는 텅 빈 ‘빙산의 일각’만 떠다니게 될 것이다.
위처럼 인터넷의 언어가 오염된다고 가정했을 때, 이것은 당연히 인간에게 영향을 줄 것이다. 많은 사람은 이 책에서 까발린 “GPT3는 구조적으로 진정 언어를 이해할 수 없다”는 사실을 모른다. 경험적으로 GPT3가 보여주는 놀라움에 사롭잡혀 있고, 정말 언어를 이해하고 있다고 생각한다. 여기에는 AI 소식을 부풀리며 퍼나르는 매체들도 한몫할 것이다. 여하튼 이러한 현실로 인해서, 사람들은 GPT3와 언어적 춤을 추려는 시도를 계속한다. 얼마 전 원어민 친구 사귀지 말고 GPT를 통해서 영어 공부하라는 영상도 봤다. 또한 언어를 학습해야 할 어린아이들도 바쁜 부모를 대신해 GPT3와의 대화나 인터넷으로 배울 수 있다. 이렇게 된다면 오염된 언어들이 사람들에게 유입될 것이다. 오염된 언어라도 사람끼리의 ‘제스처 게임’이 누적되면 다시 형태를 잡을 수 있을 것이다. 그러나 사람들은 점점 서로 대화하기보다. 집에서 인터넷과 AI로 모든 것을 해소하는 방향으로 간다면, 바로잡을 기회도 사라질 것이다. 최대한 잦은 ‘제스처 게임’을 하는 것이 우리 언어를 지키는 방법이다.
저자들은 이것까지 생각하지 못했을 것이다. 책에서는 GPT-3의 수직적 위험, 그 자체의 특이점 가능성에 대해서만 다뤘다. 왜냐하면 그들도 인터넷 역사상 가장 사용자가 가파르게 상승한 서비스가 될지 몰랐기 때문이다. 이 책의 원서는 2022년 2월에 출간됐으며, 당시는 GPT-3가 오픈베타를 하며 일반 사용자의 눈에 띄기 9달 전이었다. 저자들은 아마 일부 기술자와 학자들이 관심을 가질 ‘클로즈 배타’에 참여해서 기능적인 위험성만 검토한 것 같다. 그리고 저자들은 언어가 파괴되고 있다는 걱정은 아주 오래전부터 있었다고 위안을 줬는데, 오래전의 걱정과 지금의 걱정을 동일선상에서 봐야 할지 모르겠다. 언어가 파괴된다는 걱정은 얼마 전까지만 해도 사람들 사이에서의 언어적 춤의 오해였을 것이다. 서로 변칙적인 춤을 잠시간 이해하지 못하거나 스텝이 순간적으로 꼬였을 뿐이었다. 그런데 지금은 인간들만의 언어 무도회에 춤을 출 줄 모르는 AI가 난입했다. 그런데 그 몸치 AI가 무도회를 장악하고 있다. 이것은 지금까지 오해해왔던 걱정과는 완전 다른 차원의 위험이다.
(2023.06.15에 쓴 독후감)
1
주닉님의 인생책은?
더 보기