💌XREAL 9월 첫째 주 소식 인터뷰하는 마이크로소프트 공동 창립자 Bill Gates (출처: Paul Richards/AFP via Getty Images)
“지난 1년간 AI에게서 보고 있는 것은 PC와 GUI, 인터넷만큼이나 중요한 발전이다. (What I'm seeing in AI just in the last 12 months is every bit as important as the PC, the PC with GUI, or the internet)” - Bill Gates, 2023 ¹⁾ |
|
|
자연스러운 소통, 빠른 응답 속도, 높은 퀄리티의 답변. 지난 2022년 ‘ChatGPT’는 대중을 충격의 도가니에 빠뜨렸습니다. 이전까지만 해도 사람들은 AI를 ‘흥미롭지만 아직 갈 길이 먼 기술’로 인식하고 있었습니다. 알파고-이세돌의 바둑 대결이나 심심이, 이루다 같은 사건들이 이따금 이목을 끌기도 했지만, 사람들의 기대를 충족시키기에는 부족했죠. AI와 인간처럼 대화한다는 것은 공상과학에서나 가능한 이야기처럼 여겨졌습니다. |
|
|
ChatGPT 인터페이스 (출처: OpenAI) |
|
|
사실 AI는 ChatGPT 이전에도 이미 존재해 왔습니다. 일례로 앞서 언급했던 ‘알파고’는 딥러닝 방식으로 승리 가능성이 높은 수를 예측하여 유리한 선택을 하도록 설계된 AI입니다. 애플의 ‘시리’와 같은 음성 비서는 자연어 처리(NLP) 방식으로 사용자의 문장을 해석하여 적절한 답변을 제공하는 AI이죠. 이들은 공통적으로 입력된 수치를 해석하고, ‘판별’을 내립니다. 주어진 이미지가 개인지 고양이인지, 해당 수의 승률이 높은지 낮은지, 음성이 어떤 의미를 가지는지를 확률적으로 판단합니다.
그에 반해 새롭게 등장한 생성형 AI는 대화, 이미지, 영상, 음악 등을 ‘생성’할 수 있습니다. 어떻게 이것이 가능했을까요? 사실 ChatGPT의 기반이 되는 이론은 새로운 것이 아닙니다. 다만 기존 모델에 막대한 양의 데이터를 학습시켜 거대 규모로 확장할 때, 일반화된 지능(AGI, artificial general intelligence)이 될 것이라는 가능성을 발견한 것입니다. 이는 마치 외국어로 된 책 수억 권을 통째로 암기할 수 있다면, 그 언어를 얼추 구사할 수 있게 되는 것으로 비유할 수 있겠습니다. |
|
|
생성형 AI ‘미드저니’로 만들어낸 ‘스페이스 오페라 극장’ (출처: Jason M. Allen 트위터) |
|
|
이러한 생성형 AI가 강력한 이유는 인간과 더 가까워졌기 때문입니다. 비록 실제 인간과 같은 사고 과정을 거치는 것은 아니지만, 방대한 양의 학습 데이터를 활용하여 인간다운 결과물을 도출해 냅니다. ChatGPT를 쓰다 보면 마치 실제 사람과 대화하고 있는 것 같은 착각까지 들 정도인데요, 이런 결과물을 만들어내는 생성형 AI의 범용성은 두말할 필요도 없습니다. 2022년 한 미술전에서 1등 상을 받은 작품이 사실 이미지 생성형 AI ‘미드저니’로 만든 것이었다는 일화는 이미 잘 알려져 있습니다 ⁶⁾. 또한 한 연구에서는 사람들이 블라인드 테스트에서 AI와 인간이 만든 그림을 잘 구분하지 못할 뿐만 아니라, AI가 생성한 그림을 더 선호하는 것으로 나타나기도 하였습니다 ⁷⁾. |
|
|
우리가 사과를 이해할 때 활용하는 다양한 정보들 (출처: Intel Labs) |
|
|
사람은 무언가를 이해할 때 시각, 청각, 촉각 등 여러 감각으로부터 얻는 정보를 총체적으로 고려하여 판단합니다. 사과를 예로 들면, 그 생김새뿐만 아니라 붉은색, 단단한 촉감, 씹을 때 나는 ‘아삭’ 소리와 단맛까지, 얻을 수 있는 모든 정보를 활용하는 것이죠. 이렇게 여러 종류의 정보를 받아들일 수 있는 능력을 ‘멀티 모달리티(Multi Modality)’라고 하는데요. ChatGPT-4o나 구글의 Gemini 같은 최신 생성형 AI는 이러한 인간의 멀티모달 능력까지 갖추어 비디오, 이미지, 텍스트 등 다양한 유형의 데이터를 동시에 이해하고 처리할 수 있습니다. 그리고 멀티모달 생성형 AI는 인간의 방식에 한 발 더 다가간 만큼 더 높은 활용성을 갖게 됩니다.
멀티모달 AI는 우리와 더 인간적인 소통이 가능합니다. 가령 우리가 AI에게 수학 문제를 물어볼 때 그 문제를 스무고개 하듯 글로 풀어 설명할 필요 없이, 친구에게 연락하듯 사진 한 장을 보여줌으로써 같은 결과를 얻을 수 있습니다. 더 효율적인 소통이 가능해지는 것이죠. 또한, 멀티모달 AI는 더 많은 정보를 바탕으로 더욱 맞춤화된 보조를 수행할 수도 있습니다. |
|
|
[이미지 출처] 메타
Meta가 "Puffin"이라는 코드명의 혼합 현실 안경을 2027년에 출시할 예정이라고 밝혔습니다. 메타는 최근 애플의 Vision Pro와 경쟁하기 위한 프리미엄 혼합 현실 헤드셋인 “La Jolla” 제작을 중단한 이유로써 지금은 오히려 기존 MR 기기의 무게와 크기 문제를 극복하기 위해 110g 미만의 안경형 MR 기기를 제작하고 있다고 밝힌 것입니다. 하지만 이러한 초경량 MR 기기를 제작하기 위해서는 애플 및 매직 리프와 같이 컴퓨팅 장치와 배터리를 따로 분리해야한다는 문제가 있다며 소비자들은 우려를 표하고 있습니다. 그리고 오는 9월 25~26일, 메타 커넥트 행사 때 “Puffin” 과 같은 새로운 XR 장치에 대한 자세한 정보가 나올 것이라는 분석도 있습니다.
|
|
|
[이미지 출처] 어메이즈 VR
어메이즈VR의 ‘하이퍼포커스 : 투모로우바이투게더 VR 콘서트’가 국내에서 개봉 당일 75%에 달하는 좌석 판매율과 700건이 넘는 실 관람평, 여타 영화 그 이상의 재관람율을 보이며 VR 콘서트 포맷이 공연•영화 컨텐츠 계의 떠오르는 별임을 다시 한 번 증명했습니다. 이후 LA를 비롯한 미국 5개 도시와 도쿄를 비롯한 일본 5개 도시의 영화관을 통해 해외 진출에 성공한 어메이즈VR의 VR 콘서트는 일본에서 매진을 기록하며, 적절한 전략을 통해 침체된 것만 같던 VR 시장의 활로를 열어 젖히고 있습니다.
|
|
|
[이미지 출처] 뉴스드림
최근 이탈리아의 한 연구팀에서 메타버스 경험의 보급화를 위해 생성 데이터의 안전을 보장하는 디지털 트윈이 필요하다는 연구 결과를 발표했습니다. 이는 현재 메타버스 개념이 단지 국가와 회사 등 특정 집단이 데이터를 수집하여 일방적으로 저장하는 구조인 것을 문제 삼은 것입니다. 이를 해결하기 위해 해당 연구팀은 메타버스에 업로드 될 수많은 유저들의 데이터를 본인들이 직접 제어하고 소유하여 결과적으로 개인이 수익 창출을 할 수 있는 구조를 갖추는 것을 해결방안으로 제시했습니다. 결과적으로 해당 연구팀은 디지털 트윈을 기반으로 한 유저 주도적 플랫폼 형성을 메타버스가 추구해야 할 방향성으로 제시하였습니다.
|
|
|
이번 한주의 뉴스레터는 어떠셨나요?👀
자유롭게 의견 남겨주세요! |
매주의 메타버스 뉴스가 궁금하다면?📰
아래의 링크로 구독하세요! |
|
|
TEAM New Media 📰
서창규 조민주 김수현 김정현 김수겸 신영환 신택성 양희원 전은정 강동현 김윤찬 강다연 |
|
|
|
|