llama4 두등 등장

메타(Meta)가 최신 인공지능(AI) 모델 llama4를 공개했다. llama는 Large Language Model Meta의 약자로 오픈소스로 대규모 언어 모델을 제공하고 있다. 오픈소스이다 보니 개인들이 자유롭게 커스텀하여 활용할 수 있다는 장점이 있다. GPT, Grock, Gemini 모델과는 다르게 로컬로 구성하면 별도 비용없이 AI LLM 기능을 사용할 수 있는게 강점이다.
이번에 발표한 llama4는 Scout, Maverick, Behemoth 3종의 모델이 발표되었다. 가벼운 모델부터 무거운 모델까지 3종으로 각자 환경에 맞춰 사용할 수 있다. 가장 무거운 모델의 경우 GPT 4.5, Claude 3.7, Gemini 2.0 pro 모델 보다 더 높은 성능을 보일 것으로 기대되고 있다. 성능과 기능을 보았을 때 이제 개인이 로컬 컴퓨터를 이용해서 현 상용 모델 LLM 급의 자체 AI를 가질 수 있게 된 것이다.
10시간 분량의 영상 입력과 파악
llama4의 특징으로는 10만 토큰 이상의 긴 텍스트를 처리할 수 있다는 것이 특징이다. 10만 토큰 정도면 10시간 분량의 영상을 처리하는 것과 같다. 가장 많은 자료를 한번에 처리한다고 알려진 Gemini의 경우도 2시간 분량의 영상 처리인 것을 생각해보면 매우 혁신적인 발전이라고 볼 수 있다. 단순히 긴 분량을 입력시키는 것만이 아니라 그 속에서 정확한 자료를 찾을 수 있다.
AI를 이용해 작업을 해본 사람은 알겠지만 입력 토큰의 제한이 작업의 많은 장애를 만든다. 일정 이상 프로젝트의 복잡성이 높아지면 AI가 문맥을 놓쳐버린다. 그래서 작은 단위로 쪼개서 작업하거나 여러번 반복 작업을 해야만 한다. llama4와 같이 10만 토큰의 분량을 입력할 수 있으면 필요한 내용을 모두 집어 넣어서 AI 작업을 할 수 있는 장점이 있다.
멀티모달 지원으로 더 다양한 작업 가능

llama4는 멀티모달 처리가 가능하다. GPT처럼 텍스트, 이미지, 비디오, 오디오 등과 같은 다양한 데이터 형식을 입력해 작업할 수 있다. 기존 llama 모델은 멀티모달 처리에 한계가 있어서 사용성에 제한이 있던걸 생각하면, 앞으로 llama4가 AI 판도를 바꿀 것이라 생각한다. 멀티모달 처리가 가능한 오픈소스 로컬 AI는 정말 다양한 서비스와 연동되어 활용될 수 있다.
더 유연한 스펙 사용
당연하게도 높은 성능의 AI는 높은 컴퓨팅 리소스를 요한다. AI 업체들이 서로 엔비디아의 GPU를 구입하려는 것도 높은 스펙을 갖추기 위해서다. llama4의 경우 MOE를 지원한다. MOE는 작업에 따라 필요한 만큼만 활성화하는 것이다. 이를 통해 저성능 PC에서 구동이 가능하다. GPU 1개만으로 구동이 가능하니 개인 PC에 탑재해 사용이 가능해졌다.
개인 AI 비서의 시대가 빨리 올지도?
아이언맨의 자비스와 같은 AI 비서를 개인이 소지하고 다니는 미래가 조금더 가까워진 느낌이다. 오픈소스로 공개된 llama4는 이전 버전처럼 수 많은 개인들에 의해 발전될 것이다. 늘 llama의 버전 업 이후에 다른 AI 도구들도 차차 성능을 올려왔으니 상용 AI들의 버전 업도 기대되는 바다. 최근 AI의 발전 속도가 점차 빨라져서 주마다 새로운 소식이 들려온다. llama4가 그 가속도에 탄력을 더해주길 바란다.

Perplexity(AI)의 등장이 검색 시대의 끝을 이야기한다
인터넷의 발달은 검색을 오히려 더 힘들게 만들었다
인터넷이 발달하면서 역설적이게도 검색이 더 힘들어졌다. 과거 소수가 자료를 만들던 web 과도기 인터넷은 전문적인 정보들로 가득했다. 그러다 web 2.0 시대가 오면서 누구나 정보와 콘텐츠를 생산할 수 있게 되었고, 양적 성장과 반비례에 질적 하락을 불러왔다. 오류 투성이 정보들이 늘어났고 정보의 숲에 정보가 숨는 과 정보 시대가 되었다.
과다한 정보와 함께 광고도 문제가 되었다. 정보의 공유를 ‘마케팅’의 일환으로 사용함으로써 상업적 가치 아래 정보를 두게 되었다. 바이럴 마케팅의 확산은 더 최악이었다. 익명성 뒤에 숨어 광고가 아닌척 광고를 하는 마케팅 방식이 늘어난 것이다. 결과적으로 검색 엔진의 결과를 신용할 수 없게 되었다.
AI를 통한 검색은 인간에게 가장 친근한 문답이다
대안으로 제시되는 것이 AI 검색이다. 광고로 오염된 정보의 바다에서 원하는 것을 찾는 것에 질려버린 사람들은 AI의 발전에 힘입어 이를 검색 엔진으로 이용하고 있다. 최근 나오는 AI 서비스들의 성능은 놀라울 정도다. 검색 엔진에서 몇개의 페이지를 돌아다니며 모아야 하는 정보를 한번에 알려준다. 물론 그 과정에서 광고를 보지 않아도 되는 건 덤이다.
검색의 방식도 매우 친근하다. 검색 엔진은 특정 키워드를 통해 페이지를 나열하고, 우리는 결과 페이지에 직접 들어가서 맥락을 읽어내고 정보를 캐내야 한다. 반면 AI 검색은 우리에게 익숙한 문답에 가깝다. 질문하고 대답한다. 마치 선생님에게 답을 묻는 학생처럼 말이다. 우리가 해야 했던 키워드 선별과 맥락 읽기를 AI가 대신해 주는 것이다. 그저 우리는 생각 나는 대로 궁금한 것을 묻기만 하면 된다.
Perplexity는 AI 검색의 가능성을 보여준다
‘Perplexity’는 우리에게 익숙한 chat GPT처럼 텍스트로 대화가 가능한 LLM AI 모델이다. 국내에서는 쓰는 사람을 많이 못 봤는데 북미에서는 큰 인기를 끌고 있다고 한다. 특히나 아마존 CEO인 제프 베조스가 투자하며 더 유명세를 탔다. (빅 테크 기업들이 죄다 AI에 투자하는 만큼 아마존도? 라는 생각이 든다)
검색 시대의 종말 _ Perplexity
2024/09/12