Search

LLAMA4의 등장과 AI계의 변화

llama4 두등 등장

메타(Meta)가 최신 인공지능(AI) 모델 llama4를 공개했다. llama는 Large Language Model Meta의 약자로 오픈소스로 대규모 언어 모델을 제공하고 있다. 오픈소스이다 보니 개인들이 자유롭게 커스텀하여 활용할 수 있다는 장점이 있다. GPT, Grock, Gemini 모델과는 다르게 로컬로 구성하면 별도 비용없이 AI LLM 기능을 사용할 수 있는게 강점이다.
이번에 발표한 llama4는 Scout, Maverick, Behemoth 3종의 모델이 발표되었다. 가벼운 모델부터 무거운 모델까지 3종으로 각자 환경에 맞춰 사용할 수 있다. 가장 무거운 모델의 경우 GPT 4.5, Claude 3.7, Gemini 2.0 pro 모델 보다 더 높은 성능을 보일 것으로 기대되고 있다. 성능과 기능을 보았을 때 이제 개인이 로컬 컴퓨터를 이용해서 현 상용 모델 LLM 급의 자체 AI를 가질 수 있게 된 것이다.

10시간 분량의 영상 입력과 파악

llama4의 특징으로는 10만 토큰 이상의 긴 텍스트를 처리할 수 있다는 것이 특징이다. 10만 토큰 정도면 10시간 분량의 영상을 처리하는 것과 같다. 가장 많은 자료를 한번에 처리한다고 알려진 Gemini의 경우도 2시간 분량의 영상 처리인 것을 생각해보면 매우 혁신적인 발전이라고 볼 수 있다. 단순히 긴 분량을 입력시키는 것만이 아니라 그 속에서 정확한 자료를 찾을 수 있다.
AI를 이용해 작업을 해본 사람은 알겠지만 입력 토큰의 제한이 작업의 많은 장애를 만든다. 일정 이상 프로젝트의 복잡성이 높아지면 AI가 문맥을 놓쳐버린다. 그래서 작은 단위로 쪼개서 작업하거나 여러번 반복 작업을 해야만 한다. llama4와 같이 10만 토큰의 분량을 입력할 수 있으면 필요한 내용을 모두 집어 넣어서 AI 작업을 할 수 있는 장점이 있다.

멀티모달 지원으로 더 다양한 작업 가능

llama4는 멀티모달 처리가 가능하다. GPT처럼 텍스트, 이미지, 비디오, 오디오 등과 같은 다양한 데이터 형식을 입력해 작업할 수 있다. 기존 llama 모델은 멀티모달 처리에 한계가 있어서 사용성에 제한이 있던걸 생각하면, 앞으로 llama4가 AI 판도를 바꿀 것이라 생각한다. 멀티모달 처리가 가능한 오픈소스 로컬 AI는 정말 다양한 서비스와 연동되어 활용될 수 있다.

더 유연한 스펙 사용

당연하게도 높은 성능의 AI는 높은 컴퓨팅 리소스를 요한다. AI 업체들이 서로 엔비디아의 GPU를 구입하려는 것도 높은 스펙을 갖추기 위해서다. llama4의 경우 MOE를 지원한다. MOE는 작업에 따라 필요한 만큼만 활성화하는 것이다. 이를 통해 저성능 PC에서 구동이 가능하다. GPU 1개만으로 구동이 가능하니 개인 PC에 탑재해 사용이 가능해졌다.

개인 AI 비서의 시대가 빨리 올지도?

아이언맨의 자비스와 같은 AI 비서를 개인이 소지하고 다니는 미래가 조금더 가까워진 느낌이다. 오픈소스로 공개된 llama4는 이전 버전처럼 수 많은 개인들에 의해 발전될 것이다. 늘 llama의 버전 업 이후에 다른 AI 도구들도 차차 성능을 올려왔으니 상용 AI들의 버전 업도 기대되는 바다. 최근 AI의 발전 속도가 점차 빨라져서 주마다 새로운 소식이 들려온다. llama4가 그 가속도에 탄력을 더해주길 바란다.
 | Main Page | Category |  Tags |