LLM만 AI가 아니다. 꼭 알아야 할 8가지 전문 AI 모델

ChatGPT 덕분에 'AI = 거대 언어 모델(LLM)'이라는 인식이 자리 잡았습니다. 하지만 실제 현장에서는 문제 유형에 따라 전혀 다른 구조의 모델들이 따로, 또 함께 움직입니다. 오늘날 AI 생태계를 떠받치는 8가지 전문 모델을 한 번에 정리합니다.

ChanghyukBan2026년 6월 8일15회6분 읽기

AI Trends

LLM만 AI가 아니다
꼭 알아야 할 8가지 전문 AI 모델

ATOZAI · AI Trends · 약 7분

아래 8개 모델은 단순히 이름만 비슷한 게 아니라, 해결하려는 문제와 작동 방식(아키텍처)이 근본적으로 다릅니다. 성격이 비슷한 것끼리 묶어서 살펴보면 전체 지형이 훨씬 또렷하게 보입니다.

① 언어의 깊이와 효율을 파고드는 모델 — LLM · SLM · MLM

LLM

대형 언어 모델

Large Language Model

방대한 텍스트를 학습해 인간의 언어를 이해하고 생성하는, 가장 대표적인 AI입니다. 우리가 'AI'라고 하면 떠올리는 바로 그 모델이죠.

PROCESS입력 → 토큰화 → 임베딩 → 트랜스포머 연산 → 출력

예: GPT-4, Claude

SLM

소형 언어 모델

Small Language Model

LLM의 파라미터를 줄여, 스마트폰·노트북·제조 현장 같은 제한된 환경(온디바이스)에서 가볍고 빠르게 돌아가도록 최적화한 모델입니다.

PROCESS컴팩트 토큰화 → 최적화 임베딩 → 효율적 트랜스포머 → 양자화·메모리 최적화 → 엣지 배포

예: Phi-3, Llama-3-8B

MLM

마스크드 언어 모델

Masked Language Model

문장 중간의 단어를 가려놓고(Mask), 앞뒤 문맥을 동시에 보며 가려진 단어를 맞히는 방식으로 학습합니다. 생성보다 '이해'와 임베딩 추출에 탁월합니다.

PROCESS토큰 마스킹 → 좌·우 양방향 어텐션 → 마스크된 토큰 예측

예: BERT

② 언어를 넘어 사고와 행동으로 진화하는 모델 — LCM · LAM

LCM

대형 개념 모델

Large Concept Model

메타(Meta)가 제시한 개념으로, 특정 '단어'에 종속되지 않고 그 뒤에 숨은 '개념적 의미'를 다룹니다. 문장 대 문장 번역을 넘어 사상과 맥락 자체를 처리하려는 시도입니다.

PROCESS문장 분할 → SONAR 임베딩 → 디퓨전·은닉 프로세스 → 개념 융합·양자화 → 출력

LAM

대형 행동 모델

Large Action Model

텍스트 생성에 그치지 않고, 사용자의 의도를 파악해 실제 클릭·결제·예약 등 '행동'을 수행하는 에이전트 지향 모델입니다. 요즘 화두인 'AI 에이전트'의 핵심 엔진이죠.

PROCESS의도 인식 → 작업 분해 → (메모리 연동) 행동 계획·실행 → 피드백 통합 루프

예: Rabbit R1

③ 구조적 효율을 극대화하는 모델 — MoE

MoE

전문가 혼합 모델

Mixture of Experts

하나의 거대 모델이 모든 걸 처리하는 대신, 분야별 전문가(Expert) 모델들을 두고 라우터가 문제를 가장 잘 푸는 전문가에게 배분합니다. 연산 비용은 줄이고 성능은 끌어올리는 영리한 구조입니다.

PROCESS입력 → 라우터 메커니즘 → 상위 k개 전문가 선택 → 가중치 결합 → 출력

예: GPT-4, Mixtral

④ 시각(Vision) 데이터를 정밀하게 다루는 모델 — VLM · SAM

VLM

비전-언어 모델

Vision-Language Model

이미지·영상(Vision)과 텍스트(Language)를 동시에 이해하는 멀티모달 모델입니다. 사진을 보고 설명하거나, 이미지 속 정보로 추론합니다.

PROCESS이미지·텍스트 각각 인코딩 → 투영 인터페이스로 정렬 → 멀티모달 프로세서 → 출력

예: GPT-4V, Gemini

SAM

세그먼트 애니씽 모델

Segment Anything Model

메타가 개발한 시각 처리 모델로, 사용자가 지정한 프롬프트(점·박스·텍스트)에 따라 이미지 속 사물의 경계선을 완벽하게 분할합니다.

PROCESS프롬프트·이미지 각각 인코딩 → 마스크 디코더 → 경계선 분할 출력

한눈에 보는 8개 모델 비교

모델	주 목적	핵심 메커니즘	주 사용처
LLM	범용 언어 이해·생성	거대 순차 트랜스포머	챗봇, 요약, 글쓰기
SLM	제한 자원 효율 구동	경량화·양자화, 엣지	온디바이스 AI, 스마트팩토리
MLM	문맥 이해·단어 예측	양방향 어텐션	검색, 분류, 감성 분석
LCM	언어 초월 개념 추론	디퓨전 기반 개념 융합	고도화 번역, 사상 매핑
LAM	실제 '행동' 수행	작업 분해·실행 루프	AI 에이전트, 업무 자동화
MoE	거대 모델 효율 분산	라우터 + 전문가 구조	고성능 LLM 효율화
VLM	이미지+언어 결합 이해	인코더 교차 정렬	이미지 캡셔닝, 시각 QA
SAM	객체 경계선 추출	프롬프트 결합 마스크 디코더	자율주행, 의료 영상

핵심만 다시 정리하면

언어의 깊이·효율 — LLM(대형 생성), SLM(소형·엣지), MLM(양방향 문맥)
사고와 행동으로 진화 — LCM(개념 중심), LAM(실제 행동 수행)
구조적 효율 극대화 — MoE(전문가 분산 처리)
시각 데이터 정밀 처리 — VLM(이미지+언어), SAM(경계 분할)

최근 AI 트렌드의 핵심은 이 모델들을 단독이 아니라 복합적으로 연결하는 데 있습니다. 예를 들어 VLM으로 현장을 '보고', LAM으로 행동 계획을 짜고, 이를 SLM으로 현장 디바이스에서 가볍게 돌리는 식이죠. 하나의 만능 모델이 아니라, 각자의 장기를 가진 전문가들의 오케스트라가 진짜 강력한 AI 시스템을 만듭니다.

8개 모델 중 구동 방식이나 비즈니스 적용 방안을 더 깊게 파보고 싶은 모델이 있으신가요? 다음 글에서 다뤄보겠습니다.

뉴스레터 구독

새 방법론·프로젝트·자료가 올라오면 가장 먼저 알려드립니다. 스팸 없음, 언제든 해지 가능.

AI로 만든 결과물, 완성해 드립니다

바이브코딩으로 만든 MVP의 배포, 보안, 버그 수정까지 마무리

소스코드 & PDF 가이드

검증된 프로젝트 코드와 단계별 제작 가이드를 확인하세요

도움이 필요하세요?

바이브코딩, 배포, 마무리 관련 궁금한 점을 카카오톡으로 물어보세요.