
LLM은 “Large Language Model”의 약자로, 방대한 텍스트 데이터를 학습해 사람처럼 자연어를 이해하고 생성하는 인공지능 모델을 뜻합니다. 요즘 Chat GPT, Claude 같은 챗봇이나 글쓰기 도구 대부분이 바로 이 LLM 기술을 기반으로 동작합니다.
LLM 기본 개념
인간이 쓰는 문장, 질문, 명령을 입력으로 받아 그에 어울리는 텍스트를 출력하는 언어 특화 AI입니다.
인터넷 텍스트, 책, 기사 등 매우 방대한 양의 글들을 학습해서 단어나 문장들의 패턴과 통계를 익힙니다.
어떻게 동작하나요?
주로 “트랜스포머(Transformer)”라는 딥러닝 구조를 사용해 문맥 속 단어들 사이의 관계를 계산합니다.
사용자가 문장을 입력하면, 지금까지의 문맥을 바탕으로 다음에 올 단어를 확률적으로 예측하는 방식으로 답변을 만들어 냅니다.
무엇에 쓰이나요?
챗봇, Q&A, 이메일·보고서 초안 작성, 번역, 요약, 코드 생성 등 다양한 자연어 처리 업무를 자동화합니다.
기업에서는 고객센터 챗봇, 문서 검색·요약, 마케팅 콘텐츠 자동 생성 등 업무 효율화에 활용하고 있습니다.
LLM과 생성형 AI 관계
생성형 AI는 그림, 음악, 텍스트 등 “새로운 콘텐츠를 만들어내는” AI 전체를 가리키고,
LLM은 그중에서 텍스트를 담당하는 언어 모델입니다.
그래서 “생성형 AI의 핵심 기술이 LLM”이라고 흔히 부르며, 텍스트 관련 기능 대부분이 LLM 위에서 구현됩니다.
대표적인 LLM 으로 ChatGPT(OpenAI), Claude(Anthropic), Gemini/이전 Bard(Google), Llama(Meta), Copilot(마이크로소프트·GitHub 코드 도우미) 등이 있습니다.
이들은 같은 LLM 원리를 사용하지만, 학습 데이터나 규모, 세부 튜닝같은 것들이 달라서 동일한 결과물을 만들진 않습니다.
학습데이터
LLM은 위키피디아, 뉴스, 블로그 등 공개 웹 문서부터 전문 도메인 문서와 코드까지 매우 다양한 텍스트/코드 데이터를 학습에 사용합니다. 다만 어떤 서비스/회사인지에 따라 정확한 데이터 종류와 출처, 그리고 개인정보·저작권 처리 방식이 상당히 달라집니다.
일반 텍스트 코퍼스
위키피디아, 뉴스 기사, 블로그, 책·논문 등 범용 지식을 담은 대규모 텍스트
언어 패턴, 문법, 상식적인 지식을 넓게 학습하는 데 사용됩니다.
대화·Q&A 데이터
채팅 로그, 고객 상담 기록(익명화된 것), 포럼/질문답변 사이트의 Q&A 쌍 등.
자연스러운 대화 흐름과 질의응답 형식을 학습할 때 활용됩니다.
전문 분야 데이터
법률 문서, 의료 논문, 금융 리포트, 기술 매뉴얼 등 특정 도메인 텍스트.
특정 산업·분야에 특화된 LLM(법률 LLM, 의료 LLM 등)을 만들 때 사용됩니다.
코드 데이터
GitHub 같은 공개 저장소의 오픈소스 코드, 기술 문서, API 문서 등.
코드 자동완성, 버그 수정, 코드 설명 등 개발자용 LLM에 필수입니다.
지시·피드백 데이터 (Instruction / Fine-tuning)
“프롬프트 -> 정답/모범 응답” 형태의 질문–답변, 작업 지시–출력 쌍 데이터.
사람이 직접 라벨링하거나, 기존 모델이 생성한 답을 사람이 검수하는 방식 등으로 구축합니다.
'지식 > AI' 카테고리의 다른 글
| AI - Agentic Design Patterns - Part 2 (1) | 2026.01.21 |
|---|---|
| AI - Agentic Design Patterns - Part 1 (0) | 2026.01.21 |
댓글