앞선 글에서 우리는 LLM이 어떻게 말하는지 살펴봤습니다.
👉 문장을 나누고
👉 확률을 계산하고
👉 단어를 이어 붙인다
그렇다면 이제 이런 질문이 자연스럽게 이어집니다.
👉 “그럼 이 AI는 어떻게 이렇게 똑똑해진 걸까?”
이번에는 LLM이 성장하는 과정을 이야기로 풀어보겠습니다.
📌 아무것도 모르는 상태에서 시작
처음의 LLM은 사실 아무것도 모릅니다.
정말 말 그대로:
- 단어 의미도 모르고
- 문장 구조도 모르고
- 질문도 이해하지 못합니다
👉 거의 “빈 상태”에서 시작합니다.
📌 첫 번째 단계: 엄청나게 많이 읽는다
어느 날, 이 AI에게 엄청난 양의 글이 주어집니다.
- 뉴스 기사
- 책
- 블로그 글
- 다양한 문서
이 양은 사람이 평생 읽을 수 있는 수준을 훨씬 넘습니다.
👉 LLM은 이 글들을 “읽으면서” 학습을 시작합니다.
📌 학습 방식은 의외로 단순하다
여기서 중요한 포인트가 있습니다.
LLM은 이렇게 공부하지 않습니다.
❌ “이건 중요한 내용이야, 기억해야지”
❌ “이건 시험에 나오겠네”
대신 아주 단순한 방식으로 학습합니다.
👉 “다음에 올 단어를 맞춰라”
예를 들어:
“오늘 날씨가 정말 ___”
이 빈칸에 어떤 단어가 올지 계속 맞추는 것입니다.
📌 틀리면 계속 수정한다
처음에는 거의 다 틀립니다.
하지만 그때마다 이렇게 합니다.
👉 “아, 틀렸네. 다시 조정해야겠다”
이 과정을 수없이 반복하면서
조금씩 더 정확해집니다.
이 과정을 쉽게 말하면:
👉 “계속 틀리면서 배우는 방식”
입니다.
📌 이렇게 만들어지는 ‘언어 감각’
이 반복이 쌓이면 놀라운 일이 일어납니다.
LLM은 점점 이렇게 됩니다.
- 문장이 자연스러운지 판단 가능
- 어떤 표현이 자주 쓰이는지 이해
- 문장의 흐름을 예측 가능
👉 마치 “언어 감각”이 생긴 것처럼 보입니다.
📌 두 번째 단계: 더 똑똑하게 다듬기
기본 학습이 끝나면
이제 한 단계 더 발전합니다.
👉 더 좋은 답을 하도록 “다듬는 과정”
이 과정에서는:
- 더 정확한 답변
- 더 자연스러운 표현
- 더 도움이 되는 내용
을 만들도록 조정됩니다.
📌 사람의 피드백이 들어간다
여기서 중요한 단계가 하나 더 있습니다.
👉 사람이 직접 평가하는 과정
예를 들어:
- “이 답변이 더 좋다”
- “이건 별로다”
이런 기준을 통해
AI는 더 나은 방향으로 개선됩니다.
📌 그래서 지금의 LLM이 만들어진다
이 모든 과정을 거치면
우리가 사용하는 LLM이 완성됩니다.
정리하면:
- 엄청난 양의 글 학습
- 다음 단어 맞추기 반복
- 계속 수정하며 개선
- 사람 피드백 반영
👉 이 과정을 통해 지금의 AI가 만들어집니다.
📌 쉽게 이해하는 비유
이 과정을 이렇게 생각해보면 쉽습니다.
👉 “수천만 개 문제를 풀어본 학생”
- 처음엔 틀림
- 계속 반복
- 점점 정확해짐
👉 결국 실력이 크게 향상됩니다.
📌 오늘 이야기의 핵심
👉 LLM은
“다음 단어를 맞추는 학습을 반복하면서 점점 똑똑해진다”
📌 마무리
이제 우리는
LLM이 어떻게 만들어졌는지까지 이해했습니다.
생각하는 AI가 아니라,
👉 “학습을 통해 패턴을 익힌 시스템”이라는 점이 핵심입니다.
다음 글에서는
👉 LLM이 이해하는 ‘토큰(Token)’이라는 개념을 이야기로 쉽게 설명해보겠습니다.
0 댓글
자유롭게 질문해주세요.
단, 광고성 댓글 및 비방은 사전 통보 없이 삭제됩니다.