본문 바로가기

TIPS

인공지능의 기초 원리부터 고급까지 part.1 (1/4)

728x90
반응형
SMALL

 

 

안녕하세요

요즘 뜨거운 주제 중 하나인 AI를 얘기해보려 합니다.

갑자기 왜 AI로 주제를 틀었냐? 라고 물으신다면

제가 다니는 회사가 자체 AI를 개발하려고 하기 때문에 미리 공부 할 겸 포스팅 해보려 합니다.

 

AI는 우리 생활 속으로 자연스럽게 들어와 있지만,

“도대체 얘는 어떻게 배우고, 어떻게 대답하지?”라고 물으면 그냥저냥 막연한 생각만 드는게 현실입니다.

그래서 이 포스팅을 준비했습니다.

대학교때 배운게 전부이지만 AI는 AI로 학습하는법!

GPT 클로드 구글 등 다양한 AI로 학습 한 내용을 공유해보려 합니다.

딱딱한 수식 대신, 친숙한 비유와 짧은 예시로 핵심만 차근차근 설명하겠습니다.

 


1. AI는 규칙집이 아니라 “배우는 함수”다

 

많이들 “if문을 엄청 많이 쓰면 인공지능이 된다”라고 생각합니다.

현대 AI는 규칙을 더하는 방식이 아니라, 데이터를 보며 기준을 스스로 조정하는 방식에 가깝습니다.

 

예시를 보여 드리겠습니다.

 

규칙 기반: “제목에 ‘무료’가 있으면 스팸” 같은 룰을 사람이 직접 만든다. 룰이 늘수록 관리가 지옥이 된다.

학습 기반: 메일을 많이 보여주면, 스팸일 가능성을 더 잘 맞추도록 내부의 수치를 조금씩 조정합니다.

이 수치들이 곧 모델의 “기준점”입니다.

 

핵심은 간단합니다.

정답에 가깝게 맞히도록 기준을 조금씩 돌려 조정한다는 것입니다.

 

 


2. 학습은 “연습문제 → 채점 → 피드백”의 반복이다

 

 

비유해 볼까요

  • 연습문제(데이터)를 푼다 → 답안을 낸다.
  • 채점(손실 계산)으로 얼마나 틀렸는지 본다.
  • 선생님 피드백처럼 내부 기준을 살짝 바꾼다.
  • 다음 문제를 푼다. 이전보다 더 맞춘다.

이게 수천, 수만 번 반복되면 처음 보는 문제에도 그럴듯하게 답하는 기준이 만들어지는 원리입니다.

 


3. “AI가 말을 하는 원리”는 자동완성과 비슷하다

 

스마트폰 키보드 자동완성을 떠올리면 쉽습니다.

다음 글자를 무엇으로 이어가면 자연스러운지 확률적으로 고르는 원리 입니다.

요즘의 대형 언어모델은 방대한 문장들을 보며 “다음에 나올 말”을 예측하는 데 탁월해졌습니다.

그래서 설명을 이어가고, 예시를 만들고, 코드를 제안할 수 있습니다.

 


4. 아주 작은 손맛 예시: 거짓말처럼 단순한 스팸 감별기

 

아래는 “느낌표 개수, 링크 개수” 같은 간단한 특징만 보고 스팸 여부를 배우는 상상을 코드로 적어본 것입니다.

수식은 없고 흐름만 보시면 됩니다

# 1) 데이터 예시: [느낌표수, 링크수] -> 라벨(스팸=1, 정상=0)
X = [[3,1],[0,0],[5,2],[1,0],[2,1]]
y = [1,0,1,0,1]

# 2) 모델 준비: 처음엔 기준이 엉망이라 틀린다
model = TinyClassifier()  # 내부에 '기준 수치'가 있다고 생각하면 된다

# 3) 학습: 문제를 풀고, 채점하고, 조금 고쳐서 다시 푼다
for epoch in range(200):
    for x_i, y_i in zip(X, y):
        pred = model.predict(x_i)
        model.update(x_i, y_i, pred)  # 틀린 정도만큼 내부 수치를 살짝 조정한다
 

여기서 중요한 건 규칙을 늘리지 않는다는 점입니다.

정답에 가까워지도록 기준을 미세하게 고친다는 흐름만 이해하면 됩니다.

 


5. 사람들이 자주 묻는 것들
  • Q. 데이터만 많으면 무조건 잘하나요?
  • 아니요. 좋은 데이터가 중요합니다. 틀린 라벨, 편향된 표본은 모델을 헷갈리게 만듭니다.
  • Q. 정확도만 높이면 되나요?
  • 클래스가 불균형이면 정확도만 봐선 위험합니다. 재현율, 정밀도, F1 같은 지표를 함께 봐야합니다.
  • Q. 왜 가끔 이상한 답을 하나요?
  • 학습한 데이터 바깥의 상황이거나, 모호한 요청일 수 있고, 명확한 입력예시가 도움이 되기 때문입니다.

 


 

이상 1편

AI는 if가 아니라 학습이고 자동완성과 언어모델 직관을 잡는다는 내용을 마치고

2편 실무에서 만나는 핵심 알고리즘 지형도(선형/트리/부스팅/서포트벡터/간단한 신경망). 언제 무엇을 쓰면 좋은지 사례 중심에 대한 포스팅을 해보도록 하겠습니다

감사합니다.

 

728x90
반응형
LIST