[채널톡] 머신러닝이란 무엇인가요?
머신러닝(Machine Learning, ML)이란?
머신러닝은 AI를 구현하기 위한 방법 중 하나로 오랫동안 연구되어 온 분야입니다. 단어를 직역하면 ‘기계 학습’이라는 뜻으로, 컴퓨터가 스스로 데이터를 학습하도록 한다는 뜻인데요. 1959년 아서 사무엘은 머신러닝을 ‘명시적으로 프로그램을 작성하지 않고도 컴퓨터에 학습할 수 있는 능력을 부여하기 위한 연구 분야’라고 정의했습니다. [1]
보다 최근의 정의는 1998년 톰 미첼이 ‘만약 어떤 작업 T에서 경험 E를 통해 성능 측정 방법인 P로 측정했을 때 성능이 향상된다면, 이런 컴퓨터 프로그램은 학습을 한다고 말한다’고 설명한 것입니다. 참고로 톰 미첼은 카네기 멜론 대학의 교수로, '머신러닝'이라는 저서를 쓴 머신러닝의 대가입니다. [2]
물론 AI 연구 초창기에는 사람이 일일이 수많은 규칙을 컴퓨터에게 알려주는 방식도 시도되었습니다. 흔히 이렇게 만들어진 AI를 '규칙 기반 AI'라고 부르는데요. 당연히 가능하기만 하다면 사람이 일일이 방식을 알려주는 것보다는 컴퓨터가 알아서 학습할 수 있도록 하는 방식이 효율적이고 잠재력도 큽니다.
하지만 머신러닝 분야는 오랜 기간 큰 성과를 내지 못했는데요. 이는 머신러닝 방식으로 제대로 된 성과가 나오려면 막대한 데이터와 컴퓨팅 파워가 뒷받침되어야 했기 때문입니다. 때문에 한때는 머신러닝에 대한 실망감이 매우 컸고, '머신러닝'이라는 이름을 내세우면 연구 지원을 받지 못할 정도였다고 합니다. [3] 하지만 머신러닝 연구를 포기하지 않은 학자들의 연구가 계속 이어지고 컴퓨팅 파워의 발전이 뒷받침된 결과, 지금은 머신러닝이 AI의 엄연한 주류가 되었습니다. 현재 주목받는 AI 분야의 주요 성과들은 모두 머신러닝이라는 큰 가지 아래에서 나온 것들이죠.
예를 들어 y=ax+b와 같은 방정식이 있다면, x라는 데이터가 입력될 때 y라는 정답을 계산해 줄 수 있는 조건 a와 b를 컴퓨터가 찾을 수 있도록 학습시키는 것을 머신러닝이라고 할 수 있는데요. 학습 방법에 따라 여러 종류로 나누어 볼 수 있습니다. 대부분의 AI 관련 자료들이 머신러닝의 학습 방법으로 ‘지도 학습’, ‘비지도 학습’, ‘강화 학습’ 세 가지를 소개하고 있는데요, 사실 이제는 세 가지 방식 외에도 수많은 변주 형식들이 존재합니다.
이 글에서는 지도 학습, 비지도 학습, 강화 학습의 세 가지 방식에다 비지도 학습의 일종인 ‘자기지도 학습’, 그리고 지도 학습과 비지도 학습을 혼합한 형태인 ‘준지도 학습’, LLM이 등장한 이후 중요해진 개념인 ‘인 컨텍스트 학습’까지 추가해 설명해 보겠습니다.
