ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • [Week 1] Introduction
    Courses/Andrew Ng - Machine Learning 2021. 12. 14. 21:45

    What is machine learning?

     머신 러닝에 대해 두가지 정의를 들 수 있겠습니다. 

    첫번째는 Arthur Samuel의 정의입니다

     : " 명시적 프로그래밍 없이 컴퓨터가 학습하는 능력을 갖출 수 있게 하는 분야 " 

    조금 오래된 정의입니다.

     

     두번째 정의는 Tom Mitchell의 좀 더 모던한 정의입니다

     : " 어떤 프로그램이 T라는 일(task)의 수행에서 P로 측정되는 성능이 E라는 경험을 통해 증가되었다면 이 프로그램은 일 T와 성능측정 P에 대하여 경험 E로 부터 학습한다고 할 수 있다. "

     

     조금 복잡한데, 예를 들어 봅시다. 체커를 플레이하는 프로그램이 있다고 합시다. 이 경우,

    E = 체커 게임을 플레이하는 경험

    T = 체커 게임을 수행하는 일

    P = 프로그램이 게임에서 승리할 확률

     

     즉, 체커 게임을 하는 프로그램이 있을 때 이 게임의 성능(P)은 승리 확률로 결정되겠죠. 승리 확률이 100%인 프로그램이 가장 성능이 좋은 프로그램이라고 할 수 있습니다. 이 프로그램의 (T)은 체커 게임 자체를 수행하는 일입니다. 기물을 어떻게 움직이고 어느 곳에 배치하느냐가 실제로 프로그램이 수행하는 일이겠죠. 이상적인 머신 러닝 프로그램은 체커 게임을 매번 플레이하는 경험(E)이 쌓일 때 마다 성능(P)가 향상될 것 입니다. 

     

    일반적으로 머신 러닝 문제는 크게 두가지로 나뉘어집니다: 지도 학습(Supervised Learning) / 비지도 학습(Unsupervised Learning)

     


    Supervised Learning

     

     지도 학습은 우리가 이미 입력과 출력 사이의 관계를 알고 있는 데이터 셋을 가지게 됩니다. 출력된 값이 어떤 값인지 정답을 미리 알고 있는 것이죠.

     지도 학습 문제들은 크게 회귀(regression) 문제와 분류(classification) 문제로 나뉘어집니다. 회귀 문제는 연속된 출력 내에서 결과를 예측하려고 합니다. 즉 연속 함수에 입력값을 넣어 출력값을 매핑하는 문제입니다.

     예를 들어 집의 크기에 따른 가격을 예측할 때 회귀 분석을 이용해 볼 수 있습니다. 가격은 연속된 출력에 속하고 이 결과에 매핑할 수 있는 어떤 연속 함수를 도출하여 특정한 크기의 집을 입력으로 넣었을 때 가격이 어느 정도일지 가늠해볼 수 있습니다.

     

     분류 문제는 연속된 출력이 아닌 이산(discrete) 출력일 때 적용될 수 있습니다. 즉 [0,1,2,3...] 식으로 결과가 출력된다면 분류 문제입니다.

     만약에 주어진 문제가 특정 가격에 대하여 집이 팔릴지 안팔릴지를 예측하는 것이라면 이는 분류 문제입니다.

     


    Unsupervised Learning

     비지도 학습은 지도 학습과는 달리 정답이나 관계가 주어지지 않습니다. 주어진 데이터를 보고 변수들의 관계를 추론해야 합니다. 예를 들어 유전자 분석에서 자동으로 비슷한 유전자 군집군을 도출해내는 것이 좋은 예입니다. 이렇게 분류화하는 것을 군집화(Clusttering) 라고 합니다.

     

    이런 기술은 서버 컴퓨터 , 인터넷 뉴스, 사회 관계망 분석, 천문학 등등 많은 분야에 사용됩니다.

    'Courses > Andrew Ng - Machine Learning' 카테고리의 다른 글

    [Week 2] Multivariate Linear Regression  (0) 2021.12.20
    [Week 1] Linear Algebra Review  (0) 2021.12.19
    [Week 1] Parameter Learning  (0) 2021.12.16
    [Week 1] Model and Cost Function  (0) 2021.12.14
    0. 시작하기 전에  (0) 2021.12.13

    댓글

Designed by Tistory.