상세 컨텐츠

본문 제목

ML의 기초 개념(feat. 생활코딩)

ML

by (방울)도마토 2024. 8. 11. 00:51

본문

ML(Machine Learning)

  • 인간의 판단 능력을 확장하여 인간이 더욱 빠르고 정확하게 결정할 수 있게 돕는 도구

 

Model and Learning

  • Model : ‘판단력’의 또다른 이름 → 모델이 좋아야 더 좋은 추측이 가능
  • Learning : 모델을 만드는 과정

 

Tabular

  • Column(열)과 Row(행)으로 이루어진 데이터 셋

한 건, 한 건의 데이터는 행에, 해당 데이터의 속성을 열로 구분하고 있음

 

Independent variable and Dependent variable

 

  • 표에서 변수는 ‘열’을 의미함

 

  • 온도가 높을 수록 판매량이 높아짐 → 온도: 독립변수, 판매량: 종속변수
  • 판매량으로 인해 온도가 달라지지 않음..! → 원인은 독립적, 결과는 종속적

 

 

 

  • 상관관계 : 한 쪽의 값이 바뀌었을 때, 다른 쪽의 값이 바뀜 → 두 개의 특성은 ‘서로 관련이 있다’
  • 인과관계 : 각 열이 원인과 결과의 관계일 때

 

 

 

 

 

Machine Learning의 분류

  • Supervised Learning : 문제와 정답이 존재하는 데이터를 컴퓨터로 학습시켜서 모델을 만드는 방식
  • Unsupervised Learning : 무언가에 대한 관찰을 통해 새로운 의미나 관계를 밝혀내는 것
  • Reinforcement Learning : 더 좋은 보상을 받기 위해 수련하는 것

 

Supervised Learning

  • 과거의 데이터를 독립변수(원인)과 종속변수(결과)로 분리하여 그 관계를 컴퓨터에게 학습 → 독립변수와 종속변수의 관계를 설명하는 공식 생성(모델!)
  • 회귀(Regression) : 예측하고 싶은 종속변수가 숫자일 때
  • 분류(Classification) : 예측하고 싶은 종속변수가 이름 혹은 문자일 때

 

Unsupervised Learning

  • 데이터의 성격을 파악 → 그룹핑
  • 군집화(Clustrering) : 비슷한 것들을 찾아서 그룹을 만드는 것(비슷한 행을 그룹핑하는 것)
  • 군집화 vs 분류?
    • 군집화 : 어떤 대상들을 구분해서 그룹을 만드는 것, 서로 가까운 관측치를 찾아주는 것
    • 분류 : 어떤 대상이 어떤 그룹에 속하는지 판단하는 것

 

  • 연관 규칙 학습(Association rule Learning) : 서로 연관된 특징을 찾아내는 것(장바구니 분석)

 

  • 관측치(행)를 그룹핑해주는 것 → 군집화
  • 특성(열)을 그룹핑해주는 것 → 연관규칙

 

Reinforcement Learning

  • 더 많은 보상을 받을 수 있는 정책을 만드는 것

'ML' 카테고리의 다른 글

Classification Algorithms with Create ML  (0) 2024.07.08
Classification, Regression, Clustering  (0) 2024.07.07

관련글 더보기

댓글 영역