ML(Machine Learning)
- 인간의 판단 능력을 확장하여 인간이 더욱 빠르고 정확하게 결정할 수 있게 돕는 도구
Model and Learning
- Model : ‘판단력’의 또다른 이름 → 모델이 좋아야 더 좋은 추측이 가능
- Learning : 모델을 만드는 과정
Tabular
- Column(열)과 Row(행)으로 이루어진 데이터 셋
Independent variable and Dependent variable
- 온도가 높을 수록 판매량이 높아짐 → 온도: 독립변수, 판매량: 종속변수
- 판매량으로 인해 온도가 달라지지 않음..! → 원인은 독립적, 결과는 종속적
- 상관관계 : 한 쪽의 값이 바뀌었을 때, 다른 쪽의 값이 바뀜 → 두 개의 특성은 ‘서로 관련이 있다’
- 인과관계 : 각 열이 원인과 결과의 관계일 때
Machine Learning의 분류
- Supervised Learning : 문제와 정답이 존재하는 데이터를 컴퓨터로 학습시켜서 모델을 만드는 방식
- Unsupervised Learning : 무언가에 대한 관찰을 통해 새로운 의미나 관계를 밝혀내는 것
- Reinforcement Learning : 더 좋은 보상을 받기 위해 수련하는 것
Supervised Learning
- 과거의 데이터를 독립변수(원인)과 종속변수(결과)로 분리하여 그 관계를 컴퓨터에게 학습 → 독립변수와 종속변수의 관계를 설명하는 공식 생성(모델!)
- 회귀(Regression) : 예측하고 싶은 종속변수가 숫자일 때
- 분류(Classification) : 예측하고 싶은 종속변수가 이름 혹은 문자일 때
Unsupervised Learning
- 데이터의 성격을 파악 → 그룹핑
- 군집화(Clustrering) : 비슷한 것들을 찾아서 그룹을 만드는 것(비슷한 행을 그룹핑하는 것)
- 군집화 vs 분류?
- 군집화 : 어떤 대상들을 구분해서 그룹을 만드는 것, 서로 가까운 관측치를 찾아주는 것
- 분류 : 어떤 대상이 어떤 그룹에 속하는지 판단하는 것
- 연관 규칙 학습(Association rule Learning) : 서로 연관된 특징을 찾아내는 것(장바구니 분석)
- 관측치(행)를 그룹핑해주는 것 → 군집화
- 특성(열)을 그룹핑해주는 것 → 연관규칙
Reinforcement Learning
- 더 많은 보상을 받을 수 있는 정책을 만드는 것
댓글 영역