머신러닝4 [다항논리회귀] 내가 마시는 와인을 기계로 분류할 수 있을까? 와인의 종류는 일반적으로 색, 향, 맛, 질감, 용도, 양조법 등을 기준으로 구별한다고 한다. 와인을 판별하는 소믈리에도 직업으로 존재하는 것 처럼 다양한 와인을 구별해내는 것은 쉬운 일이 아니다. 우리에게는 와인의 여러 특성들을 바탕으로 와인을 3그룹으로 분류해놓은 데이터셋이 있다. 이 데이터셋을 바탕으로 내가 마시는 와인을 분류할 수 있는 기계를 학습시킬 수 있을까? 와인 데이터셋: https://www.kaggle.com/brynja/wineuci Classifying wine varieties Great practice for testing out different algorithms www.kaggle.com # kaggle API Token 입력 import os os.environ['KAGG.. 2022. 1. 8. [머신러닝(machine learning) - 논리회귀(logical regression)] 내일배움캠프 AI트랙 앞서 다뤄봤던 선형회귀로 학습시켜 얻을 수 없는 결과는 어떤 방법으로 학습시킬 수 있을까? 만약에 공부시간과 시험성적을 선형회귀로 학습시켜 추측하게 한다면 우스꽝스러운 결과가 나올 것이다. 공부를 하루 24시간해도 성적은 높게 추측하는 오류가 발생하기 때문이다. 따라서, 이번 시간에는 논리회귀라는 것을 알아볼 것이다. 논리회귀의 함수는 아래 그림과 같이 S커브 형태를 띈다. 기존의 선형회귀함수에 시그모이드(sigmoid)를 추가하여 0과 1사이의 결과값을 얻을 수 있도록 하고, threshold(임계치)를 정하여 0에 가까운 값인지 1에 가까운 값인지를 판단한다. 크로스엔트로피(crossentrophy)를 사용하여 확률분포의 차이를 줄여주는 손실함수를 만들 수 있다. 여기서 확률분포의 차이를 줄인다는 것.. 2022. 1. 6. [머신러닝(machine learning) - 선형회귀(liner regression)] 내일배움캠프 AI트랙 지난 시간에 머신러닝을 크게 분류해서 기계를 학습시키는데 어떤 방법들이 있는지 살펴보았다. 오늘은 그 중에서도 지도학습의 회귀(regression)를 사용하여 학습시키는 방법에 대해서 자세히 알아보자. 모든 기계를 학습시킬 때에는 기본적으로 가설을 세운다는 사실을 유념하자. 회귀는 결과값이 숫자일때 사용하는 방법으로 가설을 바탕으로 정해진 입력값과 결과값의 갯수나 형태에 따라 회귀의 종류도 다양하게 나뉜다. 01. 선형회귀 출력값을 선형(liner)으로 가정 H(x) = Wx + b (직선 그래프 형태를 가진 함수) 점선(가설)과 점(정답)이 가까워지도록 학습시키는 방법 점과 점선사이의 거리를 손실함수(cost or loss)로 표현 ✅ 모든 학습의 최종 목적은 손실함수의 값을 최소로 만드는 것이다 손실.. 2022. 1. 6. [머신러닝(machine learning) 이란?] 내일배움캠프 AI트랙 사람이 할 수는 있지만 시간과 에너지를 지나치게 많이 써야해서 비효율적인 일들을 기계에게 학습시켜 대신 하게 하면 어떨까? 머신러닝(machine learning)은 이렇게 시작되었다고 한다. 기계를 학습시키는데는 여러가지 방법이 있는데, 그 방법들에 대해서 하나하나 알아보자. 머신러닝의 분류 머신러닝은 아래와 같이 크게 세가지로 구분된다. 1. 지도학습 과거의 데이터를 가지고 학습하여 현재의 결과값을 추측할 때 1) 회귀 출력값이 숫자일 때 사용 예) 온도와 아이스아메리카노 판매량의 상관관계를 통한 판매량 추측 2) 분류 출력값이 문자 혹은 이름일 때 사용 예) 시험공부시간과 학점과의 상관관계를 통한 학점 추측 2. 비지도학습 과거의 데이터를 가지고 미지의 결과값을 추측할 때 1) 군집화(표의 행을 활.. 2022. 1. 5. 이전 1 다음