본문 바로가기

crossentrophy2

[이진논리회귀] 타이타닉에서 당신이 생존할 확률은 얼마나 될까? 타이타닉에 탑승한 사람들은 성별, 나이, 국가, 티켓등급, 승차요금, 함께 탑승한 사람이 달랐다. 과거의 데이터를 통해 현재 내가 타이타닉에 탑승한다면 생존할 수 있을까의 여부를 머신러닝을 모델링하여 추측해보도록 하자. 타이타닉 데이터셋: https://www.kaggle.com/heptapod/titanic Titanic Suited for binary logistic regression www.kaggle.com # kaggle에서 발행한 API Token 입력 import os os.environ['KAGGLE_USERNAME'] = 'username' os.environ['KAGGLE_KEY'] = 'key' # 데이터셋 불러오기 !kaggle datasets download -d heptapod.. 2022. 1. 7.
[머신러닝(machine learning) - 논리회귀(logical regression)] 내일배움캠프 AI트랙 앞서 다뤄봤던 선형회귀로 학습시켜 얻을 수 없는 결과는 어떤 방법으로 학습시킬 수 있을까? 만약에 공부시간과 시험성적을 선형회귀로 학습시켜 추측하게 한다면 우스꽝스러운 결과가 나올 것이다. 공부를 하루 24시간해도 성적은 높게 추측하는 오류가 발생하기 때문이다. 따라서, 이번 시간에는 논리회귀라는 것을 알아볼 것이다. 논리회귀의 함수는 아래 그림과 같이 S커브 형태를 띈다. 기존의 선형회귀함수에 시그모이드(sigmoid)를 추가하여 0과 1사이의 결과값을 얻을 수 있도록 하고, threshold(임계치)를 정하여 0에 가까운 값인지 1에 가까운 값인지를 판단한다. 크로스엔트로피(crossentrophy)를 사용하여 확률분포의 차이를 줄여주는 손실함수를 만들 수 있다. 여기서 확률분포의 차이를 줄인다는 것.. 2022. 1. 6.