classification 3

[ML] Support Vector Machine (SVM)

본 게시글은서울대학교 데이터사이언스대학원 오민환 교수님의데이터사이언스를 위한 머신러닝 및 딥러닝1 수업을학습을 목적으로 재구성하였습니다 이번 시간에는 딥러닝의 시대가 도래하기전의 딥러닝 역할을 했던support vector machine에 대해서 배워본다 support vector machine은 아주 멋진 방법론이라고 한다이걸 배우면 여러가지로 classification 문제를 다룰 때의 좋은 apporach를 배울 수 있다 SVM의 목적은 binary classification이다이 binary classification을 directly하게 하는 것인데결국 데이터들은 어떤 feature space의 multi-diemnstion 공간에 존재한다근데 이 공간을 어떻게 binary하게 자를까에 ..

[ML] Classification 2편 (LDA, QDA, Naive Bayes)

본 게시글은서울대학교 데이터사이언스대학원 오민환 교수님의데이터사이언스를 위한 머신러닝 및 딥러닝1 수업을학습을 목적으로 재구성하였습니다 이번 시간은 Classification 2편이다이번시간의 내용은 확률 계산이 많아서느끼기에 그렇게 쉽지는 않았다 그래도 천천히 계산과정까지 정리해보며공부해볼생각이다 그럼 시작-! 오늘 배울 친구들은 Discriminant Analysis(판별분석)라고 불리는데Logistic Regression에 비해서 상대적으로 덜 사용된다고한다하지만 여기서 배운 테크닉들이 유용하기 때문에오늘 내용의 fundamental한 원리들을 이해하는 것이 중요하다 지난 시간에 배운 Logistic Regression은sigmoid 함수를 fit 시키는 것이었는데sigmoid 함수에 지수 형태..

[ML] Classification 1편 (Logistic Regression)

본 게시글은서울대학교 데이터사이언스대학원 오민환 교수님의데이터사이언스를 위한 머신러닝 및 딥러닝1 수업을학습을 목적으로 재구성하였습니다지난시간까지 Linear Regression에 대해서 배웠다이번에는 Logistic Regression에 대해서 배워본다 Logistic Regression은 우리가 흔히 말하는Classification를 해결하는 방법이다 Classification 문제란 우리가 모델을 통해서 예측해야하는 output즉, response variable이 category인 것을 말한다위 ppt에서 예시를 살펴보면눈의 색상이 brown, blue, green 3개 중에 1개를 맞춰야한다거나email을 보고 스팸인지 스팸이 아닌지 맞춰야하는 경우가 있다 즉, classification이..