machine learning 7

[ML] Resampling Methods 2편 (Bootstrap)

본 게시글은서울대학교 데이터사이언스대학원 오민환 교수님의데이터사이언스를 위한 머신러닝 및 딥러닝1 수업을학습을 목적으로 재구성하였습니다이번 시간에는 bootstrap에 관한 내용을 살펴본다 bootstrap은 우리 지난 시간에 배웠던cross validation과 비슷한 맥락이다 이 bootstrap은 하나의 dataset을 이용해서여러 복제본 dataset을 만드는 방법인데아주 유용해서 자주 쓰이는 방법이라고 한다 예를 들어서 데이터셋 하나로 어떤 모델의 파라미터를 구했다고하자이 데이터셋 한개만으로는 파라미터의 uncertainty를 계산하기가 힘들다우리가 앞에서 linear regression과 logistic regression은 가능했지만원래는 쉽지 않다고 한다따라서 bootstrap이 이런..

[ML] Classification 1편 (Logistic Regression)

본 게시글은서울대학교 데이터사이언스대학원 오민환 교수님의데이터사이언스를 위한 머신러닝 및 딥러닝1 수업을학습을 목적으로 재구성하였습니다지난시간까지 Linear Regression에 대해서 배웠다이번에는 Logistic Regression에 대해서 배워본다 Logistic Regression은 우리가 흔히 말하는Classification를 해결하는 방법이다 Classification 문제란 우리가 모델을 통해서 예측해야하는 output즉, response variable이 category인 것을 말한다위 ppt에서 예시를 살펴보면눈의 색상이 brown, blue, green 3개 중에 1개를 맞춰야한다거나email을 보고 스팸인지 스팸이 아닌지 맞춰야하는 경우가 있다 즉, classification이..

[ML] Linear Regression 2편 (F-statistics, categorical predictors, interactions)

본 게시글은서울대학교 데이터사이언스대학원 오민환 교수님의데이터사이언스를 위한 머신러닝 및 딥러닝1 수업을학습을 목적으로 재구성하였습니다 지난 시간에 이어서 linear regression에 대해서더 나아가서 배워보자 지난 시간에는 single linear regression을 넘어서multiple linear regression까지 학습했다 multiple linear regression을 빠르게 계산하는 방법에 대해서지난 시간에 배운 내용이다이렇게 matrix를 이용해서 계산하면 훨씬 더 수월하게계산을 수행할 수 있다 잔차 제곱의 합인 RSS는위와 같이 나타낼 수 있다 그리고 이를 미분해서 0이 되는 B^를 찾으면 이런 값이 나오게 된다 이게 multiple linear regression을 공부할..

[ML] Linear Regression 1편 (single & multiple linear regression)

본 게시글은서울대학교 데이터사이언스대학원 오민환 교수님의데이터사이언스를 위한 머신러닝 및 딥러닝1 수업을학습을 목적으로 재구성하였습니다본격적으로 머신러닝 내용을 시작한다그 첫번째 주제는 바로 linear regression 교수님의 말씀 한마디 한마디 전부다최대한 설명에 담아보려고 애썼다 그렇다면 .. 시작-!linear regression은 지도학습과 비지도학습을 얘기하는데 있어서가장 기초가 되는 개념이다지도학습에서는 x와 y가 있고그 x는 feature, y는 response variable이라고 부르는데결국 x와 y가 어떠한 correlation이 있다면 거기에서의 선형관계를 찾아내는 것이다 여러 데이터들 속에서 선형관계를 찾아내는 것이 linear regression이라고 했는데그렇다면 .. 과연..

[ML] Overview of Machine Learning

본 게시글은서울대학교 데이터사이언스대학원 오민환 교수님의데이터사이언스를 위한 머신러닝 및 딥러닝1 수업을학습을 목적으로 재구성하였습니다이번 학기에는 데이터사이언스 대학원의머신러닝 딥러닝1 강의를 수강하게 되었다 이전에 회사에서 개발자로 근무할 때LLM을 접하면서코세라에서 머신러닝, 딥러닝 강의를 모두 들었지만제대로 된 수업을 들어보지는 못해서 강의를 수강하게 되었다 이번 강의도 역시 다른 강의들과 마찬가지로매 수업의 내용을 블로그에 복습 겸 나중에 찾아보기 위함으로 게시해보려한다 9월 1일 첫 개강날에는 본격적인 수업에 앞서서머신러닝의 전반적인 구조에 대해서 강의해주셨다 그럼 이번 수업도 정리 시작-! 데이터사이언스대학원 오민환 교수님의 강의이다 한 학기동안 배울 수업 내용의 전반적인 목차(?)이다중간고..

[GNN] Traditional Methods for Machine Learning in Graphs

본 게시글은 Stanford 대학교 Jure Leskovec 교수님의Stanford CS224W: Machine Learning with Graphs(2021) 강의를 듣고학습을 목적으로 재구성한 글입니다스스로 정리한 내용이라 오류가 있을 수 있습니다 https://web.stanford.edu/class/cs224w/ CS224W | HomeContent What is this course about? Complex data can be represented as a graph of relationships between objects. Such networks are a fundamental tool for modeling social, technological, and biological syste..

[논문 리뷰] The Case for Learned Spatial Indexes (2020.08.24)

The Case for Learned Spatial Indexes논문 정보제목The Case for Learned Spatial Indexes저자Varun Pandey, Alexander van Renen, Andreas Kipf, Ibrahim Sabek, Jialin Ding, Alfons Kemper소속TUM, MIT CSAIL저널AIDB(AI Database), VLDB(Very Large Database)주제Computer Science > Databases논문제출일2020.08.24인용수53회 (2024.12.03 기준) https://arxiv.org/abs/2008.10349 The Case for Learned Spatial IndexesSpatial data is ubiquitous. ..