Unsupervised Learning 3

[ML] Clustering (k-means clustering, hierarchical clustering)

본 게시글은서울대학교 데이터사이언스대학원 오민환 교수님의데이터사이언스를 위한 머신러닝 및 딥러닝1 수업을학습을 목적으로 재구성하였습니다오늘은 중간고사 후 머신러닝의 마지막 시간clustering에 대해서 배운다다음 시간부터는 딥러닝 내용으로 넘어간다 cluserting에 대해서 살펴보자 clustering이란 데이터포인들이 있으면 이들을 어떻게 subgroup으로나눌건지에 대한 내용이다한 마디로 데이터포인트들을 partition으로 나누는 것이다데이터들은 x가 존재하고 y는 있을수도있고 없을 수도 있는데clustering도 unsupervised learning이기 때문에 y를 신경쓰지않는다오직 x feature만 보고 clustering을 수행한다 그런데 어떤 데이터들이 가까운지 비슷한지 다..

[ML] Principle Components Analysis (PCA)

본 게시글은서울대학교 데이터사이언스대학원 오민환 교수님의데이터사이언스를 위한 머신러닝 및 딥러닝1 수업을학습을 목적으로 재구성하였습니다 이번 시간에 배울 내용은 Principle Components Analysis우리나라말로는 주성분분석이다 우선 unsupervised learning에 대해서 배워보자오늘 배울 PCA는 대표적인 unsupervised learning 중에 하나다 unsupervised learning은 우리 수업 1강에 잠깐 나왔는데x와 y의 관계를 학습하는 것이 우리가 지금까지 배운 supervised learning이라면unsupervised learning은 y값이 아닌 feature들에만 관심이 있다y값이 아예 없을 수도 있고, 혹은 있지만 아예 관심이 없다 그래서 PC..

[GNN] Graph Training (Stacking Layers Problems, Prediction Head, Loss, Evaluation)

본 게시글은 Stanford 대학교 Jure Leskovec 교수님의Stanford CS224W: Machine Learning with Graphs(2021) 강의를 듣고학습을 목적으로 재구성한 글입니다스스로 정리한 내용이라 오류가 있을 수 있습니다 https://web.stanford.edu/class/cs224w/ CS224W | HomeContent What is this course about? Complex data can be represented as a graph of relationships between objects. Such networks are a fundamental tool for modeling social, technological, and biological syste..