본 게시글은서울대학교 데이터사이언스대학원 오민환 교수님의데이터사이언스를 위한 머신러닝 및 딥러닝1 수업을학습을 목적으로 재구성하였습니다 이번 시간과 다음 시간에는 강화학습에 대해서 배운데 크게 머신러닝 기법에 대해서지도학습과 비지도학습 그리고 강화학습이라는 범주로 볼 수 있다우리가 지금까지 지도학습과 비지도학습에 대해서는 배웠기에남은 시간 동안에는 강화학습에 대해서 배운다 본격적인 강화학습에 대해서 배우기 전에 오늘 배울 것은가장 기본적인 강화학습이라고 한다강화학습 중에서도 가장 심플한 문제이다 그러나 심플한 케이스라고 해서 쉽다는 건 아닌데아무튼 오늘 내용은 보다 조금 직관적으로 이해하려고하면 좋다고한다 우리가 오늘 배워 볼 내용은 Multi-armed Bandits 문제이다초기의 연구자..