대학원생 신짜오는 공부중

  • 홈
  • 태그
  • 기술
  • 서버관리
  • DB
  • 일상

DQN 1

[DL] Reinforcement Learning 3편 (Policy & Value Iteration, SARSA, Q-Learning, Deep Q-Network)

본 게시글은서울대학교 데이터사이언스대학원 오민환 교수님의데이터사이언스를 위한 머신러닝 및 딥러닝1 수업을학습을 목적으로 재구성하였습니다이 머신러닝 딥러닝 수업의 마지막 강의이자강화학습에서의 마지막 강의이다 이전 시간에 했던 내용에 이어서 다음 부분이다 지난 시간에 배운 내용들이 강화학습의 기본 개념들이었다MDP가 무엇인지 transition model이 무엇인지value function이 어떤 것인지에 대한 기본적인 내용들이었다잠깐만 recap해보자우리가 지난시간에 배운 것은 Bellman Optimally EquationOpitmal Policy, value function을 어떻게 찾는지 등이었다 그렇다면 의사결정을 수행하는 agent의 목적은 무엇일까?결국 optimal polic..

강의/machine learning & deep learning 2025.12.04
이전
1
다음
더보기
프로필사진

대학원생 신짜오는 공부중

개발자 출신인 슬픈 대학원생 / 건설환경공학부에서 공간정보공학 전공

  • 분류 전체보기 (165)
    • 기술 (40)
      • 서버 (5)
      • DB (6)
      • 웹 개발 (13)
      • 알고리즘 (8)
      • 기타 (8)
      • JAVA (0)
    • 강의 (115)
      • computer programming (35)
      • database (23)
      • system programming (19)
      • graph neural network (11)
      • machine learning & deep lea.. (27)
    • 논문 (9)
      • spatial-operation (3)
      • 측량 (1)
      • spatio-temporal (1)
      • road-network (4)
      • spatial bigdata & machine l.. (0)

Tag

논문리뷰, docker, ubuntu, TypeScript, 티스토리챌린지, Deep Learning, 오블완, 알고리즘, React, 우분투, GCN, Algorithm, C++, db, database, 리눅스, Linux, machine learning, System Programming, gnn,

최근글과 인기글

  • 최근글
  • 인기글

Calendar

«   2026/02   »
일 월 화 수 목 금 토
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28

방문자수Total

  • Today :
  • Yesterday :
02-15 00:02

Copyright © Kakao Corp. All rights reserved.

  • 신짜오의 네이버 블로그

티스토리툴바