2025/03/31 2

[database] SQL representation (group by와 having, aggregation, null values 처리)

본 게시글은서울대학교 데이터사이언스대학원 이상원 교수님의데이터사이언스 응용을 위한 빅데이터 및 지식기반시스템 강의를학습을 목적으로 재구성하였습니다저번시간에 이어서 계속해서SQL의 표현법에 대해서 알아보자 첫 번째로 나오는 개념은 subquery(혹은 nested query)이다nested query는 쿼리가 안에 있는데그 안에 또 다른 쿼리가 nesting된다는 뜻으로main query와 그 아래에 subquery가 있는 것이다 왼쪽이 그냥 일반 main query만 있는 것이고오른쪽이 subquery로 where의 조건절을 만든 것이다 그렇다면 둘 중에 어떤 것이 더 효과적일까?교수님 말씀에 따르면 오른쪽의subquery를 이용한 쿼리가 더 효율적이라고한다 왼쪽은 그냥 join을 사용한 것이고DBMS..

강의/database 2025.03.31

[database] Relational Algebra (Division과 Query 예시)

본 게시글은서울대학교 데이터사이언스대학원 이상원 교수님의데이터사이언스 응용을 위한 빅데이터 및 지식기반시스템 강의를학습을 목적으로 재구성하였습니다 DB에서 Set과 Bas Semantics의 개념을 알아보자이 두 개념의 가장 큰 차이는중복 허용 여부이다 Relational Algebra는 보통 Set을 따르고SQL은 보통 기본적으로 bag semantics을 따르는데set은 우리가 흔히 수학에서 말하는 집합으로중복을 허용하지 않는 것이고bag semantics는 한국어로 멀티셋 의미론이라고 하며중복되는 튜플도 허용을 한다 SQL에서는 기본적으로 중복을 허용해서튜플 쿼리 결과를 내놓지만DISTINCT를 명시해주면 중복을 제거해서 보여준다   이번 수업 시간의 주요 내용인Divison 연산인다 앞에서 배웠던..

강의/database 2025.03.31