database 13

[database] DB Design(Entity-Relationship model과 정규화)

본 게시글은서울대학교 데이터사이언스대학원 이상원 교수님의데이터사이언스 응용을 위한 빅데이터 및 지식관리시스템 수업을학습을 목적으로 재구성하였습니다 중간고사를 직전에 두고오늘의 수업은 DB Design에 관한 내용이었다주요하게 ER diagram과 정규화에 대해 다룬다 가보작오 ER Data Model에 대해서 알아보자ER 모델은 DB 설계의 한 방법론이다 보통 ER model과 Relational model을 착각하는데ER은 DB 설계의 방법론이지database 혹은 query language가 아니다 ER model은 database의 schema를논리적으로 디자인하는 방식이며high level한 그림의 형식으로 표현하여직관적인 형태이다 ER은 high level model인 반면뒤에서 배울 정규화(..

강의/database 2025.04.23

[database] Datalog & Data Mining with DBMS (A-priori algorithm)

본 게시글은서울대학교 데이터사이언스대학원 이상원 교수님의데이터사이언스 응용을 위한 빅데이터 및 지식관리시스템 수업을학습을 목적으로 재구성하였습니다우선 저번 시간에 하다가 만 내용을마저 진행해보자  Walking the Tree란Oracle에서 부모-자식 관계를 걸어가는 방식,즉, tree의 계층구조를 이용한 쿼리문이다 위 쿼리는 가장 대표적인Walking the Tree를 구현한 쿼리인데차근차근 살펴보자 위 쿼리에서 PRIOR은 부모 행의 ename을 참조라하는 뜻이고SELECT ename || 'reports to' || PRIOR ename "Walk"라고 되어있는 부분은||과 함께 문자열을 연결해서 결과물을 출력해달라는 뜻이다 START WITH ename = 'King'이란 부분은트리의 루트 노드..

강의/database 2025.04.13

[nl2query] BirdSQL dataset으로 nl2query 실습하기

이번에 수강하고있는 데이터베이스 수업에서nl2query 실습과제가 주어졌다 nl2query계에서 가장 유명한 벤치마크 중 하나인BirdSQL을 이용한 nl2query 실습과제였고전반적인 nl2query 과정이나수정 및 추가가 필요한 점들을 논리적으로 적어가는 과제였다그래서 과제를 수행하는 과정들을티스토리에 간단하게 기록해보려한다BirdSQL https://bird-bench.github.io/ BIRD-benchBIRD Mini-Dev A Lite version of developtment dataset, which is designed to facilitate efficient and cost-effective development cycles, especially for testing and refi..

기술/DB 2025.04.09

[database] Analytic Functions(partitioning, ordering, windowing)

본 게시글은서울대학교 데이터사이언스대학원 이상원 교수님의데이터사이언스 응용을 위한 빅데이터 및 지식기반시스템 강의를학습을 목적으로 재구성하였습니다이번 시간 강의는 DBMS에서Analytic Function과Oracle에서의 Tree Traversal 내용에 대해 다뤘다 하지만 갑자기 교수님이 진도를 폭주하셔서ppt slide가 굉장히 많기 때문에Tree Traversal 내용은 다음 게시글로 옮기고이번 게시글에는 Analytic Function만 정리해보려고한다 한 개 한 개가 그냥 function에 대한 예시가 많아서최대한 핵심만 담아보려고한다  Analytic Function이란요즘 대부분의 DBMS에서 제공하는 기능이다SQL이 개발된 이후에가장 좋은 기능이라는 말도 있다,,고한다  Analytic ..

강의/database 2025.04.08

[database] Advanced SQL(Assertions, Triggers, Data Cube, and Pivoting and Cross-Tab)

본 게시글은서울대학교 데이터사이언스대학원 이상원 교수님의데이터사이언스 응용을 위한 빅데이터 및 지식기반시스템 강의를학습을 목적으로 재구성하였습니다이번 시간에는 Assertion과 Trigger에 대해서 잠깐 살펴보고그 이후에는 SQL에서의 한계를 극복하기 위한Data Cube와 Pivoting and Cross-Tab과 같은advanced SQL에 대해서 배워본다  좀 더 복잡한 Integrity Constraint에 대해 알아보자지금까지 우리는 primary key, foreign key를 배웠는데이번에는 general constraint를 배워보자   General Constraint 에서 table을 만들 때 CHECK로 column의 데이터에 제약조건을 줄 수 있다 위 예시에서CHECK (rati..

강의/database 2025.04.05

[database] benchbase를 이용한 TPC-C postgreSQL 실습

본 게시글은서울대학교 데이터사이언스 대학원 이상원 교수님의데이터사이언스 응용을 위한 빅데이터 및 지식관리시스템 수업을학습을 목적으로 재구성하였습니다이번 시간은 실습 + 과제 시간이었다benchbase를 이용하여 TPC-C라는 유명 benchmark 예제를 활용해postgreSQL을 실습하는 수업이었다 본격적으로 실습 시작 전에benchmark는?benchbase는?TPC-C는?어떤 개념인지 간단하게 살펴보자  Benchmark라는 말은 정말 많이 들어봤을 것이다나도 이전회사에서 자연어 모델을 다룰 때처음 들어봤던 용어였던 것 같다 benchmark는 특정 시스템, 제품, 프로세스의 성능을측정하고 평가하는 과정을 말한다어떤 주어진 workload scenario 아래에서성능을 측정한다 따라서 다양한 프로세..

강의/database 2025.04.04

[database] SQL representation (group by와 having, aggregation, null values 처리)

본 게시글은서울대학교 데이터사이언스대학원 이상원 교수님의데이터사이언스 응용을 위한 빅데이터 및 지식기반시스템 강의를학습을 목적으로 재구성하였습니다저번시간에 이어서 계속해서SQL의 표현법에 대해서 알아보자 첫 번째로 나오는 개념은 subquery(혹은 nested query)이다nested query는 쿼리가 안에 있는데그 안에 또 다른 쿼리가 nesting된다는 뜻으로main query와 그 아래에 subquery가 있는 것이다 왼쪽이 그냥 일반 main query만 있는 것이고오른쪽이 subquery로 where의 조건절을 만든 것이다 그렇다면 둘 중에 어떤 것이 더 효과적일까?교수님 말씀에 따르면 오른쪽의subquery를 이용한 쿼리가 더 효율적이라고한다 왼쪽은 그냥 join을 사용한 것이고DBMS..

강의/database 2025.03.31

[database] Relational Algebra (Division과 Query 예시)

본 게시글은서울대학교 데이터사이언스대학원 이상원 교수님의데이터사이언스 응용을 위한 빅데이터 및 지식기반시스템 강의를학습을 목적으로 재구성하였습니다 DB에서 Set과 Bas Semantics의 개념을 알아보자이 두 개념의 가장 큰 차이는중복 허용 여부이다 Relational Algebra는 보통 Set을 따르고SQL은 보통 기본적으로 bag semantics을 따르는데set은 우리가 흔히 수학에서 말하는 집합으로중복을 허용하지 않는 것이고bag semantics는 한국어로 멀티셋 의미론이라고 하며중복되는 튜플도 허용을 한다 SQL에서는 기본적으로 중복을 허용해서튜플 쿼리 결과를 내놓지만DISTINCT를 명시해주면 중복을 제거해서 보여준다   이번 수업 시간의 주요 내용인Divison 연산인다 앞에서 배웠던..

강의/database 2025.03.31

[database] Relational Algebra (selection, projection, cross-product, set-difference, union)

본 게시글은서울대학교 데이터사이언스대학원 이상원 교수님의데이터사이언스 응용을 위한 빅데이터 및 지식관리시스템 강의를학습을 목적으로 재구성하였습니다오늘 강의는 Relational Database에서SQL의 기본 원리가 된Relation Algebra에 관한 내용이다   우선 RDB의 쿼리 언어인 SQL의역사에 대해 잠깐 알아보자 E. F. Codd 박사가 제안한Relational Algebra를 기반으로IBM의 SystemR팀에서 개발한 것이 SEQUEL이고이것이 발전을 거쳐 지금의 SQL이 되었다   SQL은 2가지 수학적 쿼리 언어로부터 형성되었는데Relational Algebra(RA)와 Relational Calculus(RC)이다 위 두 언어는 둘다 Relational Database의 쿼리 언어..

강의/database 2025.03.24

[database] View와 Materialized View

본 게시글은서울대학교 데이터사이언스대학원 이상원 교수님의데이터사이언스 응용을 위한 빅데이터 및 지식관리시스템 강의를학습을 목적으로 재구성하였습니다앞의 수업 내용에서 DB의 개념적, 논리적 스키마와data independence 개념에 대해 공부하며view에 대한 내용을 배웠었다 오늘은 View와 view의 종류 중 하나인materialized view에 대해 수업을 진행했다 우선 view에 대해서 다시 한 번 보자view를 만들기 위해서는 SQL문으로CREATE VIEW를 해주면 된다 view를 처음에 만들어줄 때 사용하는 table을기본 table이라고 해서Base Relation이라고 한다 base table은 우리가 일반적으로 생각하는 table이므로물리적으로 storage에 저장되어있다하지만 vi..

강의/database 2025.03.24