2025/03 14

[database] SQL representation (group by와 having, aggregation, null values 처리)

본 게시글은서울대학교 데이터사이언스대학원 이상원 교수님의데이터사이언스 응용을 위한 빅데이터 및 지식기반시스템 강의를학습을 목적으로 재구성하였습니다저번시간에 이어서 계속해서SQL의 표현법에 대해서 알아보자  첫 번째로 나오는 개념은 subquery(혹은 nested query)이다nested query는 쿼리가 안에 있는데그 안에 또 다른 쿼리가 nesting된다는 뜻으로main query와 그 아래에 subquery가 있는 것이다 왼쪽이 그냥 일반 main query만 있는 것이고오른쪽이 subquery로 where의 조건절을 만든 것이다 그렇다면 둘 중에 어떤 것이 더 효과적일까?교수님 말씀에 따르면 오른쪽의subquery를 이용한 쿼리가 더 효율적이라고한다 왼쪽은 그냥 join을 사용한 것이고DBMS..

강의/database 2025.03.31

[database] Relational Algebra (Division과 Query 예시)

본 게시글은서울대학교 데이터사이언스대학원 이상원 교수님의데이터사이언스 응용을 위한 빅데이터 및 지식기반시스템 강의를학습을 목적으로 재구성하였습니다 DB에서 Set과 Bas Semantics의 개념을 알아보자이 두 개념의 가장 큰 차이는중복 허용 여부이다 Relational Algebra는 보통 Set을 따르고SQL은 보통 기본적으로 bag semantics을 따르는데set은 우리가 흔히 수학에서 말하는 집합으로중복을 허용하지 않는 것이고bag semantics는 한국어로 멀티셋 의미론이라고 하며중복되는 튜플도 허용을 한다 SQL에서는 기본적으로 중복을 허용해서튜플 쿼리 결과를 내놓지만DISTINCT를 명시해주면 중복을 제거해서 보여준다   이번 수업 시간의 주요 내용인Divison 연산인다 앞에서 배웠던..

강의/database 2025.03.31

[system programming] Linux 운영체제 Exception Control Flow

본 게시글은서울대학교 데이터사이언스대학원 정형수 교수님의 데이터사이언스 응용을 위한 시스템 프로그래밍 강의를학습을 목적으로 재구성하였습니다  이번 시간에 배울 내용은linux 운영체제 내에서의 exception control flow에 대한 내용이다 이번 수업의 내용은 굉장히 중요한 내용인데이 내용을 이해를 하지 못하면이 시스템 프로그래밍이라는 수업 자체를따라가기가 매우 힘들어 진다고 한다 그래서 교수님께서 이번 수업은 강의 녹화본을 올릴테니이해가 안가면 갈때까지 영상을 보며 이해하라고 하셨다.. 지금까지는 단순히 assembly code와user program 내에서 어떻게 메모리와 register가 이동하고어떤 과정을 거치는지를 알아봤다면오늘 배우는 내용은 지금까지 배우는 내용에서더 확장된 내용이다 ..

[system programming] Computer Program의 표현과 실행(Basic of Assembly-3, function call)

본 게시글은서울대학교 데이터사이언스대학원 정형수 교수님의 데이터사이언스 응용을 위한 시스템 프로그래밍 강의를학습을 목적으로 재구성하였습니다오늘은 컴퓨터 프로그램의 표현과 실행 3번째 시간이번 수업의 주요 내용은 function call을 할 때컴퓨터 프로그램은 내부에서 어떤 작업을 하며어떤 방식으로 function을 수행시킬까그리고 이를 assembly로 어떻게 나타낼까이다  매번 수업시간마다 나오는 지겨운 그림이다 CPU 아키텍쳐는 크게 봤을 때 state machine과도 같다고한다하나의 instruction이 trigger가 되어서instruction이 수행될 때마다 CPU의 state가 바뀌기때문에 그렇다고 한다    우리 수업이나 다른 교과서에서는통상적으로 stack memory를 거꾸로 뒤집어..

[database] Relational Algebra (selection, projection, cross-product, set-difference, union)

본 게시글은서울대학교 데이터사이언스대학원 이상원 교수님의데이터사이언스 응용을 위한 빅데이터 및 지식관리시스템 강의를학습을 목적으로 재구성하였습니다오늘 강의는 Relational Database에서SQL의 기본 원리가 된Relation Algebra에 관한 내용이다   우선 RDB의 쿼리 언어인 SQL의역사에 대해 잠깐 알아보자 E. F. Codd 박사가 제안한Relational Algebra를 기반으로IBM의 SystemR팀에서 개발한 것이 SEQUEL이고이것이 발전을 거쳐 지금의 SQL이 되었다   SQL은 2가지 수학적 쿼리 언어로부터 형성되었는데Relational Algebra(RA)와 Relational Calculus(RC)이다 위 두 언어는 둘다 Relational Database의 쿼리 언어..

강의/database 2025.03.24

[database] View와 Materialized View

본 게시글은서울대학교 데이터사이언스대학원 이상원 교수님의데이터사이언스 응용을 위한 빅데이터 및 지식관리시스템 강의를학습을 목적으로 재구성하였습니다앞의 수업 내용에서 DB의 개념적, 논리적 스키마와data independence 개념에 대해 공부하며view에 대한 내용을 배웠었다 오늘은 View와 view의 종류 중 하나인materialized view에 대해 수업을 진행했다 우선 view에 대해서 다시 한 번 보자view를 만들기 위해서는 SQL문으로CREATE VIEW를 해주면 된다 view를 처음에 만들어줄 때 사용하는 table을기본 table이라고 해서Base Relation이라고 한다 base table은 우리가 일반적으로 생각하는 table이므로물리적으로 storage에 저장되어있다하지만 vi..

강의/database 2025.03.24

[system programming] Program의 표현과 실행(Basic of Assembly Code) - 2

본 게시글은서울대학교 데이터사이언스대학원 정형수 교수님의 데이터사이언스 응용을 위한 시스템 프로그래밍 강의를학습을 목적으로 재구성하였습니다 저번 시간에는 data movement의assembly의 general form을 배웠었다잠깐만 되짚어보자면 S는 스케일이라 주소값에 곱하는 값이고D는 Displacement라 주소값에 더하는 값이다  지난시간에 배웠던 leaq 연산자leaq는 주소값에 접근하는 것이 아닌단순히 주소값끼리만 연산하는 연산자였다그래서 더하기, 곱셈과도 같은 일반 연산에도많이 사용된다  주소값 연산의 예시이다위에서 봤던 leaq의 규칙과 동일하다괄호 앞에 오는 값은 D라 더하기괄호 안에 오는 값은 S라 %rcx에 곱하기를 해준다  이제 다른 Arithmetic Operation을 알아보자..

[system programming] Program의 표현과 실행(Basic of Assembly Code) - 1

본 게시글은서울대학교 데이터사이언스대학원 정형수 교수님의데이터사이언스를 위한 컴퓨팅 시스템 강의를학습을 목적으로 재구성하였습니다이제 본격적으로 우리가 프로그래밍을 하면컴퓨터가 내부에서 어떻게 작동하고어떻게 코드들을 처리하는지 그 과정을 배워본다    우선 내가 짠 파이썬 코드를컴퓨터가 어떻게 해석하는지 알기 위해선하드웨어부터 이해할 필요가 있다 위 ppt에 소개되어있는 하드웨어는Intel의 x86 프로세서로서버시장에서는 굉장히 dominate한 하드웨어라고한다본 수업에서는 이 하드웨어를 예제로 수업을 진행한다 프로세서 칩의 종류는 크게Complex Instruction Set Computer(CISC)와Reduced Instruction Set Computer(RISC)로 나뉘는데보통 Intel 계열의 ..

[database] Relational Database(Primary key와 Foreign key)

본 게시글은서울대학교 데이터사이언스대학원 이상원 교수님의데이터사이언스 응용을 위한 빅데이터 및 지식관리시스템 수업을학습을 목적으로 재구성하였습니다저번 시간 수업에 이어서DDL과 DML을 잠깐 살펴본 뒤Primary key와 Foreign key에 대해서 자세하게 살펴본다   DDL은 table을 만드는 등의역할을 하는 언어다 CREATE TABLE, CREATE VIEW, CREATE INDEX와 같은 것들이DDL에 속한다   DML은 table 내의 데이터들을 조작하는 언어이다Insert, Delete, Update와 같은 것들이 있다  특정 조건을 filter 걸어 데이터들을 조회하는select문도 대표적인 DML이다   Integrity Constraint, 줄여서 IC에 대해서 알아보자 한국어로는..

강의/database 2025.03.16

[system programming] Bits, Data Type, and Operations (string 표현, 하드웨어가 소수를 표현하는 방식, feat. floating point)

본 게시글은서울대학교 데이터사이언스대학원 성효진 교수님의데이터사이언스를 위한 컴퓨팅 시스템 강의를학습을 목적으로 재구성하였습니다지난번 시간에 이어두번째 시간string과 float 타입에 대한저장방식에 대한 내용이다  컴퓨터 내에 저장되는 모든 data들은0과 1로 저장된다 우리가 사용하는 컴퓨터 내의 프로그램이라고 하는 것은프로그램의 코드가 저장되어있는 메모리 address에access할 수 있는 0과 1의 data들의 연속이라고 할 수 있다 즉, 한 개의 프로그램은굉장히 커다란 byte 단위의 array들의연속이라고 생각하면 좋다단, 우리가 보기에는 연속적인 공간에 있는 것처럼 보이지만실제 하드웨어적으로 연속은 아니다하지만 conceptual하게 연속적으로 저장되어있다고생각해도 무방하다 개발자인 우리..