2025/05/25 3

[database] External Sorting

본 게시글은서울대학교 데이터사이언스대학원 이상원 교수님의데이터사이언스 응용을 위한 빅데이터 및 지식관리시스템 수업을학습을 목적으로 재구성하였습니다이번 시간에 배울 내용은external sorting에 대한 내용이다 external sort는 정확하게 어떤 것이고그냥 sort랑은 뭐가 다른걸까?뒤로가면서 궁금증을 풀어보자 이번 챕터를 공부하면서 이해해야 하는 내용은 위와 같다sorting은 DBMS에서 왜 중요하며in memory sorting과 external sorting은 어떤 것일까? 그리고 external sorting의 대표 알고리즘인external merge sort에 대해 살펴보고B+Tree와 다른 sorting들도 살펴보자 그렇다면 우선 우리가 sorting을 왜 배워야하는지 간단하게 ..

강의/database 2025.05.25

[database] B+Tree Index의 insertion과 deletion (+hash indexing)

본 게시글은서울대학교 데이터사이언스대학원 이상원 교수님의데이터사이언스 응용을 위한 빅데이터 및 지식관리시스템 수업을학습을 목적으로 재구성하였습니다이전 시간에 배운 tree based index structure에서B+Tree에 대해서 좀 더 자세히 살펴보자우선은 inserting과 deletion이다 저번 시간에 DB index가 어떻게 값을 찾는지 배웠다각 data는 search key인 50000과뒤에 몇 번째 block의 몇 번째 slot에해당 record가 존재하는지를 의미한다 따라서 tree에서 검색해야할 key를 찾고해당 record를 찾아가는 구조를 갖고있다 따라서 data가 새로 insertion되너가 deletion될 때B+Tree의 경우 tree의 구조가 변경되게된다 B+Tree에 ..

강의/database 2025.05.25

[database] Tree-Structured Indexes (ISAM과 B+ Tree)

본 게시글은서울대학교 데이터사이언스대학원 이상원 교수님의데이터사이언스 응용을 위한 빅데이터 및 지식관리시스템 수업을학습을 목적으로 재구성하였습니다중간에 학회준비 때문에 급하게 올인한다고수업 내용 정리를 못했다..그래서 학회가 끝난 뒤에 몰아서 하려했는데양도 너무 많고 기억도 잘 안나서 쉽지 않은 것 같다 ㅎㅎ..그래도 어떧ㅎ게든 차근차근 해보려한다 이번 내용은 Database에서 index를 처리하는 법이고가장 대표적인 tree-structured indexes구조이다 RDBMS의 전체 시스템에서Files and Access Methods 부분에 해당한다 access method에는전체를 scanning하는full scanning과 index기반 method가 있다 본 내용을 통해 우리가 알아야하는..

강의/database 2025.05.25