数据库

2026

数据库行业学习 Day 011：PostgreSQL OLTP 存储系统

2026-06-10·16913 字·34 分钟

数据库 Database PostgreSQL OLTP Storage WAL MVCC VACUUM

深入 PostgreSQL 作为传统 OLTP 基线的存储系统：先补齐 relation、heap、page、tuple、TID、WAL、LSN、snapshot、VACUUM、HOT、catalog 和 extension 等专有名词，再用 Mermaid 路径图拆解写入、读取、MVCC、回收、日志保留和生态边界。

数据库行业学习 Day 010：传统 OLTP 与存储基础开篇

2026-06-09·7434 字·15 分钟

数据库 Database OLTP Storage WAL MVCC

开启 Topic 2：传统 OLTP 与存储基础，建立 PostgreSQL、MySQL/InnoDB、SQLite 的 storage-first 比较框架，并为后续系统文章列出源码入口、问题清单和 badcase 观察点。

数据库行业学习 Day 009：现代数据库行业全景收束

2026-06-03·10149 字·21 分钟

数据库 Database Storage Distributed Systems Research

收束现代数据库行业全景专题，回看 Day 001 到 Day 008 的传统 OLTP、LSM、分布式 SQL、云原生存算分离、OLAP、搜索向量和 Lakehouse 预览，把共同问题收敛到 storage-first 框架，并明确 Topic 2 传统 OLTP 与存储基础的后续学习顺序。

数据库行业学习 Day 008：Lakehouse 与对象存储表格式预览

2026-06-02·10068 字·21 分钟

数据库 Database Lakehouse Object Storage Iceberg Delta Lake Paimon

预览 Lakehouse 与对象存储表格式专题，说明为什么在搜索、向量与生态补丁之后，需要单独学习 Iceberg、Delta Lake、Paimon 这类开放表格式，以及 object file、metadata file、manifest、snapshot、transaction log、delete file、deletion vector、compaction、schema evolution、多引擎共享和 catalog 的 storage-first 比较框架。

数据库行业学习 Day 007：搜索、向量与生态补丁预览

2026-06-01·9730 字·20 分钟

数据库 Database Search Vector Database PostgreSQL Extension

预览搜索、向量与生态补丁专题，说明为什么在 OLAP、列存与实时分析之后，需要单独学习倒排索引、搜索 segment、向量索引、混合检索、异步索引构建、删除回收、主库一致性和 PostgreSQL extension 生态边界，并为后续 Lucene/Elasticsearch、Milvus、pgvector 与 PostgreSQL extension 生态的 storage-first 比较建立问题框架。

数据库行业学习 Day 006：OLAP、列存与实时分析预览

2026-05-31·10718 字·22 分钟

数据库 Database OLAP Columnar Storage Realtime Analytics

预览 OLAP、列存与实时分析专题，说明为什么在 OLTP、LSM、分布式 SQL 和云原生存算分离之后，需要单独学习列存、segment/part/rowset、实时导入、后台 merge、更新删除、物化视图、MPP 执行和面向用户的低延迟分析，并为后续 ClickHouse、Apache Doris、StarRocks、DuckDB、Druid、Pinot 的 storage-first 比较建立问题框架。

数据库行业学习 Day 005：云原生存算分离数据库预览

2026-05-30·9750 字·20 分钟

数据库 Database Cloud Native Database Storage Serverless

预览云原生存算分离数据库专题，说明为什么 shared-nothing 分布式 SQL 之后还会出现 shared storage、remote page、log service、page server、object storage、serverless compute 和 multi-cluster shared-data 架构，并为后续 Aurora、Neon、PolarDB、Azure SQL Hyperscale、Snowflake、BigQuery 的 storage-first 比较建立问题框架。

数据库行业学习 Day 004：分布式 SQL 与 shared-nothing 架构预览

2026-05-29·9621 字·20 分钟

数据库 Database Distributed SQL Storage Raft Paxos

预览分布式 SQL 与 shared-nothing 架构专题，说明为什么单机 OLTP 和嵌入式 LSM 之后需要把 SQL、事务、索引、复制和元数据拆到 range/tablet/region、Raft/Paxos、timestamp 和 metadata service 上，并建立后续 TiDB、CockroachDB、OceanBase、YugabyteDB、Spanner 的 storage-first 比较框架。

数据库行业学习 Day 003：LSM 与嵌入式存储引擎预览

2026-05-28·7810 字·16 分钟

数据库 Database LSM Storage Rocksdb BadgerDB Pebble

预览 LSM 与嵌入式存储引擎专题，说明为什么 B+Tree/page update 之外还需要 WAL、memtable、SST 与 compaction 这条路线，并为后续 RocksDB、BadgerDB、Pebble 的系统文章建立 storage-first 比较框架。

RocksDB 学习笔记 Day 022：SST File Ingestion

2026-05-26·8977 字·18 分钟

数据库 Rocksdb Database Storage SST Ingestion BulkLoad

从 SstFileWriter、DBImpl::IngestExternalFiles 和 ExternalSstFileIngestionJob 出发，理解 RocksDB 如何把外部 SST 文件校验、搬入 DB 目录、分配 level 与 global seqno，并通过 MANIFEST 安装到当前 LSM。

↑