最近的文章

数据库行业学习 Day 009:现代数据库行业全景收束
·10149 字·21 分钟
收束现代数据库行业全景专题,回看 Day 001 到 Day 008 的传统 OLTP、LSM、分布式 SQL、云原生存算分离、OLAP、搜索向量和 Lakehouse 预览,把共同问题收敛到 storage-first 框架,并明确 Topic 2 传统 OLTP 与存储基础的后续学习顺序。

数据库行业学习 Day 008:Lakehouse 与对象存储表格式预览
·10068 字·21 分钟
预览 Lakehouse 与对象存储表格式专题,说明为什么在搜索、向量与生态补丁之后,需要单独学习 Iceberg、Delta Lake、Paimon 这类开放表格式,以及 object file、metadata file、manifest、snapshot、transaction log、delete file、deletion vector、compaction、schema evolution、多引擎共享和 catalog 的 storage-first 比较框架。

数据库行业学习 Day 007:搜索、向量与生态补丁预览
·9730 字·20 分钟
预览搜索、向量与生态补丁专题,说明为什么在 OLAP、列存与实时分析之后,需要单独学习倒排索引、搜索 segment、向量索引、混合检索、异步索引构建、删除回收、主库一致性和 PostgreSQL extension 生态边界,并为后续 Lucene/Elasticsearch、Milvus、pgvector 与 PostgreSQL extension 生态的 storage-first 比较建立问题框架。

数据库行业学习 Day 006:OLAP、列存与实时分析预览
·10718 字·22 分钟
预览 OLAP、列存与实时分析专题,说明为什么在 OLTP、LSM、分布式 SQL 和云原生存算分离之后,需要单独学习列存、segment/part/rowset、实时导入、后台 merge、更新删除、物化视图、MPP 执行和面向用户的低延迟分析,并为后续 ClickHouse、Apache Doris、StarRocks、DuckDB、Druid、Pinot 的 storage-first 比较建立问题框架。

数据库行业学习 Day 005:云原生存算分离数据库预览
·9750 字·20 分钟
预览云原生存算分离数据库专题,说明为什么 shared-nothing 分布式 SQL 之后还会出现 shared storage、remote page、log service、page server、object storage、serverless compute 和 multi-cluster shared-data 架构,并为后续 Aurora、Neon、PolarDB、Azure SQL Hyperscale、Snowflake、BigQuery 的 storage-first 比较建立问题框架。


