# 存储引擎

我们都知道 MySQL 拥有多种存储引擎。MEMORY、MRG_MYISAM、
CSV、FEDERATED、PERFORMANCE_SCHEMA、MyISAM、InnoDB、BLACKHOLE、ARCHIVE 等，但其中最常用的就是 MyISAM 和 InnoDB。

# MyISAM 引擎

在 MySQL 5.5 之前的版本，MyISAM 是默认的存储引擎。读性能良好，拥有较高的查询速度。

不支持行级锁，只支持表级锁。因为 MyISAM 会一次性获得 SQL 所需的全部锁 (这句话包含的信息很多)，所以不会出现死锁，这少了很多麻烦事。当 MyISAM 在执行 select/insert/update/delete 语句时，会自动给涉及的表加读锁 (共享)，在执行对表做结构变更操作时，会加写锁 (独占)。

当写锁和读锁同时被申请时，优先获得写锁。读锁之间不互斥，读写锁之间、写锁之间是互斥的，通俗的讲，读操作不会阻塞其他线程对同一表的读请求，但会阻塞对同一表的写请求，而写操作会全部阻塞。由于写锁可能会一直阻塞读锁，所以这正是表级锁发生锁冲突概率最高的原因。

本篇文章主要介绍 InnoDB 的存储，就不对其它知识点做过多拓展。

总结： 不支持行级锁、不支持事物、支持表级锁、读性能较高。

# InnoDB 引擎

从 MySQL 5.5 版本开始，官方选择 InnoDB 作为 MySQL 默认的存储引擎。既支持行级锁，也支持表级锁，但默认情况下是采用行级锁。当 InnoDB 在执行 select 语句时，不会加任何锁，在执行 insert/update/delete 操作时，会自动给涉及数据行加排它锁。

InnoDB 支持外键，包含外键的 InnoDB 表转为 MyISAM 会失败。InnoDB 最大的不同就是支持事物，所有的存储引擎中只有 InnoDB 是事务性存储引擎，对每一条 SQL 语言都默认封装成事务自动提交。

而且，InnoDB 支持 MVCC。目前，随着行业发展项目数据的吞吐量越来越大，支持 MVCC 对于高并发是一个很大的优势。

总结： 支持行级锁、支持表级锁、支持事物。

更直观的比较：

综上所述，两者各有各的优势，如何选择应该看自己项目的场景。如果表中绝大多数都只是读查询，可以考虑 MyISAM，如果既有读也有写，使用 InnoDB 效果更好。

# 页 (Page Structure)

大学学习操作系统的时候，我们知道 "页" 是操作系统从磁盘取数据到内存的基本单位，默认为 4KB。虽然部分处理器会使用 8KB、16KB 或者 64KB 作为默认的页面大小，但是 4KB 的页面仍然是操作系统默认内存页配置的主流。

CPU 在做指令操作时，从目标地址取数据到内存需要一次 IO 操作，多次操作数据就要相应发生多次 IO。若每次取的数据都很小 (远小于 4KB)，为减少 IO 操作每次直接取一页 (4KB)。

# InnoDB 中的 “页”

在 MySQL 中，select 指令根据 where 字段查找数据时，表中每行数据都要被读到内存中依次与之比较，有多少条数据就要发生多少次 IO 操作。这样资源消耗太大，于是 InnoDB 借鉴了操作系统对内存的管理，引入了 “Page Structure” 来减少 IO 操作。

InnoDB 采用” 页 “的形式存储用户数据，有时也被称为 “块”。MySQL 默认的非压缩数据页为 16KB，0~16KB 偏移量即为 0 号数据页，16KB-32KB 的为 1 号数据页，依次类推。

从 MySQL 官网可以了解到，InnoDB 的页结构包含以下内容：

因为 Page 的内部结构很复杂，阿浪只能带着大家从宏观上浅层了解，感兴趣的同学可以对着官方文档深入研究：
https://dev.mysql.com/doc/internals/en/innodb-page-structure.html

Fil Header
fil header 用来描述页信息。记录了页的空间 ID，区分了记录在同一文件内所属不同表空间的数据页，并且提供指针连接各个数据页。
其中最重要的是 fil_page_prev 和 fil_page_next 两个指针，当表数据量达到一定规模时，就会生成大量的数据页，这时候需要指针通过双向链表的形式维护数据页的连接性和有序性。
Page Header
用于记录页内的状态信息。分配新页的信息、页内第一条数据地址等。
User Records
表内有多少条数据，UserRecords 就要存储多少条记录。若是主键，存储完整的表数据，并根据主键升序排列来提升检索效率。若是非主键索引，则根据索引字段排序。
Page Directory
UserRecords 内可能是一个很长的单链表，因为长链表不支持随机访问，检索时间随着数据规模的增长而增长。所以 PageDirectory 以组划分链表记录用户数据的相对位置，默认以 6 条数据为一组。
当查询数据时，直接与 Page Directory 内的数据比较快速锁定数据范围，然后进入 UserRecodes 获取完整数据。