Innodb 作为 MySQL 中使用最为广泛的 事务型存储引擎,不仅在事务实现数据版本控制方面和其他存储引擎有一定的区别,其数据结构也是以非常有特点的方式存储的。
每个Innodb表的数据其实可以说就是以一个树型(B-Tree)结构存储的,表的数据和主键(Primary Key)共同组成了一个索引结构,也就是我们常说的Innodb的Clustered Primary Key。在这个Clustered Primary Key中,Leaf Nodes其实就是实际的表记录,我们常规理解上的索引信息全部在Branch Nodes上面。
除了Clustered Primary Key之外的其他所有索引在Innodb中被称为Secondary Index。Secondary Index就和普通的B-Tree索引差不多了,只不过在Secondary Index的所有Leaf Nodes上面同时包含了所指向数据记录的主键信息,而不是直接指向数据记录的位置信息。
所以,在 Innodb 中,如果主键值占用存储空间较大的话,会直接影响整个存储 Innodb 表所需要的物理空间,同时也会直接影响到 Innodb 的查询性能。
下面是画的一张 Innodb 索引基本结构图,包括 Primary Key 和 Secondary Index 两种索引的比较。
Related posts:

del.icio.us


用OpenOffice的Draw画的图,感觉效果不咋滴,唉…
根据wikipedia的说明,B-tree是所有的结点都存放数据,而不仅仅是叶结点的。http://en.wikipedia.org/wiki/B-tree#Node_structures
而且这个页面里:http://www.innodb.com/doc/innodb_plugin-1.0/innodb-row-format.html 也有说到:The essential idea is that the nodes of the B-tree contain, for each primary key value (whether user-specified or generated or chosen by the system), the values of the remaining columns of the row as well as the key.
这里也没有说到叶结点。不过我没有看过源码,不知是否理解正确。
high performance mysql (http://books.google.com/books?id=BL0NNoFPuAQC&pg=PA97&lpg=PA97&dq=innodb+b-tree+leaf+node+store+data&source=bl&ots=CNTKAwsIaU&sig=4OpA0xAfiQfT9mzJDVyJyNYw_BQ&hl=en&ei=xfMDSo3sEpzI6wOYkIWaAw&sa=X&oi=book_result&ct=result&resnum=1#PPA96,M1) 第二版有说到,原来Innodb用的是B+ tree
@xlambda
这里的B-Tree索引只是数据库索引结构中索引类型的统称,不要照搬数据结构的理论。实际上,各个数据库所实现的B-Tree都是有其自身特点的,而且实际上都可以称之为B+ Tree。