数据库内核月报 - 2015 / 06-MySQL · TokuDB · TokuDB数据文件大小计算

想要查看TokuDB某个表占了多少磁盘空间,目前还没有太好的方法。
如果你使用’show table status’命令,得到的结果只会让你更迷茫:

           Name: toku
         Engine: TokuDB
        Version: 10
     Row_format: tokudb_zlib
           Rows: 28874059
 Avg_row_length: 30
    Data_length: 868159449
Max_data_length: 9223372036854775807
   Index_length: 2099497463
      Data_free: 0

我们来看看test_toku表磁盘文件大小:

$du -b _test_toku*
124427776       _test_toku_A_B.tokudb  --KEY(A,B)索引数据文件
215959552       _test_toku_B_C.tokudb  --KEY(B,C)索引数据文件
149504000       _test_toku_main.tokudb --主数据文件

Data_length和Index_length都对不上,而且差的还不是一点,真头疼,总不能每次都要去服务器上du吧?其实,我们可以通过information_schema.TokuDB_fractal_tree_info得到:

mysql> select * from TokuDB_fractal_tree_info where table_name='test_toku'\G;
*************************** 1. row ***************************
        dictionary_name: ./test/test_toku_A_B
     internal_file_name: _test_toku_A_B.tokudb
bt_num_blocks_allocated: 449
   bt_num_blocks_in_use: 449
      bt_size_allocated: 124416093
         bt_size_in_use: 123563101
           table_schema: test
             table_name: toku
  table_dictionary_name: key-test_toku_A_B
*************************** 2. row ***************************
        dictionary_name: ./test/test_toku_B_C
     internal_file_name: ./_test_toku_B_C.tokudb
bt_num_blocks_allocated: 612
   bt_num_blocks_in_use: 612
      bt_size_allocated: 215945353
         bt_size_in_use: 214784137
           table_schema: test
             table_name: toku
  table_dictionary_name: key-test_toku_B_C
*************************** 3. row ***************************
        dictionary_name: ./test/test_toku-main
     internal_file_name: ./_test_toku_main.tokudb
bt_num_blocks_allocated: 486
   bt_num_blocks_in_use: 486
      bt_size_allocated: 149491745
         bt_size_in_use: 148580897
           table_schema: test
             table_name: toku
  table_dictionary_name: main

bt_size_allocated字段是TokuDB内部维护当前数据文件最后分配的offset,跟数据文件磁盘大小基本一致。

再回到刚才的问题:show table status里Data_length和Index_length为什么跟实际大小出入这么大呢?

ha_tokudb::info()里:

stats.data_file_length = dict_stats.bt_dsize;

bt_dsize的值来自toku_ft_stat64:

bt_dsize = ft->in_memory_stats.numbytes;

in_memory_stats.numbytes是TokuDB在内存中维护的一个变量,用于记录变更数据的增量大小,每次checkpoint的时候持久化到数据文件(包括索引文件)的header里,所以是个出入比较大的参考变量(无压缩),已不能通过此变量来反应表文件的真实大小。

这么不爽的地方,我们(RDS MySQL)已准备好patch把它修掉,让show table status可以拿到TokuDB表文件的真实大小。

时间: 2024-10-01 07:20:02

数据库内核月报 - 2015 / 06-MySQL · TokuDB · TokuDB数据文件大小计算的相关文章

阿里数据库内核月报:2015年06月

# 01 MySQL · 引擎特性 · InnoDB 崩溃恢复过程 # 02 MySQL · 捉虫动态 · 唯一键约束失效 # 03 MySQL · 捉虫动态 · ALTER IGNORE TABLE导致主备不一致 # 04 MySQL · 答疑解惑 · MySQL Sort 分页 # 05 MySQL · 答疑解惑 · binlog event 中的 error code # 06 PgSQL · 功能分析 · Listen/Notify 功能 # 07 MySQL · 捉虫动态 · 任性的 

阿里数据库内核月报合辑

阿里数据库内核月报:2017年05月 阿里数据库内核月报:2017年04月 阿里数据库内核月报:2017年03月 阿里数据库内核月报:2017年02月 阿里数据库内核月报:2017年01月 阿里数据库内核月报:2016年12月 阿里数据库内核月报:2016年11月 阿里数据库内核月报:2016年10月 阿里数据库内核月报:2016年09月 阿里数据库内核月报:2016年08月 阿里数据库内核月报:2016年07月 阿里数据库内核月报:2016年06月 阿里数据库内核月报:2016年05月 阿里数

数据库内核月报 - 2015 / 11-MySQL · 社区见闻 · OOW 2015 总结 MySQL 篇

前言 && 感想 本年度Oralce Open World会议从十月25号到29号,在美国旧金山举行.数万来自全球各地的从业人员涌入Moscone Center,见证一年一度的Oracle生态系统盛事. 本次OOW2015的主题都是围绕在Oracle Cloud,云服务应该是Oracle之后的发力点.几场Oracle CTO(前Oracle CEO)Larry的主题演讲也围绕cloud,详细阐述了Oracle Cloud的设计原则,及相关的云产品,其目标直指Amazon和Microsoft

阿里数据库内核月报:2016年06月

# 01 MySQL · 特性分析 · innodb 锁分裂继承与迁移 # 02 MySQL · 特性分析 ·MySQL 5.7新特性系列二 # 03 PgSQL · 实战经验 · 如何预测Freeze IO风暴 # 04 GPDB · 特性分析· Filespace和Tablespace # 05 MariaDB · 新特性 · 窗口函数 # 06 MySQL · TokuDB · checkpoint过程 # 07 MySQL · 特性分析 · 内部临时表 # 08 MySQL · 最佳实践

阿里数据库内核月报:2015年11月

# 01 MySQL · 社区见闻 · OOW 2015 总结 MySQL 篇 # 02 MySQL · 特性分析 · Statement Digest # 03 PgSQL · 答疑解惑 · PostgreSQL 用户组权限管理 # 04 MySQL · 特性分析 · MDL 实现分析 # 05 PgSQL · 特性分析 · full page write 机制 # 06 MySQL · 捉虫动态 · MySQL 外键异常分析 # 07 MySQL · 答疑解惑 · MySQL 优化器 ran

阿里数据库内核月报:2015年05月

# 01 MySQL · 引擎特性 · InnoDB redo log漫游 # 02 MySQL · 专家投稿 · MySQL数据库SYS CPU高的可能性分析 # 03 MySQL · 捉虫动态 · 5.6 与 5.5 InnoDB 不兼容导致 crash # 04 MySQL · 答疑解惑 · InnoDB 预读 VS Oracle 多块读 # 05 PgSQL · 社区动态 · 9.5 新功能BRIN索引 # 06 MySQL · 捉虫动态 · MySQL DDL BUG # 07 MyS

阿里数据库内核月报:2017年06月

#01 MySQL · 源码分析 · Tokudb序列化和反序列化过程 #02 PgSQL · 应用案例 · HTAP视角,数据与计算的生态融合 #03 MySQL · 引擎特性 · 从节点可更新机制 #04 PgSQL · 特性分析 · 数据库崩溃恢复(下) #05 MySQL · 捉虫动态 · InnoDB crash #06 MSSQL · 实现分析 · SQL Server实现审计日志的方案探索 #07 MySQL · 源码分析 · InnoDB Repeatable Read隔离级别之

阿里数据库内核月报:2015年04月

# 01 MySQL · 引擎特性 · InnoDB undo log 漫游 # 02 TokuDB · 产品新闻 · RDS TokuDB小手册 # 03 TokuDB · 特性分析 · 行锁(row-lock)与区间锁(range-lock) # 04 PgSQL · 社区动态 · 说一说PgSQL 9.4.1中的那些安全补丁 # 05 MySQL · 捉虫动态 · 连接断开导致XA事务丢失 # 06 MySQL · 捉虫动态 · GTID下slave_net_timeout值太小问题 #

阿里数据库内核月报:2015年07月

# 01 MySQL · 引擎特性 · Innodb change buffer介绍 # 02 MySQL · TokuDB · TokuDB Checkpoint机制 # 03 PgSQL · 特性分析 · 时间线解析 # 04 PgSQL · 功能分析 · PostGIS 在 O2O应用中的优势 # 05 MySQL · 引擎特性 · InnoDB index lock前世今生 # 06 MySQL · 社区动态 · MySQL内存分配支持NUMA # 07 MySQL · 答疑解惑 · 外

阿里数据库内核月报:2015年12月

# 01 MySQL · 引擎特性 · InnoDB 事务子系统介绍 # 02 PgSQL · 特性介绍 · 全文搜索介绍 # 03 MongoDB · 捉虫动态 · Kill Hang问题排查记录 # 04 MySQL · 参数优化 ·RDS MySQL参数调优最佳实践 # 05 PgSQL · 特性分析 · 备库激活过程分析 # 06 MySQL · TokuDB · 让Hot Backup更完美 # 07 PgSQL · 答疑解惑 · 表膨胀 # 08 MySQL · 特性分析 · Ind