硬件及操作系统监控

  1. 方法: 检查操作系统,网络以及磁盘状态,以及磁盘剩余空间。
  2. 推荐频率 : 每隔30分钟
  3. 发现问题解决方法

如果发现操作系统,网络及磁盘出现异常,需要修复问题,然后重新加入该节点。

如果磁盘剩余空间不足30%的话,需要准备系统扩容。否则容易出现磁盘空间不足情况。因为有些SQL在运行过程中需要使用临时存储空间来存放中间结果。

如果发现性能问题,建议运行hawq checkperf命令来查看性能问题。例如下面的硬件配置,

  • 12 15K RPM SAS盘,2 RAID卡, RAID 0
  • 2 dual-port 10Gb NICs (NIC bonding)

正常情况下,有如下性能指标:

  • I/O 读写: 2GB/s
  • 网络性能:2GB/s

统计信息维护

  1. 方法: 通过执行下面的命令检查没有进行Analyze的表,即没有统计信息的表,没有搜集统计信息可能产生不优化的查询计划,带来性能问题。
1
SELECT * FROM hawq_toolkit.hawq_stats_missing;
  1. 推荐频率 : 每天
  2. 发现问题解决方法

如果发现有些表没有统计数据,运行Analyze命令收集统计数据。