Apache Hawq--优化笔记

zsy001 · 发表于 2018-11-17 09:15:14

优化工作：

数据表分区尽量采用数值类型字段，如Date类型转换为距离1970-01-01的绝对天数。
SQL语法：尽量避免between and 的使用(查看查询计划，影响不大)，多个子查询时尽量使用CTE（with v as…）查询。
根据表的数据量以及大多数查询的类型设计数据分布策略（随机分布or哈希分布）以及bucketnum参数设置。
冷热数据存储到不同schema相同的表中，尽量减小热数据所在表的分区数(通过动态增加和删除分区)。
根据SQL所需的资源设置参数hawq_rm_stat_nvseg和hawq_rm_vseg_memory。
每天定时执行“vacuum table_name;analyze table_name;”获取每个表的统计信息，以便生成最优的查询计划。
通过执行”vacuum pg_class; reindex table pg_class”源数据表pg_class，减少元数据记录数。
执行分析查询计划，找到SQL的性能瓶颈，有针对性的优化。
采取措施尽量提升查询数据的本地化比率。

实际测试
　　数据表采用随机分布： bucketnum=9

　　1.设置用于查询的virtual segment数量
　　语句级别：
　　

SET hawq_rm_stmt_nvseg=10;　　
SET hawq_rm_stmt_vseg_memory='256mb';
　　

禁用语句级别　　

SET hawq_rm_stmt_nvseg=0;

　　

set hawq_rm_nvseg_perquery_perseg_limit=10;　　
set hawq_rm_nvseg_perquery_limit=512;
　　

　　通过hawq_rm_nvseg_perquery_limit和hawq_rm_nvseg_perquery_perseg_limit参数可以调整查询执行时使用的virtual segments的数量
　　2.哈希分布表的相关参数：

　　default_hash_table_bucket_number
　　hawq_rm_nvseg_perquery_limit
　　hawq_rm_nvseg_perquery_perseg_limit

　　3.可以使用pg_partitions视图查找有关分区设计的信息。例如，查看销售表的分区设计：
　　

SELECT partitionboundary, partitiontablename, partitionname, partitionlevel, partitionrank　　
FROM pg_partitions
　　
WHERE tablename='ins_wifi_dates';
　　

　　下表和视图显示有关分区表的信息。

pg_partition - 跟踪分区表及其继承关系。
pg_partition_templates - 显示使用子分区模板创建的子分区。
pg_partition_columns - 显示分区设计中使用的分区键列。

　　4.查看表的segment file分布
　　

SELECT gpr.tablespace_oid,　　gpr.database_oid,
　　gpf.relfilenode_oid,
　　gpf.segment_file_num,
　　'/hawq_data/'||gpr.tablespace_oid||'/'||gpr.database_oid||'/'||gpf.relfilenode_oid ||'/'||gpf.segment_file_num as path,
　　pg_class.relname,
　　gpr.persistent_state,
　　gpf.persistent_state
　　
FROM gp_persistent_relfile_node gpf,pg_class, gp_persistent_relation_node gpr
　　
WHERE gpf.relfilenode_oid = pg_class.relfilenode
　　AND gpr.relfilenode_oid = pg_class.relfilenode
　　AND pg_class.relname='person';
　　

SELECT distinct gpr.tablespace_oid,　　gpr.database_oid,
　　gpf.relfilenode_oid,
　　pg_class.relname,
　　gpr.persistent_state,
　　gpf.persistent_state
　　
FROM gp_persistent_relfile_node gpf,pg_class, gp_persistent_relation_node gpr
　　
WHERE gpf.relfilenode_oid = pg_class.relfilenode
　　AND gpr.relfilenode_oid = pg_class.relfilenode
　　AND pg_class.relname like 'person_%' order by pg_class.relname ;
　　

　　#schema
　　

SELECT gpr.tablespace_oid,　　gpr.database_oid,
　　gpf.relfilenode_oid,
　　gpf.segment_file_num,
　　'/hawq_data/'||gpr.tablespace_oid||'/'||gpr.database_oid||'/'||gpf.relfilenode_oid ||'/'||gpf.segment_file_num as path,
　　pgn.nspname AS schemaname,
　　pg_class.relname AS tablename,
　　gpr.persistent_state,
　　gpf.persistent_state
　　
FROM gp_persistent_relfile_node gpf,pg_class, gp_persistent_relation_node gpr, pg_namespace pgn
　　
WHERE gpf.relfilenode_oid = pg_class.relfilenode
　　AND gpr.relfilenode_oid = pg_class.relfilenode
　　AND pgn.oid = pg_class.relnamespace
　　AND pg_class.relname='t_wifi_terminal_chrs_1_prt_1';
　　

　　经过测试发现：
　　数据在hdfs中的存储位置为： tablespace/database/table/segfile
　　分区表A目录中有默认哈希桶数目的segfile，但大小都为0，而其字表（如a1）目录中有默认哈希桶数目的segfile，且有文件。
　　查看表大小：
　　

select sotdsize from hawq_toolkit.hawq_size_of_table_disk where sotdtablename='t_net_access_log';　　

　　5.使用explain 或者 explain analyze 查看查询计划时，指定
　　

set gp_log_dynamic_partition_pruning=on;　　

　　可以显示扫描的分区名称。
　　 Explain analyze和explain语句不同，explain analyze会真正执行查询，并得到查询执行过程中的统计数据。explain analyze的结果对了解查询执行的具体情况以及了解查询性能问题产生的原因有很大帮助。
　　

SELECT * FROM pg_stats  WHERE tablename = 'inventory';　　

　　#查询会话信息
　　

select * from pg_stat_activity;　　

select application_name, datname, procpid, sess_id, usename, waiting, client_addr, client_port, waiting_resource,  query_start, backend_start, xact_start from pg_stat_activity;　　

select application_name, datname, procpid, sess_id, usename, waiting, client_addr, client_port, waiting_resource, current_query, query_start, backend_start, xact_start from pg_stat_activity;　　

select application_name, datname, procpid, sess_id, usename, waiting, client_addr, client_port, waiting_resource,  query_start, backend_start, xact_start from pg_stat_activity where application_name='psql' and current_query'';　　

　　datname表示数据库名
　　procpid表示当前的SQL对应的PID
　　query_start表示SQL执行开始时间
　　current_query表示当前执行的SQL语句
　　waiting表示是否正在执行，t表示正在执行，f表示已经执行完成
　　client_addr表示客户端IP地址
　　284933
　　kill有两种方式，第一种是：
　　

SELECT pg_cancel_backend(PID);　　

　　这种方式只能kill select查询，对update、delete 及DML不生效)
　　第二种是：
　　

SELECT pg_terminate_backend(PID);　　

　　这种可以kill掉各种操作(select、update、delete、drop等)操作
　　在pg_cancel_backend()下，session还在，事物回退;
　　在pg_terminate_backend()操作后，session消失，事物回退。
　　如果在某些时候pg_terminate_backend()不能杀死session，那么可以在os层面，直接kill -9 pid
　　

select * from pg_resqueue_status;　　

　　--资源队列
　　

SELECT * FROM dump_resource_manager_status(2);　　

　　--Segment
　　

SELECT * FROM dump_resource_manager_status(3);　　

SELECT>
SELECT * FROM pg_stats  WHERE tablename = 'ins_wifi_dates';　　

SELECT gp_segment_id, COUNT(*)　　
FROM ins_wifi_dates
　　
GROUP BY gp_segment_id
　　
ORDER BY gp_segment_id
　　

set gp_select_invisible=true;　　
select count(*) from pg_class;
　　
set gp_select_invisible=false;
　　
select count(*) from pg_class;
　　

　　
vacuum pg_class;
　　
reindex table pg_class;
　　

　　日志：
　　set
　　表重分布：
　　

ALTER TABLE sales SET WITH (REORGANIZE=TRUE);　　

　　检查未analyze的表：
　　

select * from hawq_toolkit.hawq_stats_missing;　　

　　http://hawq.incubator.apache.org/docs/userguide/2.2.0.0-incubating/reference/toolkit/hawq_toolkit.html#topic46
　　HAWQ查看表大小：  //不包含分区表
　　

SELECT>
toast, sotdadditionalsize AS other　　
FROM hawq_toolkit.hawq_size_of_table_disk AS sotd, pg_catalog.pg_class
　　
WHERE sotd.sotdoid=pg_class.oid and pg_class.relname='t_wifi_terminal_chrs'
　　
ORDER BY>　　

　　hawq_size_of_partition_and_indexes_disk

　　

select>
ORDER BY sopaidpartitionoid;
　　

select>
group by>　　

　　内存/vore比值
　　

[root@master2 pg_log]# cat hawq-2017-10-17_224829.csv　　
2017-10-17 18:21:57.319620 CST,,,p237647,th217192736,,,,0,con4,,seg-10000,,,,,"LOG","00000","Resource manager chooses ratio 5120 MB per core as cluster level memory to core ratio, there are 2304 MB memory 6 CORE resource unable to be utilized.",,,,,,,0,,"resourcepool.c",4641,
　　
2017-10-17 18:21:57.319668 CST,,,p237647,th217192736,,,,0,con4,,seg-10000,,,,,"LOG","00000","Resource manager adjusts segment hd4.bigdata original global resource manager resource capacity from (154368 MB, 32 CORE) to (153600 MB, 30 CORE)",,,,,,,0,,"resourcepool.c",4787,
　　
2017-10-17 18:21:57.319716 CST,,,p237647,th217192736,,,,0,con4,,seg-10000,,,,,"LOG","00000","Resource manager adjusts segment hd1.bigdata original global resource manager resource capacity from (154368 MB, 32 CORE) to (153600 MB, 30 CORE)",,,,,,,0,,"resourcepool.c",4787,
　　
2017-10-17 18:21:57.319762 CST,,,p237647,th217192736,,,,0,con4,,seg-10000,,,,,"LOG","00000","Resource manager adjusts segment hd2.bigdata original global resource manager resource capacity from (154368 MB, 32 CORE) to (153600 MB, 30 CORE)",,,,,,,0,,"resourcepool.c",4787,

账号		自动登录	找回密码
密码			立即注册

大疆运维招人啦，

C++ :try 语句块和异常处理

C++的多态

Red Hat RHCE 8 (EX294) Cert Guide

Java/C++ 区别：看完这一篇，就够用！

别再用过时库了！这 13 个顶级 C++ 库才是

c++ size_t 和 int 的区别

[经验分享] Apache Hawq--优化笔记

浏览过的版块

扫码加入运维网微信交流群