-- 创建表 --
create table t001 {
siteid int default '0',
citycode smallint,
username varchar(32) default '',
-- 预聚合 --
pv bigint sum default '0'
}
-- 预处理用的,插入相同siteid, citycode, username的记录不会新增行,而将sum的pv增加 --
aggregate key(siteid, citycode, username)
-- siteid按照hash分桶,分10个桶 --
distributed by hash(siteid) buckets 10
-- 副本数量是1,partition是1个 --
properties("replication_num" = "1");
insert into t001 values (1, 1, 'user1', 10);
insert into t001 values (1, 1, 'user1', 20);
insert into t001 values (1, 1, 'user1', 30);
的结果是
siteid | citycode | userid | pv |
---|---|---|---|
1 | 1 | user1 | 60 |