南大通用数据库 GBase 8a 性能调优方法--数据排序

发布时间：2023年12月29日

数据在按某查询列进行排序后，则相同数据取值会集中存放在有限的数据包中，因此在以该列进行过滤时，利用智能索引命中的数据包会很少，不仅能降低IO量而且会提高压缩比。其最大好处是可以将智能索引的过滤效果发挥到最优，从而使整体查询性能大幅提升。在分析性数据库场景中，建议数据按照查询常用条件列进行排序。南大通用数据库的GBase 8a 大规模应用的电信行业中，通常按照手机号码进行查询，因此可按一定的时间间隔对数据按照手机号码进行排序，则在此时间范围内的手机号码有序，在进行查询时，便可通过智能索引特性提高查询性能。?

有序数据入库的性能优势：

提升智能索引对DC命中率
大幅度提升查询性能

注：DC是南大通用数据库 GBase 8a的基本存储单元

局部范围排序

数据库使用中，定期的增量数据入库，在每次增量数据批量入库前先对批量数据做排序后入库，使数据库数据在局部范围内有序，提高读取速度。

排序方式

外部排序：使用排序工具（psort）对数据文件进行排序，排序后使用加载工具加载至表内
库内排序：创建临时表，将未排序的数据先存储进临时表，再通过insert into select * … order by XXX方式将临时表内数据排序后插入正式表

排序方式适应场景

外部排序适合非实时加载的业务
库内排序适合实时加载业务

文章来源:https://blog.csdn.net/Mr_dar/article/details/135286563
本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若内容造成侵权/违法违规/事实不符，请联系我的编程经验分享网邮箱：chenni525@qq.com进行投诉反馈，一经查实，立即删除！