程序访问数据库时,当查询出来的数据量特别大时,数据库驱动把加载到的数据全部加载到内存里,就有可能会导致内存溢出(OOM)。其实在数据库中提供了流式查询,允许把符合条件的数据分批一部分一部分地加载到内存中,可以有效避免OOM;本文主要介绍如何使用流式查询并对比普通查询进行性能测试。
使用JDBC的的方法设置为 或使用方法可以实现流式查询,在执行方法时,会通过数据库连接一条一条的返回,这样也不会大量占用客户端的内存。
PS:上面的例子中通过参数 来切换流式查询与普通查询,用于下面做测试对比。
创建一张测试表 进行测试,总数据量为 条,分别使用以下4个测试用例进行测试:
- 大数据量普通查询(27w条)
- 大数据量流式查询(27w条)
- 小数据量普通查询(10条)
- 小数据量流式查询(10条)
3.1.1. 查询耗时
27w 数据量用时 38 秒
3.1.2. 内存占用情况
使用将近 1G 内存
3.2.1. 查询耗时
27w 数据量用时 37 秒
3.2.2. 内存占用情况
由于是分批获取,所以内存在30-270m波动
3.3.1. 查询耗时
3.4.1. 查询耗时