lynx286 一失足成千古风流人物!
论坛CEO
![[Avatar]](/images/avatar/eccbc87e4b5ce2fe28308fd9f2a7baf3.jpg)
注册时间: 2008-04-22 11:52:00
文章: 652
来自: 四海为家
离线
|
在一般的聚合中, infa必须把所有的数据先读取到,然后分组"group by", 然后再做聚合计算.如果目标表很大, 那么这个读取所有数据的过程将可能成为整个流程的瓶颈. 用"sorted input" 选项后,infa认为数据源传来的数据都是根据"group by"的列分组排序好了的,所以他不需要将所有整个表全部读取进去后再做计算了.只要他找到一个新的分组,他就把当前的分组聚合计算了,并将结果传到下一组件, 让下一组件先跑起来. 这样能很大程度上提高性能.
|