xiri
V2EX  ›  数据库

数据库查询时使用 group by(不加 order by)后返回的结果默认是按怎样的规则排序的?

  •  
  •   xiri · Jan 2, 2020 · 3334 views
    This topic created in 2333 days ago, the information mentioned may be changed or developed.

    我知道要让输出结果有序加个 order by 就行,但这里不考虑这一点,就是单纯的想知道 group by 后的输出默认是怎么确定顺序的。

    我这里在 oracle 11g 上进行测试,拿它默认的 scott 用户下的 emp 表举例,表中的 EMPNO 是主键。

    不加 group by

    直接使用select empno,ename from emp;,输出结果如下所示(单独取 EMPNO 或单独取 ENAME 输出的顺序都跟这里是一样的,这里把两列同时取出来方便下面的对比)。

         EMPNO ENAME
    ---------- --------------------
          7369 SMITH
          7499 ALLEN
          7521 WARD
          7566 JONES
          7654 MARTIN
          7698 BLAKE
          7782 CLARK
          7788 SCOTT
          7839 KING
          7844 TURNER
          7876 ADAMS
    
         EMPNO ENAME
    ---------- --------------------
          7900 JAMES
          7902 FORD
          7934 MILLER
    

    加 group by

    使用select ename from emp group by ename;(虽然这样 group by 毫无意义),结果如下。很明显顺序改变了,但是没发现任何规律,不是按字母排的,跟主键 EMPNO 也没有关系

    ENAME
    --------------------
    ALLEN
    JONES
    FORD
    CLARK
    MILLER
    SMITH
    WARD
    MARTIN
    SCOTT
    TURNER
    ADAMS
    
    ENAME
    --------------------
    BLAKE
    KING
    JAMES
    

    比较奇怪的一点是,使用select empno from emp group by empno;时的输出又是有序的,是因为结果都是数字?还是因为 EMPNO 是主键?

         EMPNO
    ----------
          7369
          7499
          7521
          7566
          7654
          7698
          7782
          7788
          7839
          7844
          7876
    
         EMPNO
    ----------
          7900
          7902
          7934
    

    搜索过程中看到这样一句话“数据库中的一个重要理论就是表中的记录是没有顺序的。 如果你不在查询中用 ORDER BY 指定顺序,则系统会‘随机’给出顺序”
    可我感觉就算是“随机”也还是要有一个基础规则的吧,毕竟上面的语句每一次查询输出的结果都是一样的。

    也看到有人说默认是按主键排的,但上面的结果很明显不符合,望大佬解答

    4 replies    2020-01-02 07:14:38 +08:00
    catror
        1
    catror  
       Jan 2, 2020 via Android   ❤️ 1
    看看执行计划
    xiri
        2
    xiri  
    OP
       Jan 2, 2020
    @catror 在执行计划里找到原因了,谢谢啦
    select empno 那一句实际上执行的是 sort group by,而 select ename 那一句执行的是 hash group by,这应该算是数据库自己的一种优化吧
    msg7086
        3
    msg7086  
       Jan 2, 2020
    数字归并应该是直接比数字快,所以 sort 后 group。文本归并的话用哈希表更快,扔进桶里再归并。换你自己写数据库的话最后其实也会写成这样的。

    至于随机结果,主要是指结果不固定顺序。如果数据库高兴,他可以按照硬盘或者内存中存储的顺序来排序,那也是一种归并算法。
    guanhui07
        4
    guanhui07  
       Jan 2, 2020
    执行计划
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   1226 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 36ms · UTC 23:55 · PVG 07:55 · LAX 16:55 · JFK 19:55
    ♥ Do have faith in what you're doing.