02-08 08:44
Notice
Recent Posts
Recent Comments
Link
«   2025/02   »
1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28
Archives
관리 메뉴

기록을 합시다.

[SQL] ORACLE SQL 공부 -4- 본문

공부/DB

[SQL] ORACLE SQL 공부 -4-

울집고양이세마리 2023. 8. 6. 22:30

입사 첫 주라 정신이 이상하게 없어서 공부를 못 했다. ㄱ=.. 정신 차려야 할텐데..
하루에 1~2시간이라도 짬 내서 공부해야 할 것 같다..


건수 출력하기(COUNT)

SELECT COUNT(empno)
    FROM emp;
COUNT(EMPNO)
------------
          14
  • COUNT 함수는 NULL 값을 무시한다.
SELECT COUNT(COMM)
    FROM emp;
COUNT(COMM)
-----------
          4 

데이터 분석 함수로 순위 출력하기 (RANK)

SELECT ename, job, sal, RANK() over (ORDER BY sal DESC) 순위
    FROM emp
    WHERE job in ('ANALYST', 'MANAGER');
ENAME      JOB              SAL         순위
---------- --------- ---------- ----------
FORD       ANALYST         3000          1
SCOTT      ANALYST         3000          1
JONES      MANAGER         2975          3
BLAKE      MANAGER         2850          4
CLARK      MANAGER         2450          5
  • RANK()는 순위를 출력하는 데이터 분석 함수
  • RANK() 뒤에 OVER 다음에 나오는 괄호 안에 출력하고 싶은 데이터를 정렬하는 SQL 문장을 넣으면 그 칼럼 값에 대한 데이터의 순위가 출력된다.
  • 위의 예제에서는 월급이 높은 사원부터 출력되게 ORDER BY 절을 사용하였다.
  • 출력된 순위에 1등이 2명이라면, 3등이 바로 출력되는데 이 때, 3등이 아니라 2등을 출력하기 위해서는 DENSE_RANK 함수를 사용해야 한다.
SELECT ename, job, sal, DENSE_RANK() over (ORDER BY sal DESC) 순위
    FROM emp
    WHERE job in ('ANALYST', 'MANAGER');
ENAME      JOB              SAL         순위
---------- --------- ---------- ----------
FORD       ANALYST         3000          1
SCOTT      ANALYST         3000          1
JONES      MANAGER         2975          2
BLAKE      MANAGER         2850          3
CLARK      MANAGER         2450          4

  • 아래는 직업별로 월급이 높은 순위를 부여해서 각각 출력
SELECT ename, sal, job, RANK() over (PARTITION BY job ORDER BY sal DESC) as 순위
    FROM emp;
ENAME             SAL JOB               순위
---------- ---------- --------- ----------
SCOTT            3000 ANALYST            1
FORD             3000 ANALYST            1
MILLER           1300 CLERK              1
ADAMS            1100 CLERK              2
JAMES             950 CLERK              3
SMITH             800 CLERK              4
JONES            2975 MANAGER            1
BLAKE            2850 MANAGER            2
CLARK            2450 MANAGER            3
KING             5000 PRESIDENT          1
ALLEN            1600 SALESMAN           1

ENAME             SAL JOB               순위
---------- ---------- --------- ----------
TURNER           1500 SALESMAN           2
MARTIN           1250 SALESMAN           3
WARD             1250 SALESMAN           3
  • 직업 별로 묶어서 순위를 부여하기 위해 ORDER BY 앞에 PARTITION BY JOB을 이용하였다.

데이터 분석 함수로 순위 출력 (DENSE_RANK)

SELECT ename, job, sal, RANK() over (ORDER BY sal DESC) AS RANK,
    DENSE_RANK() over(ORDER BY sal DESC) AS DENSE_RANK
    FROM emp
    WHERE job in ('ANALYST', 'MANAGER');
ENAME      JOB              SAL       RANK DENSE_RANK
---------- --------- ---------- ---------- ----------
FORD       ANALYST         3000          1          1
SCOTT      ANALYST         3000          1          1
JONES      MANAGER         2975          3          2
BLAKE      MANAGER         2850          4          3
CLARK      MANAGER         2450          5          4
  • 위의 쿼리 결과는 RANK와 DENSE_RANK의 차이점을 알려주고 있다.
  • RANK함수는 1위가 두 개 있으면, 2위 없이 바로 그 다음 순위가 3위이다.
  • 그에 반해 DENSE_RANK함수는 1위가 두 개 이 있으면, 그 다음 순위는 2위이다.

  • 아래의 쿼리는 81년도에 입사한 사원들의 직업, 이름, 월급, 순위를 출력하는데, 직업별로 월급이 높은 순서대로 순위를 부여한 쿼리이다.
SELECT job, ename, sal, DENSE_RANK() OVER (PARTITION BY job ORDER BY sal DESC) 순위
    FROM emp
    WHERE hiredate BETWEEN to_date('1981/01/01', 'RRRR/MM/DD')
            AND to_date('1981/12/31', 'RRRR/MM/DD');
JOB       ENAME             SAL         순위
--------- ---------- ---------- ----------
ANALYST   FORD             3000          1
CLERK     JAMES             950          1
MANAGER   JONES            2975          1
MANAGER   BLAKE            2850          2
MANAGER   CLARK            2450          3
PRESIDENT KING             5000          1
SALESMAN  ALLEN            1600          1
SALESMAN  TURNER           1500          2
SALESMAN  WARD             1250          3
SALESMAN  MARTIN           1250          3

데이터 분석 함수로 등급 출력하기(NTILE)

  • 등급을 나누기 위해서는 NTILE 함수를 이용할 수 있다.
SELECT ename, job, sal,
    NTILE(4) over (order by sal desc nulls last) 등급
    FROM emp
    WHERE job in ('ANALYST', 'MANAGER', 'CLERK');
ENAME      JOB              SAL         등급
---------- --------- ---------- ----------
FORD       ANALYST         3000          1
SCOTT      ANALYST         3000          1
JONES      MANAGER         2975          1
BLAKE      MANAGER         2850          2
CLARK      MANAGER         2450          2
MILLER     CLERK           1300          3
ADAMS      CLERK           1100          3
JAMES      CLERK            950          4
SMITH      CLERK            800          4
  • NTILE의 괄호 안에 넣은 숫자는 등급을 해당 숫자로 나누겠다는 뜻이다.
  • 위의 쿼리는 월급을 기준으로 4개의 등급으로 나눈 것이다.
  • nulls last는 null은 맨 아래에 출력하겠다는 뜻이다.

데이터 분석 함수로 순위의 비율 출력하기(CUME_DIST)

SELECT ename, sal, RANK() over (order by sal desc) as RANK,
    DENSE_RANK() over (order by sal desc) as DENSE_RANK,
    CUME_DIST() over (order by sal desc) as CUM_DIST
    FROM emp;
ENAME             SAL       RANK DENSE_RANK   CUM_DIST
---------- ---------- ---------- ---------- ----------
KING             5000          1          1 .0714285714
SCOTT            3000          2          2 .214285714
FORD             3000          2          2 .214285714
JONES            2975          4          3 .285714286
BLAKE            2850          5          4 .357142857
CLARK            2450          6          5 .428571429
ALLEN            1600          7          6         .5
TURNER           1500          8          7 .571428571
MILLER           1300          9          8 .642857143
WARD             1250         10          9 .785714286
MARTIN           1250         10          9 .785714286

ENAME             SAL       RANK DENSE_RANK   CUM_DIST
---------- ---------- ---------- ---------- ----------
ADAMS            1100         12         10 .857142857
JAMES             950         13         11 .928571429
SMITH             800         14         12          1
  • 위의 결과는 1위부터 14위까지 있다. 사원 KING의 CUME_DIST 열의 첫 번째 행 0.071428571인 것은 1/14로 계산된 결과이다.
  • 전체 14등 중 1등의 비율인 0.07로 출력되었다.
  • 2등은 2명이어서 3/14로 계산되어 0.214285714로 출력되었다.

데이터 분석 수로 데이터를 가로로 출력(LISTAGG)

SELECt deptno, LISTAGG(ename, ',') within group (order by ename) as EMPLOYEE 
    FROM emp
    GROUP BY deptno;
DEPTNO
----------


        10 


        20 
ADAMS,FORD,JONES,SCOTT,SMITH                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                         

        30 
ALLEN,BLAKE,JAMES,MARTIN,TURNER,WARDDEPTNO
----------

-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
        10 


        20 
ADAMS,FORD,JONES,SCOTT,SMITH                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                         

        30 
ALLEN,BLAKE,JAMES,MARTIN,TURNER,WARD
  • LISTAGG 함수는 데이터를 가로로 출력하는 함수
  • LISTAGG에 구분자로 콤마를 사용하여 이름이 콤마로 구분
  • WITHIN GROUP은 ‘~이내의’라는 뜻으로 group 다음에 나오는 괄호에 속한 그룹의 데이터를 출력하겠다는 뜻

SELECT deptno, LISTAGG(ename, ',') within group (order by ename) as EMPLOYEE 
    FROM emp
    GROUP BY job;
JOB
---------

-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
ANALYST   


CLERK     


MANAGER   


JOB
---------


PRESIDENT 
KING                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                 

SALESMAN  
ALLEN,MARTIN,TURNER,WARD

데이터 분석 함수로 바로 전 행과 다음 행 출력 (LAG, LEAD)

SELECT empno, ename, sal,
    LAG(sal, 1) over (order by sal asc) "전 행",
    LEAD(sal, 1) over (order by sal asc) " 다음 행"
    FROM emp
    WHERE job in ('ANALYST', 'MANAGER');
EMPNO ENAME             SAL        전 행       다음 행
---------- ---------- ---------- ---------- ----------
      7782 CLARK            2450                  2850
      7698 BLAKE            2850       2450       2975
      7566 JONES            2975       2850       3000
      7902 FORD             3000       2975       3000
      7788 SCOTT            3000       3000
  • LAG 함수는 바로 전 행의 데이터를 출력하는 함수
  • LEAD 함수는 바로 다음 행의 데이터를 출력하는 함수
SELECT empno, ename, hiredate,
    LAG(hiredate, 1) over (order by hiredate asc) "전 행",
    LEAD(hiredate, 1) over (order by hiredate asc) "다음 행"
FROM emp
WHERE job in ('ANALYST', 'MANAGER');
     EMPNO ENAME      HIREDATE 전 행      다음 행    
---------- ---------- -------- -------- --------
      7566 JONES      81/04/01          81/05/01
      7698 BLAKE      81/05/01 81/04/01 81/05/09
      7782 CLARK      81/05/09 81/05/01 81/12/11
      7902 FORD       81/12/11 81/05/09 82/12/22
      7788 SCOTT      82/12/22 81/12/11

SELECT deptno, empno, ename, hiredate,
    LAG(hiredate, 1) over (partition by deptno order by hiredate asc) "전 행",
    LEAD(hiredate, 1) over (partition by deptno order by hiredate asc) "다음 행"
    FROM emp;
DEPTNO      EMPNO ENAME      HIREDATE 전 행      다음 행    
---------- ---------- ---------- -------- -------- --------
        10       7782 CLARK      81/05/09          81/11/17
        10       7839 KING       81/11/17 81/05/09 82/01/11
        10       7934 MILLER     82/01/11 81/11/17         
        20       7369 SMITH      80/12/11          81/04/01
        20       7566 JONES      81/04/01 80/12/11 81/12/11
        20       7902 FORD       81/12/11 81/04/01 82/12/22
        20       7788 SCOTT      82/12/22 81/12/11 83/01/15
        20       7876 ADAMS      83/01/15 82/12/22         
        30       7499 ALLEN      81/02/11          81/02/23
        30       7521 WARD       81/02/23 81/02/11 81/05/01
        30       7698 BLAKE      81/05/01 81/02/23 81/08/21

    DEPTNO      EMPNO ENAME      HIREDATE 전 행      다음 행    
---------- ---------- ---------- -------- -------- --------
        30       7844 TURNER     81/08/21 81/05/01 81/09/10
        30       7654 MARTIN     81/09/10 81/08/21 81/12/11
        30       7900 JAMES      81/12/11 81/09/10
  • 위의 쿼리는 deptno로 구분해서 나누고, 고용된 날 순서대로 그 전 행과 그 앞행의 칼럼들을 출력해주는 쿼리이다.


원래 partition에 대해 잘 몰랐었는데, 직접 쿼리 실행해보기도 하고 책에 예제도 풍부해서 이해가 잘 간 것 같다.

근데 역시 within group은 무슨 느낌인지는 알겠는데 정확히는 이해가 안 가는 그런 느낌.. 보충학습이 필요할 것 같다.

Comments