OLAP이야기가 계속 되는데.....

앞으로 설치 전까지는 계속해서 OLAP에 대한 주요 개념들의 놓친부분을 설명 드리겠습니다.

 

다차원적 관점 : 한마디로 말하면 어떤 회사나 DBMS를 사용하는 기관이

지난 과거의 상태를 저장해 놓고... 이를 이용해 앞으로 일어날 미래의 계획에

통합해 넣기위한 비즈니스의 관점

이에 빨리 저 과거의 자료들로부터 어떠한 자료를 얻는게 중요 하겠지요.

결과를 보고 싶은데 늦으면 안되고... 미리 계산값을 만들어 두면 디스크와 시스템의

부하가 크고. 이런 계산값의 문제는 이미 말을 드린거구요.. ^_^

 

지식기반으로 작업하는 사람은 끝까지 지식 기반으로 작업을 합니다.

항상 수치와 그 추세를 따져보고 지식에 입각해 작업을 하지요.

즉 과거의 지식이 엄청 필요하다.. 라는 겁니다.. ^_^

OLTP시스템이나 데이터웨어 하우스의 자료들을 가지고 분석해 결과를 유추해 내는

작업이 많이 사용되었지만.. 이는 한계가 있었지요.. ^_^ 단일 툴이 아니니깐...

그래서 통합된 OLAP서비스란 부분이 등장하는 겁니다...

 

큐브 이야기입니다...

비즈니스에서 이익과 손실에 영향을 미치는 요소는 어떤게 있을가요?

일반적으로 시간,제품,지역 그리고.. 이라고 합니다.

보통 3개 이상의 다차원 항목이 있다.. 라는 거지요... ^_^

이 각각의 요소를 큐브라고 부르고 처리를 한다.. 라는 거지요 ^_^

o1.JPG

 이런 2차원 그래프를 생각해 보시고...

o2.JPG

 이런 3차원 그래프오 생각하실 수 있을 겁니다.

1개 요소가 1개 차원 이니... 1개 차원이 더 늘어 난다면?

o3.JPG

이렇게 이해 하실 수 있을 겁니다. ^_^

우선 위의 3차원의 그래프만을 가지고 보신다면.. ^_^

o4.JPG

 임을 아실 수 있을 겁니다. ^_^

그렇다면??

o5.JPG

 이 붉은 부분이 의미하는 건 몰가요? ^_^

바로 특정 제품의(고정된) 시간과 지역에 대한 자료 이겠지요?

그럼 이 자료로 한 제품에 대한 시간과 지역별 판매 자료를 얻을 수 있을 겁니다.

N차원이 된다면? 도형으로는 불가능 하지만. 컴퓨터로는 가능합니다. ^_^

이해가 되시지요 ^_^

이런 차원에대해 약간 더 설명을 드려야지요...

개별적 차원 : 차원이 각각의 개별적인 큐브에 대해 생성될 경우

공유된 차원 : 차원이 다중의 큐브에 의해 참조되는 경우. 공유된 차원의 데이터베이스 내의

모든 큐브에서 참조될 수 있기 때문에 큐브마다 중복되는 차원의 정의가 필요 없고

시간 절약이 가능한 장점이 있다. 또한 큐브에서 정의되는 차원들에 대한 비즈니스적인

표준을 가능하게 하므로 서로 다른 큐브에서 차원이 정의되어도 비슷한 구조를 가진

큐브 생성이 가능하다.

가상차원 : 실제 차원의 프라퍼티를 중심으로 구성되는 논리적 가상의 차원을 말한다.

프라퍼티는 보통 멤버 프라퍼티라 부르고 가상차원의 생성 전에 정의되어야 한다.

가상차원을 사용해 얻을 수 있는 장점은 가상차원의 경우 큐브에 저장되지 않기 때문에

큐브의 크기에 전혀 영행을 주지 않는 다는 점이다.

 

드릴 업 / 드릴 다운

사용자가 특정 위치의 레벨에서 더 상세한 내역을 위해 데이터의 검색 단계를 이동하거나

상위 계층의 더 축약된 내용으로 이동 하는 분석기법을 말한다.

동네 겜방

분기별

수익

파워해커룸~

1/4분기

100원

24시간 레두 포 바툴

1/4분기

500원

굿데이 커맨더

1/4분기

10000원

누쿨리어 런치 디텍티드

1/4분기

20000원

벙커엔 4명씩

1/4분기

500원

미네랄은 캘줄 아라요~

1/4분기

0원

 

 1/4분기의 스타이름 겜방의 수익은?(드릴 다운자료)

굿데이 커맨더

10000원

누쿨리어 런치 디텍티드

20000원

벙커엔 4명씩

500원

미네랄은 캘줄 아라요~

0원

 

 흠... 차원 안의 계층이나 차원의 관계에 따라 된다.. 라는 정도만 기억하시고..

이기능을 이용해 더 자유롭고 많은 분석이 가능해 집니다...

 

 크로스 탭

2차원 그룹별로 테이블에 중첩되는 형태를 의미 합니다. ^_^

겜방이름

1/4분기

2/4분기

방문자수

총수익

방문자수

총수익

파워해커룸~

5

500

11

1100

24시간 레두 포 바툴

6

600

12

1200

굿데이 커맨더

7

700

13

1300

누쿨리어 런치 디텍티드

8

800

14

1200

벙커엔 4명씩

9

900

15

1500

미네랄은 캘줄 아라요~

10

1000

16

1600

 

 피봇팅 : 사용자에게 최종적으로 보여지는 결과 화면에서 보이는 축을 서로 바꾸는

기능을 의미한다... ^_^

즉 고정된 포맷에 구애 없이 분석의 패턴을 바꾸는 것을 말한다..

엑셀을 생각해 보시면 쉬울 겁니다.. ^_^

 

 슬라이스 : 다차원 배열의 한 차원의 멤버나 그 이상의 멤버를 가지고 한 값을 선택했을 때..

를 슬라이스라 한다.

 o5.JPG

 여기서 저 붉은 부분도 역시 슬라이스라고 하는 거지요.. ^_^

 

슬라이스와 다이스 : 사용자가 선택한 슬라이스의 특정 항목에 대해 피봇팅, 드릴업,드릴다운

등을 이용해 대화식으로 화면에 표시하여 분석하는 프로세스를 의미한다..

사용자가 원하는 방향에 따라 분석, 차원,분석 관점을 바꿔가며 분석이 가능하며..

정형화된 보고서,비정형 질의에 대한 보고서역시 작성이 가능해

분석기능을 강화할 수 있다.

 

네비게이션 : 사용자가 OLAP 분석 도구를 이용해 자료를 주로 드릴 기능과 피봇 기능을

통해 원하는 분석의 결론에 도달하는 프로세스를 의미한다.

 

임의적인 질의 : 질의 사용자가 아무때나 원하는 질의 항목을 정의하여 임의적으로 질의하는

형태를 의미한다.

 

그외 OLAP의 부가적인 기능

랭킹 : 분석된 수치자료의 주어진 조건에 따른 순위를 표시하는 기능을 말한다.

 

경고,예외 상황 처리 : 사용자가 정의한 조건에 해당, 그렇지 않을 때 사용자를 환기시키는

역할을 한다. (메일, 팩스, 삐삐 등..)

 

액셀 애드인 : 액셀의 메뉴에 애드인되는 기능을 말한다.

 

80대 20 : 상위 20%의 성과가 총 성과의 80%를 차지한다는 법칙이다.

이를 팔레토의 법칙, 또는 분석이라 한다.

 

추세표시 : 경향, 패턴에대한 분석을 시간대별 추이로 표시한 그래프를 말한다.

 

시분면표시 : 연관이 있는 2가지의 분석 요소를 4분면으로 나누어 위치시켜 생성 가능한

포트폴리오로 분석하는 방법을 말한다.

 

의사결정 트리 : 데이터 분석의 또다른 방법이며 진보된 형태이다.

OLAP 큐브를 기반으로 각 차원의 데이터가 관계된 다른 차원의 특정 요소에 의해 달라질 수

있는 결과값의 모든 조합을 트리 형식으로 표현하는 것을 의미한다.

 

 다음은 데이터 마트에 대한 설명을 드리겠습니다. ^_^

 


 

 OLAP이야기 _ OLAP구성요소 개념잡기 문서의 끝입니다.





profile

부족하지만, SQLER의 누군가와 함께한 나눔을 통해 제가 더 많이 즐거웠습니다.
SQLER와 함께 즐거워 할수록, 그 나눔을 통해 더 많은 기회와 가치를 발견하게 되었습니다.
나눔의 생각이 앞으로도 계속, SQLER를 움직일 것입니다.

코난, 김대우 / SQLER 운영자 / 골라먹는 SQLER RSS 정보 구독 / 실시간 SQLER 소식 uxkorea 트위터