데이터베이스 개발자 질문과 답변 게시판

데이터베이스 개발/운영 관련 질문과 답변을 올리는 게시판입니다. 궁금하신 내용을 이곳에서 문의하시면 SQLER 분들의 답변을 받으실 수 있습니다. 문의를 하실때에는 최근 작업하신 특이 사항이나, 장애 발생 전 상황을 상세히 올려 주시면 답글을 적어주시는 SQLER분들의 답변이 더 정확할 수 있으니 도움 되시길 바랍니다. 쿼리 문의일 경우, 실제 문제가 재현되는 테이블생성, 샘플데이터 생성 쿼리를 함께 올려 주시면 더 빠르고 정확한 쿼리 문의 응답이 가능합니다.


급하게 답을 구해야하는데 해결 방법을 찾지 못하여 여기에 글올립니다. 

ㅜㅜ

 

 

아래와 같은 데이터가 있다고 가정할때

 click은 항상 view와 동시 또는 항상 나중에 일어나야 합니다.

view한번에 click은 한번으로 매핑합니다.

 

UUID  LOG_TIME     EVENT

A     12:00:00     VIEW

A     12:00:02     CLICK

A     12:00:03     VIEW

A     12:00:04     VIEW

A     12:00:06     CLICK

A     12:00:07     CLICK

A     12:00:11     VIEW

A     12:00:12     VIEW

A     12:00:13     VIEW

A     12:00:14     VIEW

A     12:00:15     VIEW

A     12:00:15     CLICK

A     12:00:17     VIEW

A     12:00:18     VIEW

A     12:00:19     VIEW

A     12:00:20     VIEW

A     12:00:26     CLICK

A     12:00:27     CLICK

A     12:00:28     CLICK

A     12:00:29     VIEW

A     12:00:30     CLICK

A     12:00:34     VIEW

A     12:00:35     VIEW

A     12:00:36     VIEW

A     12:00:37     VIEW

A     12:00:41     CLICK

 

 

위테이블을 아래와 같이 변경합니다

 

UUID   LOG_TIME   EVENT         CLICK

A    12:00:00    VIEW     CLICK

A    12:00:03    VIEW     null

A    12:00:04    VIEW     CLICK

A    12:00:11    VIEW     null

A    12:00:12    VIEW     null

A    12:00:13    VIEW     null

A    12:00:14    VIEW     null

A    12:00:15    VIEW     CLICK

A    12:00:17    VIEW     null

A    12:00:18    VIEW     null

A    12:00:19    VIEW     null

A    12:00:20    VIEW     CLICK

A    12:00:29    VIEW     CLICK

A    12:00:34    VIEW     null

A    12:00:35    VIEW     null

A    12:00:36    VIEW     null

A    12:00:37    VIEW     CLICK

 

view와 view 사이에 클릭이 있을경우 항상 최상위 뷰에 맞게 클릭이 일어났다는걸 테이블로 표현 하려고 합니다.

시스템은 hive를사용중이고  건수는 200만건입니다

 

view와 click를 템프테이블에 각각 담아도 조인키가 없어서 조인도 되지 않고 난감합니다 

도와주세요 ㅜㅜ

 

 

원본테이블

1.JPG

 

변환 테이블

2.jpg

 

 



 

 

No. Subject Author Date Views
9190 초보적인 질문... [5] 큘러 2016.02.20 2533
» sql 이나 어떤거이든 해결 부탁 드립니다. ㅜㅜ [2] 수비짱 2016.02.20 2087
9188 ㅁㅁㅁ 수비짱 2016.02.20 1751
9187 dbcc문을 원격지에서 날릴수 없나요? [6] 군고구마 2016.02.19 4331
9186 원격지 서버에서 SQL LOG를 가져오고자 합니다. [6] 군고구마 2016.02.18 2190
9185 쿼리문 시간관련 질문 드립니다. [4] 유로유로 2016.02.18 2631
9184 다시 질문드립니다. [2] 큘러 2016.02.18 1987
9183 연결된 서버(Linked Server) 속도 문제 문의드립니다. [6] 디비로 2016.02.18 5584
9182 주기적인 cpu100% 현상 [4] yb 2016.02.18 2972
9181 같은조건인데 프로시저를 실행하면 한쪽은 되고 한쪽은 실행이 안됩니다. [3] 뱅만도리 2016.02.18 2047
9180 mysql replication [1] 니크네이므 2016.02.18 1639
9179 업데이트 오류에 이어서 .... [4] 큘러 2016.02.17 2182
9178 서버역할을 sysadmin으로 하지 않으면 db가 보이지 않습니다 [1] 조굴 2016.02.17 1961
9177 업데이트 문의 [18] 큘러 2016.02.16 2285
9176 group by 를 하고 싶은데요. [3] DOOLLY 2016.02.16 2175
9175 재귀쿼리를 통해 트리구조를 가져올수있게 하는 쿼리를 작성하였는데 시간이 느립니다. 뽀구 2016.02.16 2389
9174 [질문] 오라클 start with ~ connect by 쿼리문입니다. [1] 매발톱 2016.02.16 2255
9173 case when 질문입니다. [2] 큘러 2016.02.16 2298
9172 쿼리문의 방자 2016.02.16 1902
9171 날짜를 기준으로 사전과 사후 나누기... [2] DOOLLY 2016.02.15 2141





XE Login