데이터베이스 개발자 질문과 답변 게시판

데이터베이스 개발/운영 관련 질문과 답변을 올리는 게시판입니다. 궁금하신 내용을 이곳에서 문의하시면 SQLER 분들의 답변을 받으실 수 있습니다. 문의를 하실때에는 최근 작업하신 특이 사항이나, 장애 발생 전 상황을 상세히 올려 주시면 답글을 적어주시는 SQLER분들의 답변이 더 정확할 수 있으니 도움 되시길 바랍니다. 쿼리 문의일 경우, 실제 문제가 재현되는 테이블생성, 샘플데이터 생성 쿼리를 함께 올려 주시면 더 빠르고 정확한 쿼리 문의 응답이 가능합니다.

안녕하세요


table 에 proto_header라는 컬럼이 있고 해당 칼럼을 조회 했을때 아래와 같은 다중 행이 띁다고 가정할때 특정 키워드만 조회할 수 있는 방안에 대해서 자문을 구하고 싶습니다.


예를들어 아래와 같은 CSV파일이 있습니다.


1.1.1.1,80,"GET /arm/win/xxxx2.msi HTTP/1.1

Connection: Keep-Alive

Accept: */*

Accept-Encoding: identity

If-Unmodified-Since: Tue, 16 May 2017 12:27:02 GMT

Range: bytes=0-4913

User-Agent: Microsoft BITS/7.5

Host: xxx.xxxx.com


 HTTP/1.1 206 Partial Content

Server: Apache

Last-Modified: Tue, 16 May 2017 12:27:02 GMT

ETag: ""4600-54fa349f7d4bb""

Accept-Ranges: bytes

Content-Type: application/x-msi

Date: Sun, 09 Jul 2017 21:45:34 GMT

Content-Range: bytes 0-4913/17920

Content-Length: 4914

Connection: keep-alive"


해당 내용은 아래의 URL에 접속했을 때 TCP stream이라고 할 때


저는 불필요한 정보 없이 아래와 같은 데이터의 중복값을 제외하고 추출하고 싶습니다.


1.1.1.1:80/arm/win/xxxx2.msi

xxx.xxxx.com/arm/win/xxxx2.msi 



하지만 해당내용을  DB화 하면  아래와 같이 결과가 나옵니다.


dst_ip       | 1.1.1.1

dst_port     | 80

proto_header | GET /arm/win/xxxx2.msi HTTP/1.1\r

             | Connection: Keep-Alive\r

             | Accept: */*\r

             | Accept-Encoding: identity\r

             | If-Unmodified-Since: Tue, 16 May 2017 12:27:02 GMT\r

             | Range: bytes=0-5369\r

             | User-Agent: Microsoft BITS/7.5\r

             | Host: xxx.xxxx.com\r

             | \r

             |  HTTP/1.1 206 Partial Content\r

             | Server: Apache\r

             | Last-Modified: Tue, 16 May 2017 12:27:02 GMT\r

             | ETag: "4600-54fa349f7d4bb"\r

             | Accept-Ranges: bytes\r

             | Content-Type: application/x-msi\r

             | Date: Mon, 10 Jul 2017 01:19:19 GMT\r

             | Content-Range: bytes 0-5369/17920\r

             | Content-Length: 5370\r

             | Connection: keep-alive\r

             | \r





맨 윗줄만 표기하게 해서 



  dst_ip | dst_port |  proto_header        |


1.1.1.1  |     80     | /arm/win/xxxx2.msi  |

이런식에 결과를 얻어야 중복데이터가 많아 중복 배제가 가능할텐데 위 처럼 \r로 이어지는 데이터가 많아 중복 제거가 어렵습니다.

이런 경우 어떻게 고유값을 얻을수 있을까요?
No. Subject Author Date Views
9939 JOIN성능 문의입니다. [4] Sisylian 2017.08.09 4225
9938 메모리 관련 질문 [1] 악마곰 2017.08.09 5951
9937 프로시저 도움 부탁드립니다.. [2] 재바우 2017.08.05 3161
9936 일별 회원가입 통계를 하고싶습니다.. [5] umtaeng 2017.08.03 2902
9935 특정유저가 특정 링크드 서버만 SELECT 가능 하게 가능 할까요? 군고구마 2017.08.03 4952
9934 SQL 2008 서버 접속 오류의 질문 한현 2017.08.03 5550
9933 전화번호가 속한 내용들은 모두 조회하고 싶습니다 [4] 문상연 2017.08.02 3204
9932 Merge,hash 조인걸때, 비동등조건 [4] 헬로우파이썬 2017.08.02 3369
9931 쿼리 도움 요청드려요. [2] 수수리 2017.08.02 4200
9930 차등백업이나 트랜잭션 로그백업에 사용할 풀백업본 질문입니다. [2] tempest 2017.07.31 5578
9929 비클러스터 인덱스를 잡았는데 클러스터 인덱스를 scan하는 이유는 왜그런가요? [3] 바다낚시꾼 2017.07.26 2479
9928 프로시저 실행 중 table lock 문의 [2] 톡히슈터 2017.07.19 2710
9927 MSSQL 2012 행을 열로 변경 [3] l1j2e3 2017.07.17 2943
9926 my sql 정말 쉬운 질문입니다..(DEC관련..) 유스탁키오관 2017.07.15 2075
9925 로그인 계정에 대한 질문 입니다. icham 2017.07.14 2567
9924 쿼리 질문드립니다 ㅠ [3] 브라미 2017.07.14 2396
9923 DELETE 관련 질문입니다 [2] 코코 2017.07.14 2079
9922 함수 먹힌 column 에 인덱스 추가하는방법? [2] 노잼호 2017.07.13 2603
9921 like에 대해서..? [4] 문상연 2017.07.13 2497
» postgresSQL 다중 행 쿼리질문(내용수정) [3] 궁금해서알고싶어요 2017.07.11 1937





XE Login