데이터베이스 개발자 질문과 답변 게시판

데이터베이스 개발/운영 관련 질문과 답변을 올리는 게시판입니다. 궁금하신 내용을 이곳에서 문의하시면 SQLER 분들의 답변을 받으실 수 있습니다. 문의를 하실때에는 최근 작업하신 특이 사항이나, 장애 발생 전 상황을 상세히 올려 주시면 답글을 적어주시는 SQLER분들의 답변이 더 정확할 수 있으니 도움 되시길 바랍니다. 쿼리 문의일 경우, 실제 문제가 재현되는 테이블생성, 샘플데이터 생성 쿼리를 함께 올려 주시면 더 빠르고 정확한 쿼리 문의 응답이 가능합니다.

안녕하세요


table 에 proto_header라는 컬럼이 있고 해당 칼럼을 조회 했을때 아래와 같은 다중 행이 띁다고 가정할때 특정 키워드만 조회할 수 있는 방안에 대해서 자문을 구하고 싶습니다.


예를들어 아래와 같은 CSV파일이 있습니다.


1.1.1.1,80,"GET /arm/win/xxxx2.msi HTTP/1.1

Connection: Keep-Alive

Accept: */*

Accept-Encoding: identity

If-Unmodified-Since: Tue, 16 May 2017 12:27:02 GMT

Range: bytes=0-4913

User-Agent: Microsoft BITS/7.5

Host: xxx.xxxx.com


 HTTP/1.1 206 Partial Content

Server: Apache

Last-Modified: Tue, 16 May 2017 12:27:02 GMT

ETag: ""4600-54fa349f7d4bb""

Accept-Ranges: bytes

Content-Type: application/x-msi

Date: Sun, 09 Jul 2017 21:45:34 GMT

Content-Range: bytes 0-4913/17920

Content-Length: 4914

Connection: keep-alive"


해당 내용은 아래의 URL에 접속했을 때 TCP stream이라고 할 때


저는 불필요한 정보 없이 아래와 같은 데이터의 중복값을 제외하고 추출하고 싶습니다.


1.1.1.1:80/arm/win/xxxx2.msi

xxx.xxxx.com/arm/win/xxxx2.msi 



하지만 해당내용을  DB화 하면  아래와 같이 결과가 나옵니다.


dst_ip       | 1.1.1.1

dst_port     | 80

proto_header | GET /arm/win/xxxx2.msi HTTP/1.1\r

             | Connection: Keep-Alive\r

             | Accept: */*\r

             | Accept-Encoding: identity\r

             | If-Unmodified-Since: Tue, 16 May 2017 12:27:02 GMT\r

             | Range: bytes=0-5369\r

             | User-Agent: Microsoft BITS/7.5\r

             | Host: xxx.xxxx.com\r

             | \r

             |  HTTP/1.1 206 Partial Content\r

             | Server: Apache\r

             | Last-Modified: Tue, 16 May 2017 12:27:02 GMT\r

             | ETag: "4600-54fa349f7d4bb"\r

             | Accept-Ranges: bytes\r

             | Content-Type: application/x-msi\r

             | Date: Mon, 10 Jul 2017 01:19:19 GMT\r

             | Content-Range: bytes 0-5369/17920\r

             | Content-Length: 5370\r

             | Connection: keep-alive\r

             | \r





맨 윗줄만 표기하게 해서 



  dst_ip | dst_port |  proto_header        |


1.1.1.1  |     80     | /arm/win/xxxx2.msi  |

이런식에 결과를 얻어야 중복데이터가 많아 중복 배제가 가능할텐데 위 처럼 \r로 이어지는 데이터가 많아 중복 제거가 어렵습니다.

이런 경우 어떻게 고유값을 얻을수 있을까요?
No. Subject Author Date Views
9932 Merge,hash 조인걸때, 비동등조건 [4] 헬로우파이썬 2017.08.02 3358
9931 쿼리 도움 요청드려요. [2] 수수리 2017.08.02 4195
9930 차등백업이나 트랜잭션 로그백업에 사용할 풀백업본 질문입니다. [2] tempest 2017.07.31 5577
9929 비클러스터 인덱스를 잡았는데 클러스터 인덱스를 scan하는 이유는 왜그런가요? [3] 바다낚시꾼 2017.07.26 2479
9928 프로시저 실행 중 table lock 문의 [2] 톡히슈터 2017.07.19 2663
9927 MSSQL 2012 행을 열로 변경 [3] l1j2e3 2017.07.17 2937
9926 my sql 정말 쉬운 질문입니다..(DEC관련..) 유스탁키오관 2017.07.15 2072
9925 로그인 계정에 대한 질문 입니다. icham 2017.07.14 2567
9924 쿼리 질문드립니다 ㅠ [3] 브라미 2017.07.14 2396
9923 DELETE 관련 질문입니다 [2] 코코 2017.07.14 2079
9922 함수 먹힌 column 에 인덱스 추가하는방법? [2] 노잼호 2017.07.13 2603
9921 like에 대해서..? [4] 문상연 2017.07.13 2497
» postgresSQL 다중 행 쿼리질문(내용수정) [3] 궁금해서알고싶어요 2017.07.11 1937
9919 프로시저내 트랜젝션 문의드립니다. [2] 톡히슈터 2017.07.10 2501
9918 2005에서 2008로 업그레이드 하려고 합니다. 엘제이 2017.07.10 2574
9917 뜬금없이MSSQL이실행중이나 실행이 안됩니다. [1] 김영환_281520 2017.07.10 4224
9916 SQL 쿼리 질문(동적쿼리) [2] SQL입문도못한자 2017.07.07 2228
9915 SQL Server 에이전트 [2] 기타치는퐝동 2017.07.07 3242
9914 쿼리 질문입니다 [1] 문상연 2017.07.06 3863
9913 mssql sysadmin 권한 관련 확인요청 드립니다. 제비 2017.07.06 3829





XE Login