안녕하세요


table 에 proto_header라는 컬럼이 있고 해당 칼럼을 조회 했을때 아래와 같은 다중 행이 띁다고 가정할때 특정 키워드만 조회할 수 있는 방안에 대해서 자문을 구하고 싶습니다.


예를들어 아래와 같은 CSV파일이 있습니다.


1.1.1.1,80,"GET /arm/win/xxxx2.msi HTTP/1.1

Connection: Keep-Alive

Accept: */*

Accept-Encoding: identity

If-Unmodified-Since: Tue, 16 May 2017 12:27:02 GMT

Range: bytes=0-4913

User-Agent: Microsoft BITS/7.5

Host: xxx.xxxx.com


 HTTP/1.1 206 Partial Content

Server: Apache

Last-Modified: Tue, 16 May 2017 12:27:02 GMT

ETag: ""4600-54fa349f7d4bb""

Accept-Ranges: bytes

Content-Type: application/x-msi

Date: Sun, 09 Jul 2017 21:45:34 GMT

Content-Range: bytes 0-4913/17920

Content-Length: 4914

Connection: keep-alive"


해당 내용은 아래의 URL에 접속했을 때 TCP stream이라고 할 때


저는 불필요한 정보 없이 아래와 같은 데이터의 중복값을 제외하고 추출하고 싶습니다.


1.1.1.1:80/arm/win/xxxx2.msi

xxx.xxxx.com/arm/win/xxxx2.msi 



하지만 해당내용을  DB화 하면  아래와 같이 결과가 나옵니다.


dst_ip       | 1.1.1.1

dst_port     | 80

proto_header | GET /arm/win/xxxx2.msi HTTP/1.1\r

             | Connection: Keep-Alive\r

             | Accept: */*\r

             | Accept-Encoding: identity\r

             | If-Unmodified-Since: Tue, 16 May 2017 12:27:02 GMT\r

             | Range: bytes=0-5369\r

             | User-Agent: Microsoft BITS/7.5\r

             | Host: xxx.xxxx.com\r

             | \r

             |  HTTP/1.1 206 Partial Content\r

             | Server: Apache\r

             | Last-Modified: Tue, 16 May 2017 12:27:02 GMT\r

             | ETag: "4600-54fa349f7d4bb"\r

             | Accept-Ranges: bytes\r

             | Content-Type: application/x-msi\r

             | Date: Mon, 10 Jul 2017 01:19:19 GMT\r

             | Content-Range: bytes 0-5369/17920\r

             | Content-Length: 5370\r

             | Connection: keep-alive\r

             | \r





맨 윗줄만 표기하게 해서 



  dst_ip | dst_port |  proto_header        |


1.1.1.1  |     80     | /arm/win/xxxx2.msi  |

이런식에 결과를 얻어야 중복데이터가 많아 중복 배제가 가능할텐데 위 처럼 \r로 이어지는 데이터가 많아 중복 제거가 어렵습니다.

이런 경우 어떻게 고유값을 얻을수 있을까요?
No. Subject Author Date Views
Notice SQL강좌: 챗GPT와 함께 배우는 SQL Server 무료 강좌 목차와 소개 (2023년 9월 업데이트) 코난(김대우) 2023.08.18 28364
Notice Python 무료 강좌 - 기초, 중급, 머신러닝(2023년 6월 업데이트) 코난(김대우) 2021.01.01 15473
9921 like에 대해서..? [4] 문상연 2017.07.13 2544
» postgresSQL 다중 행 쿼리질문(내용수정) [3] 궁금해서알고싶어요 2017.07.11 1985
9919 프로시저내 트랜젝션 문의드립니다. [2] 톡히슈터 2017.07.10 2576
9918 2005에서 2008로 업그레이드 하려고 합니다. 엘제이 2017.07.10 2601
9917 뜬금없이MSSQL이실행중이나 실행이 안됩니다. [1] 김영환_281520 2017.07.10 4265
9916 SQL 쿼리 질문(동적쿼리) [2] SQL입문도못한자 2017.07.07 2271
9915 SQL Server 에이전트 [2] 기타치는퐝동 2017.07.07 3287
9914 쿼리 질문입니다 [1] 문상연 2017.07.06 3905
9913 mssql sysadmin 권한 관련 확인요청 드립니다. 제비 2017.07.06 4152
9912 쿼리 질문입니다! [2] 파란약 2017.07.05 3175
9911 메모리 TEMPDB 문의 [1] MSG 2017.07.05 2026
9910 쿼리좀 여쭤 볼게요. [5] 죠리퐁 2017.07.05 3040
9909 linked server가 무슨 계정으로 설정되어 있는지 [1] 이시우_301202 2017.07.05 3021
9908 데이터 가져오기 및 내보내기 마법사에서 [2] 푸르네 2017.07.04 2865
9907 MS-SQL 책 추천 부탁 드립니다. [1] 데이비드백곰 2017.07.04 3521
9906 insert 프로시저 사용시, 오류내용과 반환값을 설정하는 방법좀알려주세요 [1] mssl왕초초초보 2017.07.03 3344
9905 sql 서버 미러링 구성에 관한 질문 입니다. icham 2017.07.01 2560
9904 답변을 아이디별로 표시학고 싶습니다 [3] 문상연 2017.06.30 2566
9903 윈도우 암호 변경후 복제 상태보기 오류 메시지 thrill 2017.06.29 4588
9902 bcp 질문입니다. [1] goblin 2017.06.29 2980





XE Login