2016년 7월 30일 토요일

VIM 사용 설명서(secure 로그 분석 - 2nd)

가장 많은 로그를 발생시킨 sshd 프로세스의 메시지 분포를 확인해보자. 메시지만의 정확한 분포 확인을 위해 필요없는 문자열은 지울 필요가 있다. 사용한 검색어 '^.*]: '은,
  1. 각 줄에서 첫 번째 시작(^)하는 문자부터 검색을 시작하며,
  2. 끝나는 문자는 ']:공백'이고,
  3. 검색 시작 위치와 끝 문자 사이에 임의 문자(.)가 0개 이상(*) 있음을 의미하는 정규표현식이다.


2016년 7월 24일 일요일

VIM 사용 설명서(secure 로그 분석)

이제 VIM을 이용한 secure 로그 분석을 진행해보자. 특히 오늘은 문자열 데이터를 다양한 관점에서 해체하고 조립하는 과정을 통해 전체적인 구조와 의미를 (대충) 파악하는 시간을 가져볼 것이다.

'헬로 데이터 과학'편에서 이미 살펴봤듯이 secure 로그는 일정 길이나 ':' 등의 특정 기호를 이용해서 완벽하진 않지만 나름의 일관성을 부여해서 데이터의 성격별 영역 구분이 가능한 반정형 데이터이다.


2016년 7월 18일 월요일

안전해지고 싶다면

"이 글은 '미래의 범죄는 신기술을 따라 발전한다'란 글에 대한 개인적인 생각입니다."

글쓴이는 '누가 우리의 미래를 훔치는가'라는 책을 소개하며, 사이버 세상의 어두운 면에 대한 경각심을 잃지 말 것을 당부한다.

어두운 사이버 세상의 존재는 엄연한 사실이다. 사이버 세상은 해킹, 피싱 등으로 발 디딜 틈이 없어 보이고, 관련 언론 지면은 하루가 멀다하고 등장하는 새로운 보안 취약점으로 도배되다시피 하고 있다.

어떻게 하면 안전해질 수 있을까? 저자는 개개인의 주의 및 미국이 세계 유수의 과학자들을 모아 원자폭탄을 만든 것처럼 사이버 보안계의 '맨해튼 프로젝트'를 진행해서 사이버 테러 행위에 대한 장기적인 대처 방안을 마련하자고 주장하는 듯.

좋은 의견이긴 한데, 어차피 미국이 북치고 장구치고 다 할 거 같은데-_- 아니면 '사이버 게놈(2010년부터 했는데 성과가 있나?)' 비슷하게 이미 하고 있지 않을까? 외계인 고문하면서(..)

2016년 7월 14일 목요일

VIM 사용 설명서 - 3rd

지난 시간에 살펴봤던 문자열 치환 기능은 당연히 문자열 단위로만 동작한다. 원본 데이터의 줄 단위 구조는 바뀌지 않는다는 얘기. 그런데 가끔 줄 단위 구조를 바꾸고 싶을 때가 있다. 예를 들면 특정 문자열을 포함한 줄만을 골라서 삭제한다든지.

글로벌 명령어

그런 기능이 있을까? 이런 기능이 있으면 좋겠다 싶어서 구글링 해보면 VIM은 신기하게도 반드시 그 기능을 가지고 있더라.


2016년 7월 10일 일요일

VIM 사용 설명서 - 2nd

VIM 기능 중에서도 꽃 중의 꽃이라고 할 수 있는 문자열 치환 기능에 대해서 알아보자. 문자열 치환 명령어 역시 당연히 명령 모드에서 동작하며, 형식은 다음과 같다.


해당 명령어는 검사 대상 문자열에서 ②를 찾아서, ③으로 바꿔준다. 즉 명령어 ':%s/aaa/bbb/'를 입력하면 aaa 문자열을 찾아서 bbb로 바뀌주며, /로 구분되는 세 개의 영역은 다음과 같은 특징을 가지고 있다.

2016년 7월 2일 토요일

VIM 사용 설명서

7월이다. 2016년이 벌써 반이 지나갔고, 장마가 시작된 듯. 지난 주엔 병원에서 목 디스크 초기 진단 받고 주사 한 방 맞고 왔다. 여러분 컴퓨터 오래 하지 마세요. 실손 보험도 꼭 들어 놓으시고(..)

뻘소리 그만 하고지난 달에 '헬로 데이터 과학'이란 책의 후기를 남기면서 전체 데이터 분석 과정에서 데이터 처리 작업이 차지하는 비중을 설명하고자 (VIM으로 시작해서 VIM으로 끝나는) 리눅스 secure 로그 분석 과정을 일부 포스팅했었다.

그런데 그 부분을 자세히 설명해달라는 요청이 있어서 보강을 해볼까 하다가, VIM을 알아야만 이해가 쉬운 부분이라 아예 VIM 사용법부터 시작하는 게 좋겠다는 생각이 들었다. 개인적으로 VIM을 사용하는 이유는 기능과 성능이 대량 문자열 데이터를 다루는 데 있어서 우주 최강이기 때문.

크리에이티브 커먼즈 라이선스