2017년 12월 12일 화요일

timelion의 필드 집계 오류

웹서버 접속자의 국가별 발생 추이를 그려보자. 다음은 상위 5개의 접속국가 추이를 그려주는 표현식 '.es(split=geoip.country_name:5)'의 사용 결과.


2017년 12월 10일 일요일

고오급 시계열 데이터 분석기 timelion

ELK 스택 삼대장 중 키바나를 개발한 '라쉬드 칸(Rashid Khan)'이 비행기 타고 가다 뚝딱 만들었다는 timelion.


2017년 11월 26일 일요일

대량살상 수학무기

수학자, 금융공학자, 데이터 과학자라는 무시무시한 타이틀을 가진 캐시 오닐이 자본주의 부역자(?) 신세로 전락하고 있는 데이터 과학의 이면을 고발한 책. (데이터 과학자의 본격 데이터 과학 디스)

'월가점거 운동의 하위 조직인 대안금융그룹을 이끌고 있다'는 저자 소개가 심상치 않다. 좌파의 냄새가 솔솔(..)

좋은 면이 있으면 안 좋은 면도 존재하는 게 세상 만사 이치. 수십억 인구를 절대 빈곤에서 해방시킨 자본주의가 우수한 사회 체제임은 분명하다.

하지만 역시나 단점은 존재한다. 유발 하라리는 '사피엔스'에서 자본주의의 단점을 이렇게 얘기했다.

"노예무역이 아프리카인을 향한 증오의 결과가 아니었던 것처럼, 현대의 동물산업도 악의를 기반으로 출발한 것이 아니었다. 이번에도 그 연료는 무관심이다." (486 페이지)

2017년 11월 20일 월요일

네트워크 보안 실무

2012년, 'IDS와 보안관제의 완성' 초고를 완성한 나는 다음 문구를 두고 살짝 고민중이었다.

"IDS의 오탐, 즉 부정확한 패턴매칭의 문제를 해결한 국가나 기업이 있을까? 다행인지 불행인지 모르겠지만, IDS를 만든 미국도 아직 해결책을 찾지 못한 것으로 보인다." (455 페이지)

나름 열심히 해외 사례를 찾아본 결과, 미국은 물론, 그 어디에서도 문제 인식 단계를 벗어나지 못했다는 결론을 내렸지만 중2 수준의 내 영어 실력이 영 찜찜했기 때문(..)

그래서 다시 인터넷을 뒤지다 발견한 문구.

"왜 대부분의 IDS가 무용지물이 되어 가고 있는지"

700여 페이지에 달하는 방대한 분량 대부분을 네트워크 분석을 위한 오픈소스 도구 소개에 할애하고 있지만, 곳곳에서 네트워크 보안에 대한 저자의 철학과 고뇌를 엿볼 수 있는 '네트워크 보안 실무'의 출판사 리뷰였다.

2017년 11월 13일 월요일

2017년 11월 5일 일요일

Elasticsearch 활용(Web Log 이상징후 분석 - 4th)

지난 시간에 응답코드 404와 500 발생 건수 변화 추적을 통해 이상징후를 포착하는 과정을 살펴봤었는데, 그때 404의 경우 파일 확장자 발생 개수 조건을 참고하면 판단이 조금은 쉬워진다는 사실을 알 수 있었다. 흔한 상관분석 사례.

그렇다면 응답코드 500 발생 상황에서 판단의 정확도를 높여주는 다른 조건은 없을까? 응답코드 500은 웹서버가 사용자 요청 처리에 실패하고 드러누웠다는 얘기.


2017년 10월 26일 목요일

Logstash 필터 ruby

야구 끝나고 기분 좋게 포스팅 하나. (현종아 잘했다 ㅜㅜ) 이상징후 분석은 로그의 특정 상태를 숫자로 바꾼 후, 그 숫자를 세는 것이라고 했는데, 숫자로 바꾸기 어려운 상태도 있을 것이다. 예를 들면, 웹로그의 URI 중 변수 길이 같은 거. 어떻게 하면 해당 데이터의 길이를 잴 수 있을까?


크리에이티브 커먼즈 라이선스