kidoOooOoooOOom

IT系で開発やってます

ログインログなどからユニークユーザ数を算出する方法メモ

とある期間に存在する大量のログインログからユニークユーザ数を算出したのでその時のメモ。

ログインログのフォーマットは下記とします。

YYYY-MM-DD hh:mm:ss UserID IPaddress UserAgent ...

awk使ってUserIDだけを抽出し、sortをかけた後、uniqで重複を排除して行数をカウント。

awk '{print $3}' ファイル名(正規表現でまとめて指定) | sort | uniq | grep -c .

awkちゃんと覚えていきたいです。