このサイトに飛んできた元URL(referer)を足おととして集計しているが、その仕組み上、ローカルIPだったり無効なIPやテストアップしただけのブログなどなど、除外したいものがけっこうあった。
そこで、かねてから先送りしていたeclude指定可能なような変更を加えた。 ◆/home/hoge/tmp/footstep4http_referer.sh referer_exclude.txt に除外したいIP(足おとにリストアップされたURLとする)を1件1行として保存しておくだけ。
#!/bin/sh
TARGET_INPUT=/home/hoge/tmp/referer.txt;
TARGET_INPUT_TEMP=/home/hoge/tmp/referer.tmp;
TARGET_EXCLUDE=/home/hoge/tmp/referer_exclude.txt;
TARGET_EXCLUDE_TEMP=/home/hoge/tmp/referer_exclude.tmp;
cat $TARGET_EXCLUDE | sort | uniq | awk ‘{printf “%swp-admin/\n”,$1}’ > $TARGET_EXCLUDE_TEMP;
cat $TARGET_INPUT | grep “wp-admin” | sort | uniq > $TARGET_INPUT_TEMP;
RESULT=diff $TARGET_INPUT_TEMP $TARGET_EXCLUDE_TEMP | grep “<” | awk ‘{print $2}’
;
TARGET_OUTPUT=/home/hoge/tmp/footstep.txt;
if [ -f $TARGET_OUTPUT ]; then
rm $TARGET_OUTPUT;
fi
for x in $RESULT;
do
URL=echo $x | awk ‘{split($1,targetName,”wp-admin”);print targetName[1];}’
;
echo ‘<a href=”‘$URL’” target=”_blank” style=”font-size: 8px; line-height: 1em;”>’$URL’</a><br />’ >> $TARGET_OUTPUT;
done
おかげで今の時点では雑音は無い。
つまりリンク集に近しいってことだ。 雑音になっている足おとの削除は、
①ecludeファイルを直接編集しなければならない点
②新たに追加された(精査すべき)足おとがわからない点 が課題。 ①は、ダッシュボードでも良いし、ログイン状態ならチェックボックス等も併用したフォームで対応できるのが良いし、②は、目印を付けるってことだけど、手法までは掘り下げていない。
No comments
Trackbacks
By submitting a comment you grant typista a perpetual license to reproduce your words and name/web site in attribution. Inappropriate and irrelevant comments will be removed at an admin’s discretion. Your email is used for verification purposes only, it will never be shared.