何経由でダウンロードされたのかスクリプトでIPアドレスリストか らホスト名を取得

大量のIPアドレス情報があります。

会社で提供しているカタログにアクセスしてもらっていますが、アクセス解析をしたいとの事。スマートフォンからアクセスされているのが多いのが分かっているのですが、その環境はWiFiなのか、キャリア回線を使っているのか。それによってコンテンツの重さなども検討したいとの事です。

うちのサーバアクセスログは、ダウンロード時のIPアドレスや端末名は出ているのですが、残念ながらホスト名は出ていないので、何経由でアクセスされているのかイマイチ分かりません。アクセス回線が分かれば、キャリアの通信回線を利用しているのか、WiFiを利用しているのか見当がつくので大量のIPアドレスをホスト名に変更したいという事です。

IPアドレスリストを作成します。
6?.215.190.***
15?.177.0.***
18?.48.171.***

こんな感じのテキストファイルです。ファイル名をiplistとしました。

IPアドレスから、ホスト名に変換するシェルスクリプトを作成します。

実行権限を与えます。
# chmod 755 ip2host.sh

./ip2host.sh ./iplist > hostlist

iplistファイルを読み込ませ、1行ずつホスト名を返します。それをhostlistファイルにリダイレクトします。

aliasなどが含まれていると、2行返される事があったり

 

名前が解決できず
Host 121.23.*.*.in-addr.arpa. not found: 3(NXDOMAIN)

と返る事があるので、domain name pointer が含まれる行のみ抽出します。
egrep ‘ domain name pointer ‘

後ろからn列目をawkする
awk ‘{print $(NF-n)}’

後ろから3列目までをawkしてドメインを見る
awk -F. ‘{print $(NF-3)”.”$(NF-2)”.”$(NF-1)}’

 

私はcsvファイルにしてグラフ化したかったので、さらに余計な空白を取り除いてカンマ区切りにしました。

 

ドコモ系別名
air.mopera.net

ソフトバンク系別名
panda-world.ne.jp
openmobile.ne.jp

格安SIM系
ap.mvno.net
rev.vmobile.jp
mesh.ad.jp

分かる範囲で値を集計し調整した上でグラフ化するとこんな感じです。
やはりキャリア回線でのダウンロードが60%近くを占めています。

解析していく中で、panda-world.ne.jp というドメインが全体の5%程度を占めていました。panda-worldって何なんだろうと疑問に思いました。pandaと連想するのは中国で、中国のハッカー集団とか優秀だと聞くので、なんかちょっと良くないものなのかなとも思い調べてみると、ソフトバンクの持ち物である事が分かりました。

ソフトバンクのiPhoneでアクセスすると、このIPアドレス体系になるようです。softbankさんは名前が微妙だなって思います。panda-worldだといろいろな憶測を呼ぶと思います。いかにも中華系って感じるし。softbankという名称をどこかに入れるべきかと。でなくても、bbmobileとかにしてくれた方がいいかと。ネットワーク系で中国につながっていると思うとちょっと引きます。情報が洩れていってしまうイメージです。(あくまでイメージの話ですが。)最近softbankの契約数がドコモやauに比べて減っていますが、やっぱり思想的なところに危険性を感じるからでしょうか。単純に電波が入らないとか、対応が悪いという声も聞きますが、せめてドメイン名なども誤解を生まないような名前にしていただきたいです。

 

コメントする

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です