映像配信 さくら障害報告

さくらのクラウドに立てたサーバに映像配信

日本語 3Mbps,800Kbps,300Kbps
英語 3Mbps,800Kbps,300Kbps
北京語 3Mbps,800Kbps,300Kbps

合計 約12Mbpsの映像配信をしていた。インターネットルータで出ている速度は上り130Mbps程度だった。

インターネット速度はいつもwiled speed で計測します。

日本語だけエンコードしている間は問題が出なかったが、英語・北京語も合わせてエンコードを始めたところ、クライアント側で時々映像が止まる事が起こった。

ログを確認したらやっぱりボロボロ止まってる。deleteStreamって事は映像が届かなくて切断したって事。ルータから、sakuraのクラウドへのpingが20ms程度で安定している時は特にこの現象は起きない。60ms移行が出てきた時は要注意。

ルータ兼 nginxサーバのログ

この時のPingログ かなりばらつきが

同じ時間帯のCloudn(OCN)は安定 17ms 〜 18msで返ってきていた。

先日までずっと調子よかったのに、今日だけおかしい。先日との違いはサーバを停止させていた事。1週間ほど停止させ、本日起動しなおした。これが原因か?仮定としてはクラウド上のサーバは起動ごとにつかむネットワークが違うのではないか?

例えば、ヘビーユーザ(ヘビーなサービスを提供している)VMと同じセグメントに所属してしまうとそのヘビーユーザにひきずられて、インタネット速度が出ないとか。

試しにVMへ向けてTracerouteし、一度VMを停止させ、再度起動後Tracerouteし直すとどうなるか確認してみると、通信経路が変わった。

いや、だけどこれもあてにならない。停止させなくても時間と共に通信経路は変わるらしい。

停止・起動後経路が変わったのでこれかぁと思ったのだけど、ずっと起動していても勝手に経路はかわっていたので、これが問題ではないみたいです。

午後9時過ぎてpingを打ちなおしてみたところ、

快調。映像が止まる事もなくなった。このping の速度ゆらぎが、映像配信がうまくいくかの指標になるのが良く分かった。

ping速度のアラートを出せるようなプログラムでも作ろうかなぁ。