いますぐ実践! Linuxシステム管理

[バックナンバーのトップへ] [Linux システム管理のトップへ]


いますぐ実践! Linux システム管理 / Vol.132 / 読者数:1305名

こんばんは、うすだです。

前回発行してから3週間。3週間もあれば余裕だなと思っていたら、 本業がえらいことになって、お客さまのところで、 夜中まで作業したりなどしているうちに、発行日をむかえてしまいました。
(もちろん、ずっと監禁されてたわけじゃじゃないですよ。念のため。)

それはさておき、お客さまのところでは、マスクをしているかたが、 結構見られました。

きっと風邪が流行っているんだ、伝染らないように気をつけようと思い、 トイレでこっそりうがいなどして、対処していました。

でも、後から聞いたところによると、みなさん花粉症だったようです。
最近花粉症になるひとが増えていますが、そこまで顕著だとは思いませんでした。 そのうち、花粉症なのが当り前になるかもしれませんね。

というわけで、うっかり先入観にとらわれて、思い込んでしまうのはよくないなあ、 ということをあらためて思い知らされました。
思い込みに惑わされず、なるべく中立な立場で判断していきたいですね。

教訓のようなそうでもないようなですが、今回もはりきってまいります!

今回のお題 - ログを集計してグラフにする

システム管理者という仕事は、システムが正常に動作している間は、 特にやるべきことがない…なんてことはないですよね。

平常時であっても、トラブルの兆候が見られないか、 はたまた不正侵入を試みるやからがいないかなど、 プログラムや人間がログを監視する必要性は、依然としてあるのではないかと思います。

また、そういった細かい点のチェックだけでなく、 各サービスが滞りなく提供できているかなどを、 大局的に確認する必要があると思います。

さて、普段、なにげなしに蓄積されていくログですが、そのまま放置していますと、 異常がないことを確認する以外は誰も見ないまま、 cron さまが古いログを消してしまっているように思われます。

ここはひとつ、システム管理者という地位を利用して、 ログからなんらかの情報を抜き出し、集計してグラフにしてみたいと思います。
視覚化することによって、今まで気づかなかったことが、何かわかるかもしれない、 という淡い期待を込めまして…。


さて、何を集計するかですが、今回は、メールのログから、 送受信バイト数を時間毎に集計してみたいと思います。

実のところ、ほぼ思いつきですが、以前から、 どの時間帯にメール送受信のピークがあるのか知りたかったので、 やってみることにしました。

 

さて、メールのログといえば、/var/log/maillog だと思います。
(ものによっては、 /var/log/mail.info や /var/log/mail.log だったりするかもしれません。 syslog の設定やログの中身などを確認して、各自ご判断くださいませ。)

/var/log/maillog などの中身を、はじめてご覧になった貴兄は、 なんのことやらさっぱりわからないのかもしれません。 ですが、メールの送受信バイト数をカウントするだけなら、 以下を確認するだけで済みます。

たとえば、sendmail の場合、以下のような出力が該当します。
(注意: 先頭の日時とホスト名は、省略しています。)

  sendmail[PID]: キューID: from=送信者, size=サイズ, ...
  sendmail[PID]: キューID: to=受信者, ..., stat=Sent ...

1行目に、送信者とメッセージのサイズなどが記されています。
そして、後の行で、同じキューID とともに、受信者や、 送信結果などが記されています。stat=Sent となっていれば、 相手のメールサーバに送信できたということになります。 stat=Defered などとなっている場合は、なんらかの理由により、 相手に届けられなかったことを示します。

ということは、stat=Sent という結果のキューID のサイズを、 カウントしていけばよさそうですね。

ちなみに、postfix の場合は、以下のように、やや冗長になります。

  postfix/pickup[PID]: キューID: uid=ユーザID from=<ユーザ名>
  postfix/cleanup[PID]: キューID: message-id=<メッセージID>
  postfix/qmgr[PID]: キューID: from=<送信者>, size=サイズ, ...
  postfix/smtp[PID]: キューID: to=<受信者>, ..., status=sent ...
  postfix/qmgr[PID]: キューID: removed

ですが、メッセージのバイト数と、配送されたかどうかを判断すべき箇所は、 sendmail とほぼ同じであることがわかります。

ただ、いずれの場合も、各行の間に、 別のメッセージのログが入っていることがあります。 (つまり、上記のように連続しているとは限りません。)


ようは、これをスクリプトで集計してやれば、グラフ化に近づきます。
ということで、いつものごとく、Perl でちゃちゃっと書いてみました。

  #!/usr/bin/perl
  use strict;

  my %tm;    # 時刻   (キューID をキーとする連想配列)
  my %sz;    # サイズ (キューID をキーとする連想配列)
  my %tot;   # 送受信バイト数 (時間をキーとする連想配列)
  my %num;   # メッセージ数   (時間をキーとする連想配列)

  while(<>) {
      chop;
      # (1) ↓ size=数字 を含むログかどうか判断
      if(/^\S+\s+\d+\s+(\d+):\d+:\d+[^:]*\]:\s*([^:^\s]+):.*size=(\d+)/) {
          $tm{$2} = $1;  # 時間を記録  ($1 が時間、$2 がキューID)
          $sz{$2} = $3;  # サイズを記録 ($3 がサイズ)
      # (2) ↓ stat=sent か status=Sent を含むログかどうか判断
      } elsif(/^\S+\s+\d+\s+\d+:\d+:\d+[^:]*\]:\s*([^:^\s]+):.*stat[^=^\s]*=[Ss]ent/) {
          if($sz{$1} > 0) {              # 記録済かどうか
              $tot{$tm{$1}} += $sz{$1};  # 送受信バイト数の合計
              $num{$tm{$1}}++;           # メッセージ数
              $tm{$1} = $sz{$1} = 0;
          }
      }
  }

  # (3) 結果を CSV 形式で出力
  foreach my $m (sort keys %tot) {
      printf("%02d:00,%d,%d\n", $m, $tot{$m}, $tot{$m}/$num{$m});
  }

大雑把に説明しますと、中央の while 文でログを集計し、 後の foreach 文で CSV 形式を出力します。

while 文の中では、(1) で、size=数字 のログかどうかの判断を行って、 条件に合えば、時間とサイズを連想配列に記録します。
そして、(2) で、送信できたかどうかのログと一致するかどうか判断しています。 一致して、なおかつ、size=数字 のログが以前出てきた場合に、 やっと送受信バイト数をカウントします。

(1) と (2) の if 文では、正規表現を使って、 条件に合うかどうか判断を行っています。
本来であれば、この正規表現の意味を詳しくご説明したいところですが、 ちゃんと書くとものすごいことになってしまいます。
ですので、ここは思い切って、ばっさりと割愛させていただきました。
申し訳ありませんが、ご了承ください。
(正規表現だけで、ひとつのメルマガになってしまうと思いますので…。)

 

さて、これを、たとえば mtasize.pl というファイル名で保存します。
そして、実行可能な形式にして実行すると、以下のようになります。
(ログを参照するには、root の権限が必要です。 セキュリティを考慮すると sudo したほうがよいのですが、 ここでは簡便さを優先しています。)

  # chmod +x mtasize.pl
  # ./mtasize.pl /var/log/maillog
  00:00,1630112,2953
  01:00,2861009,4541
  ...

時:分,送受信バイト数,メッセージあたりの平均バイト数 という形式で、 出力されます。

これで、CSV 形式の出力が得られますので、あとは、 某表計算ソフトなどに持っていって、グラフにすれば、目的達成です。
表計算ソフトの使いかたは、わたしなんかよりも、 みなさんのほうがよくご存じだと思いますし、 これ以上行数を増やすのもよくありませんので、これまた割愛させていただきます。

ちなみに、実際の usupi.org のログを用いてグラフにしたものが、以下になります。

不思議なことに、朝5時と6時に、やたらとメールが使われていることが、 グラフにすることで明らかになりました。

思いつきでやってみた割には、意外な結果が得られて、有意義でした。
…いやいや、有意義でしたで済ませてはいけませんね。スパムが集中しているのか、 はたまたシステムがどかんと報告メールを送っているためか、 これから、原因を追求してみたいと思います。


以上、メールのログを集計して、時間毎の送受信バイト数をグラフにする方法を、 ご紹介しました。

昔、システム管理に関する発表を社内でしたときには、 メールやプロキシのログを集計して、こんなに帯域を使っているんだ的なことを、 グラフにしたことがありました。
そのときもやはり、上記のようなスクリプトを書いて処理した覚えがあります。 (その頃は、某表計算ソフトではなく、gnuplot とか使ったような気がしますが。)

正規表現のお勉強をしないといけないかもしれませんが、上記以外にも、 パケットフィルタリングや WWW サーバのログを集計してみると、 意外なことがわかるかもしれません。
見様見まね的にやってみてもよいと思いますので、 いろいろとトライしてみてくださいませ。

宿題の答え

前回の宿題は、

  今回のファイルを使用して、実際に debパッケージを作成しましょう。

でした。

前回にひきつづき、Digest::SHA2 の deb パッケージを作成したいと思います。 今回、パッケージ名は、他の Perl のモジュールにあわせまして、 libdigest-sha2-perl としてみました。

さて、まずは、前回同様、以下からソースコードを取り寄せます。

Digest::SHA2
http://www.cpan.org/modules/by-module/Digest/Digest-SHA2-1.1.1.tar.gz

これを展開して、とある場所にインストールします。

  % tar xvfz Digest-SHA2-1.1.1.tar.gz
  % cd Digest-SHA2-1.1.1
  % perl Makefile.pl
  % make
  % make test
  % mkdir /tmp/dest-usu
  % make DESTDIR=/tmp/dest-usu install

このあたりは、RPM のときの手順とまったく同じです。
ちなみに、make コマンド実行時に、怒涛のごとくエラーが出ましたら、 おそらく libc6-dev がありません。apt-get などで入手してください。
(それ以外の問題でしたら、詳細情報とともに、ご連絡いただけますと、 いっしょに考えさせていただくかもしれません。)

次に、deb パッケージ作成のための準備を行います。
なにはともあれ、作業用のディレクトリを作成します。

  % mkdir ~/ubu
  % cd ~/ubu

そして、前々回〜前回と使用しました、以下の雛型を入手します。

http://www.usupi.org/sysad/130_usudigest.tgz

これの中の、アーカイブだけを取り出し、展開します。

  % tar xvfz 130_usudigest.tgz usudigest-0.1.tgz
  % tar xvfz usudigest-0.1.tgz

ディレクトリ名が usudigest-0.1 になっていますので、変更します。

  % mv usudigest-0.1 libdigest-sha2-perl-1.1.1

肝心の中身である dest 以下を入れ換えます。

  % rm -rf libdigest-sha2-perl-1.1.1/dest
  % mv /tmp/dest-usu libdigest-sha2-perl-1.1.1/dest

入れ換えたものを、tar コマンドでアーカイブにします。

  % tar cvfz libdigest-sha2-perl-1.1.1.tgz digest-sha2-perl-1.1.1

そして、またしても前回同様、dh_make コマンドを実行します。

  % cd libdigest-sha2-perl-1.1.1
  % dh_make -e usu@usupi.org -f ../libdigest-sha2-perl-1.1.1.tgz

質問には、library と答えたくなるのをこらえて、s と回答します。
そう、single binary だよ、と答えるわけですね。

上記を実行して、debian/ 以下が無事作成されましたら、 debian/control の Description などを埋めましょう。

  Section: libs
  Priority: optional
  Description: Digest::SHA2 Perl Module
  ...

最後に、dpkg-buildpackage コマンドで、deb パッケージなどを作成してもらいます。

  % dpkg-buildpackage -rfakeroot

なんだかよくわからないかもしれませんが、それでもかまいませんので、 まずは、書いてある通りにやってみてください。
(とか言って、わたしもあまりわかっていないのですが…。)

今回の宿題

今回の宿題は、

  メールのログを集計して、日毎の送受信バイト数を求めましょう。

です。

本題では時間毎でしたが、宿題では日毎に集計してみましょう。
できれば、グラフまで作成しちゃってください。
意外な結果がわかるかどうかは、さだかではありませんが…。

あとがき

先週末、出張から帰ってきまして、たまったメールをはやく読まなければと思い、 家からインターネットを使おうとしたところ、ものすごく重くて使いものにならない、 という現象に出くわしました。

これはプロバイダの障害だなと思って、サポートに電話してみましたが、 お待ちくださいというガイダンスが流れるばかりで、 人間との会話に到達することができません。

しかたがないので、あちこちに ping を打ちながら、 障害が解消されるのを待っていました。
しかし、待てども待てども、約50%のパケットをロスしている状況から、 復活するきざしを感じることができません。

こりゃだめだーなんて思いながら、ふと、 おうちのブロードバンドルータにも ping を打ってみました。
…すると、なぜか、同じように、半分くらいパケットをロスしているではありませんか!

プロバイダの障害だとしたら、 ルータの向こうのマシンとの通信に問題があるというのはわかります。 しかし、ルータはおうち内にありますので、プロバイダは関係ないはずです。

で、いろいろ調べた結果、HUB の故障が原因であることがわかりました。
別の HUB を使用することで、さくさく通信できるようになりました。

というわけで、プロバイダを疑ってしまい申し訳なかったなという気持ちと、 サポートに電話がつながらなくてよかったーという安堵感を、同時に感じた週末でした。

冒頭で、先入観にとらわれないようにしよう、とか思った矢先のできごとだっただけに、 己の学習能力のなさには、本当にあきれてしまいました。

今度こそ、ほんとうに、先入観を捨て去って、考えます!
特に、いま、お仕事で原因不明の不具合に悩まされていますので、 過ちを繰り返さないためのいい機会だと思って、挑みたいと思います。

 

今回も、ここまで読んでいただき、ありがとうございました。
それでは、次回は 3月23日 頃に、お会いしましょう!

 

「いますぐ実践! Linux システム管理」の解除は、以下からできます。
http://www.usupi.org/sysad/ (まぐまぐ ID:149633)

バックナンバーは、こちらにほぼ全部そろっています。
http://www.usupi.org/sysad/backno.html

「栗日記」− 出張続きで危うかった栗の更新も、なんとかなりました。
http://www.usupi.org/kuri/ (まぐまぐ ID:126454)
http://usupi.seesaa.net/ (栗日記ブログ)


[バックナンバーのトップへ] [Linux システム管理のトップへ]

トップ

バックナンバー
    [日付順] [目的別]

プロフィール

▼ リンク

独学Linux
Linuxデスクトップ環境に関する情報が満載です。 メルマガもありますよ。
Server World
CentOS 6をサーバとしたときの設定例が、これでもかというくらいたくさん載っています。 CentOS以外のディストリビューション(Fedora, Ubuntu)も充実しています。
LINUXで自宅サーバーを構築・導入(Fedora9)
Fedora9のインストールの仕方から管理方法まで、詳しく載っています。 SearchManには情報がもりだくさんです。
マロンくん.NET
〜サーバ管理者への道〜
Linuxをサーバとして使用するための、いろいろな設定方法が載っています。 マロンくんもかわいいです。 なんといっても、マロンくんという名前がいいですね!!
日経Linux
今や数少なくなってしまったLinuxの雑誌。ニュースやガイドもあります。
Linux Square − @IT
@ITが提供する、Linux の情報が満載。 載っていない設定方法はないんじゃないでしょうか。
gihyo.jp…技術評論社
Linuxに限らず様々な技術情報が満載のサイト。 SoftwareDesign誌も、 ソフトウェア技術者は必見です。
SourceForge.JP Magazine
Linux に限らず、オープンソース関連の記事が網羅されています。
ITmediaエンタープライズ:Linux Tips 一覧
Tips というより FAQ 集でしょうか。わからないことがあれば覗きましょう。
IBM developerWorks : Linux
開発者向けですが、勉強になりますよ。
Yahoo!ニュース - Linux
Yahoo!のLinuxに関するニュース一覧です。
栗日記
システム管理とかと全然関係ありませんが、毎日栗の絵を描いています。
システム管理につかれちゃったとき、癒されたいときに、ご覧ください。:-)
WEB RANKING - PC関連
ランキングに参加してみました。押してやってください。

▼ 作ってみました

Add to Google

▼ せんでん




▼ 最近読んだ本

▼ 気に入ってる本