1998/11/13 運営委員会 資料 2-11 システム管理業務に関する報告 ◎項目一覧 月例報告 ・システム障害報告 ・システム更新・増強報告 ・ネットワーク運用状況 個別報告事項 ・APTLDサーバ設置について ・whoisサーバ更新について 作業予定 ◎月例報告 §システム障害報告 1998年10月16日から本日までに発生したシステム障害について報告する。 1. 空調の故障によるサーバ障害について * 障害の状況 10月19日早朝、事務局マシンルームの空調に障害が発生しマシンルーム内 が高温になったため、データベース処理サーバがサーバがダウンした。 * 障害の原因 室外機のファンモータ故障によるもの。 なお、今回の障害ではハードウェアには特に障害は発生しなかった。 * 障害からの復旧 故障部品の緊急修理により復旧した。 * 今後の対策 監視の強化(業者の導入等)を検討する。 2. 申請メールの到着遅延について * 障害の状況 10月26日から27日にかけて、一部の会員プロバイダからの申請メールの 到着が遅延する障害が発生した。 * 障害の原因 今回の DB 更新作業により whois サーバ切り替え作業が必要になった影 響で、メールリレーサーバの切り替え作業を急遽行う必要が生じた。 このため、新メールリレーサーバのセットアップおよび MX レコードの切 り替え作業を10月24日(土)に行った。 26日(作業日)の時点でほとんどのネームサーバの設定が更新されていたこ とを確認していたが、一部のネームサーバに古い記述が残っていたため、 26日から27日にかけて、該当プロバイダからのメールの到着遅延が発生し た。 ただし、NSPIXP2 ルータでのアクセスコントロールにより旧アドレスでの メールを停止していたため、受信メールのロストは確認されていない。 * 障害からの復旧 27日の午後前後から、自然に復旧したとの報告を受けている。 * 反省点 本障害については、十分な計画性(DNS が切り替わるまで、もう数日の猶 予を取る、同一 IP アドレスで仮リレーサーバを立てておく等)を持った 移行作業を行うことで、十分防止することができたものであった。 3. whois.nic.ad.jpにおけるシステム障害について * 障害の状況 10月28日の午前7:00ごろから午前10:50まで、システムハングアップのた め whois.nic.ad.jp (更新前の旧サーバ)のサービスが中断した。 * 障害の原因 障害発生時に、該当マシン(UltraEnterprise4000)のシステム LED 等は 異常を示しておらず、また syslog 等にも異常を示すログはとられていな かったため、原因は現在に至るまで不明である。 なお、後日の調査により本障害の原因と考えられる項目として、該当マシ ンのファームウェアはバージョンが古く、特定の条件下においてシステム の I/O バスがハングアップする障害が報告されていたことが判明した。 * 障害からの復旧 該当マシンの緊急リセットにより復旧した。 * 障害への対応 現在の whois.nic.ad.jp は、もう1台の UltraEnterprise4000 で動作し ており(別項を参照)、本マシンについてはセットアップ時にファームウェ アを最新バージョンに更新している。 なお該当マシンについては、ファーム、システム等を最新版に更新後、 whois のバックアップサーバとしてセットアップすることを予定している。 4. whois サービスの再開の遅延について * 障害の状況 システム作業の遅延により、本来復旧予定であった11月2日午前までに whois サーバが復旧せず、当日の午後5時5分まで whois サービスが中断 した。 * 障害への対応 緊急に、whois ポートに障害を示すメッセージが出力されるプログラムを 動作させ、JPNIC の WWW サーバにおいても同様の報告を行った。 §システム更新・増強報告 1998年10月から本日までに行ったシステム上の主な更新、増強作業について 報告する。 1. 事務局メーリングリストサーバの更新について * 作業日時・内容 10月7日に、事務局メーリングリストサーバを、本年度に導入したサーバ 用マシン(msgmgr)に移行し、同時に sendmail および CF のバージョンを それぞれ最新(8.9.1+3.1W, 3.7Wpl2)に更新した。 2. 外部メールリレーサーバの更新について * 作業日時・内容 10月24日に、外部からのメールリレーサーバを、本年度に導入したサーバ マシン(extsv1: KDD ハウジングスペースに設置)に移行し、同時に sendmail および CF のバージョンをそれぞれ最新(8.9.1+3.1W, 3.7Wpl2)に更新し た。 3. whoisサーバシステム更新について * 作業日時・内容 10月末から11月にかけて、whois サーバの新規導入を行った。 作業内容等については、別途報告を参照のこと。 4. ネームサーバ SOA レコードのバージョン番号の更新について(2000 年対応) * 作業日時・内容 11月12日更新分より、JPNICが管理しているゾーンファイルの SOA 部の バージョン番号を、従来の YYMMDDVV フォーマットから、 YYYYMMDDVV(年の部分を4桁とする)フォーマットを出力するように変更した。 §ネットワーク運用状況 NSPIXP2(KDDハウジングスペース)等における、ネットワーク運用状況につい て報告する。 1. peering 状況等 * 10月26日に TTNet(AS4716)と覚え書き(先方のフォーマット)を交換し、 NSPIXP2 経由でのトラフィックの交換を開始した。 * 現在、JPNIC では NSPIXP2 において 39 箇所の組織等と peering を行っ ている。 2. 今後について * JPNICの公共性を考慮した場合、基本的に NSPIXP2 のすべての組織と peering を行うことが望ましいと考えられる。 * 今後、準備が出来次第 NSPIXP2 におけるトラフィック等の利用状況に関 する情報も徐々に分析していきたいと考えている。 ◎個別報告事項 システム関連の作業のうち、特に詳細に報告すべき事項について報告する。 §APTLDサーバ設置について APTLD サーバを KDD ハウジングスペース内に設置し、WWW サーバ、メール サーバ環境等のセットアップを行った。 サーバマシンの納品が遅れたため、現在データディスクを別マシンに設置し、 バーチャルホスト機能を用いて運用中である。 (下記作業予定も参照のこと) §whoisサーバ更新について 10月末から11月にかけて、DB システム更新に伴う whois サーバの更新作業 を行った。ここでは、主としてシステム関連の作業内容について報告する。 * 作業内容 (1)OSの更新 - ファームウェアの更新(パッチ 103346-13) - 従来の Solaris2.5.1 から、Solaris2.6 98/5 Hardware release に更新 - 最新の Recommended パッチのアプライ (2)Solstice DiskSuiteの導入 - Sybase のデータディスク、トランザクションログディスクのミラー化 - アクセスログ保存用ディスクの Raid 5 化 - DiskSuite へのパッチ(104172-10)の適用 * バグの除去 * 2,000 年問題への対応 (3)システム設定のチューニング - 1プロセスが同時にオープン可能なファイルを従来の 64 から 1024 に変更 - /var、スワップの増強 - 共有メモリ領域を 256M に増強(Sybase 用) (4)Sybase関連の更新 - バージョン10からバージョン11(最新版)に更新 - トランザクションログの自動処理(自動運転に対応) - Sybase が使用するデータ領域を従来の UNIX ファイルから raw デ バイスに変更(アクセス速度増強を図るため) - 同時に接続可能なユーザ数をデフォルトの 25 から 100 に変更 - ストアド・プロシージャのキャッシュ領域を2倍に変更 - 該当マシンは 4CPU モデルのため、dataserver プロセスが常に3つ 常駐するように設定(1つは一般ジョブ用) ◎作業予定 今後1ヶ月以内に予定されているシステム関連の作業について報告する。 §APTLD サーバインストール APTLD サーバマシンが10月20日に納品され、現在システムの設定作業を行っ ている。作業が完了次第現在のサーバ(一時的に別サーバと共存)を、独立し たサーバに変更予定。 §旧 whois サーバの更新 旧 whois サーバマシンを現在の whois サーバマシンと同様のシステム構成 に更新し、whois サーバとして設定するための準備作業を行う予定。 §事務局設備の増強 人員増加に伴い、事務局のホームディレクトリ用ディスク、ネットワーク 設備(スイッチングハブ)等の増強を行う予定。 (以上)