ネットワーク問題解決の新しいパラダイム|NetScout
ホワイトペーパー
|ホワイトペーパー|

ネットワーク問題解決の
新しいパラダイム

全組織の48 パーセントでは、トラブル・チケットの解決に平均半日以上かかっている
それはパラドックスです。より以上の信頼性がネットワークに組み込まれるようになってきているものの、組織はいまだにトラブルシューティングに相当な時間を費やしており、問題解決時間の短縮にプレッシャーがかかっています。このホワイトペーパーでは、最新のネットワーク問題解決策と、NETSCOUT OneTouch™ AT ネットワーク・アシスタントに基づいて、新しいアプローチがいかにトラブルシューティング時間を毎月まる 1 週間も短縮できるかについて説明します。

問題は過去のことでしょうか?

毎年、ネットワークの信頼性は高まっています。新しい規格が相互運用性を約束し、新しいデバイスが構成を単純化し、高度なモニタリング・ソリューションが提供され、ユーザーが影響を受ける前に問題を検出します。IT 部門は、問題が過去のものになる時代に入っています。

これは事実でしょうか?大中規模の組織の 300 人を超えるネットワーク担当者を対象に実施した最近の調査研究によると、以下のことが明らかになりました。
  • 全組織の48 パーセントでは、トラブル・チケットの解決に平均半日以上かかっている
  • 全組織の 46 パーセントがトラブル・チケットの解決にかかる時間の短縮を迫られている。
  • ネットワーク担当者は自分の時間の約 25 パーセントを問題の解決に費やしている。
問題をなくすために IT が大きく進歩しているにも関わらず、なぜこのようなことが起こっているのでしょうか。1 つの説明として、信頼性と簡略化が向上するたびに、物事を複雑にする相殺的なテクノロジーの進歩があることです。ユニファイド・コミュニケーション、802.11ac、クラウド・コンピューティング、IPv6 などがその例です。しかし、理由の如何を問わず、問題解決の生産性を改善することで多くのメリットが得られます。

生産性を高めるために、トラブルシューティング・ツールはテクノロジーの変化に遅れずについていく必要があるだけでなく、問題解決に使用するプロセスを絶えず改善する必要があります。

現在のトラブルシューティング方法

組織の過半数(72 パーセント)は標準化されたトラブルシューティング・プロセスに従っていません。1 つの組織内にさまざまなプロセスが存在するだけでなく、問題のトラブルシューティングに使用しているツールも大きく異なります。調査の回答者は、8 種類のツールを問題の解決に使用していると報告しています。47 パーセントの状況では、複数のツールが必要でした。トラブルシューティングの手順とツールがこれほど多ければ、トラブルシューティングにかかる時間の 63 パーセントが 1 時間以上かかるのは当然のことです。

別々に検討する価値のある問題解決があります。多くの場合、技術者 1 人で問題を解決することはできません。特に難しい問題では、追加の手助けが必要になることがあります。また、問題が職務の範囲外であるため、企業内の別のグループ(サーバー管理やアプリケーション開発者など)や外部(サービス・プロバイダーや機器ベンダー)と協力しなければならないこともあります。これは珍しいことではなく、当社の調査によると、すべての問題の 41 パーセントがこの種の共同作業を必要としています。このプロセスには、少なくとも 2 つの理由で過剰な時間がかかることがあります。第一に、問題が発生しているときに、担当者にその可視性を提供するのは必ずしも容易ではありません。第二に、これらの問題に対して多くの場合必要になる(19 パーセントの確率で)トレース・ファイルを技術者が簡単にキャプチャできない可能性があります。
生産性を高めるために、トラブルシューティング・ツールはテクノロジーの変化に遅れずについていく必要があるだけでなく、問題解決に使用するプロセスを絶えず改善する必要があります。

問題解決手法の調査

このホワイトペーパーでは、2012 年の 4 月に NETSCOUT が 315 人のネットワーク担当者を対象に実施した調査を引用しています。回答者は主として、さまざまな業界における中規模から大規模のネットワークに携わっています。その大半は上級のネットワーク・サポート担当者です。

図 1:最近のユーザー問題の解決に以下のどのツールを使用しましたか?

図 2:通常、1 か月にどのくらいのトラブル・チケットを処理しますか?

図 3:あなたのグループでトラブル・チケットの解決に要する時間は、平均でどのくらいですか?48% が 4 時間以上と報告していることに注目してください。

図 4:前回解決したユーザー問題の根本原因は何でしたか?(複数回答可。)

調査では、ユーザーが最近報告した問題の根本原因を回答者に示してもらいました(回答者は複数の根本原因を選択可能)。最も一般的な原因は、事例の 27 パーセントで発生しているネットワークの問題(有線または Wi-Fi)でした。ただし、エンドユーザーによる構成または操作の問題を合わせると、事例の 42 パーセントで過失によるものでした。

OneTouch AT は最も一般的なネットワーク問題を約 1 分で特定します1

変化する問題解決パラダイム

NETSCOUT では、問題解決プロセス全体の短縮を試みました。前述のように、このプロセスは従来、単独のトラブルシューティングおよび必要に応じて共同作業の、2 つのステップで構成されます。トラブルシューティングを簡素化するために、NETSCOUT は 3 ステップ・プロセスを開発し、それに基づいて新しいツールを設計しました。3 つのステップは以下の通りです。

1. 自動テスト
2.トラブルシューティング
3.共同作業

OneTouch™ AT ネットワーク・アシスタントは各ステップを強化し、問題解決の時間を大幅に短縮します。

ステップ 1:自動テスト

ステップを追加して時間を短縮するというのは矛盾に思えるかもしれません。しかし、追加のステップにより実際に後のステップで多くの時間を節約でき、合計時間は短縮します。これが、自動化テストの背後にあるアイデアです。

OneTouch AT は最も一般的なネットワーク問題を約 1 分で特定します1。これは、エンドユーザーの視点から完全なネットワーク分析を実行します。手動で実行されるこのような分析は、約 1 時間かかります2。OneTouch AT は同じテストを約 1 分で実行します(テストは構成可能であり、10 秒から数分かかる場合がありますが、ほとんどは 1 分未満です)。その後結果はユーザー定義の制限に対して比較され、シンプルな合格/不合格の結果を提供します。このアプローチによって、技術者は、エンドユーザーの苦情につながる最も一般的な問題を発見できます。

自動テストには複数の利点があります。まず、一般的な 試行錯誤によるテストよりもはるかに高速です。第二に、手動のアプローチよりも完全です。つまり、技術者が考慮していなかった問題も見つけることができます。第三に、スキルのレベルに関係なく、誰でもテストを実行して問題を特定できます。

ステップ 2:トラブルシューティング

オートテストはさまざまな問題を単独で発見する一方、すべての問題をこの方法で見つけられる訳ではありません。OneTouch AT は優れたトラブルシューティング能力を提供し、この段階で費やす時間を減らします。

AutoTest – 最初のオートテストで問題が特定されなくても、すべての測定結果が用意され、これを利用して技術者は発生していることを理解できます。さらに、オートテストは数秒間で変更して、再実行して別のサーバー、アプリケーション、または無線接続をテストできます。

有線テスト – 一連の完全なテストが、ケーブル、PoE、最も近いスイッチ、とネットワーク・サービスに関する情報を提供します。OneTouch AT はウェブブラウザ、Telnet および SSH クライアントを備え、スイッチやアクセスポイントなどのネットワーク・デバイスの構成を支援します。トーナーも装備し、スイッチ・ポートのライトが点灯して、輻輳が発生しているクローゼット内のマークがないケーブルを見つけることができます。ビデオ・プローブを OneTouch AT に接続して、光ファイバー・コネクターの端面の汚れを検査することができます。

OneTouch AT はネットワークのトラブルシューティングと検証を行いながら、4 ヵ月以内に自動で支払いを行うため、時間の節約になります。
無線テスト – OneTouch AT は、無線フリーウェアやシェアウェア・ツールのライブラリよりも多くのWi-Fi ネットワーク分析を提供し、理解しやすい形式で回答を提供します。OneTouch AT は範囲内のすべてのネットワーク、AP、およびクライアントを検出し、不適切なセキュリティ、干渉、帯域幅を占有しているもの、過負荷のチャネル、未許可デバイスなどの問題をすばやく特定します。

ステップ 3:共同作業

先に述べたように、ネットワーク技術者は問題を解決するために、頻繁に他者と協力する必要があります。しかし、適任者に正しい情報を渡すプロセスには、場合によっては数日かかることがあります。この期間中、技術者は他の問題に取り組むことができるとしても、仕事を完了できないエンド・ユーザーや、トラブル・チケット処理時間の目標を達成できない IT マネージャーにとっては非常に不便です。

OneTouch AT には、Link-Live クラウド・サービスとの共同トラブルシューティングの促進を特に目的とした機能があります。Link-Live クラウド・サービスを使うと、ゼロタッチ・レポート作成であらゆる事項を常に記録でき、作業と結果を常に完全に記録できます。この包括的かつ検索可能なデータベースは、ネットワークの変更を簡単に特定できるようにします。容量の制限や時間の制限はなくなり、一日の終わりにテスト機器からデータを取得し、ストレージに転送する必要もありません。このクラウド・サービスは、次のすべての携帯型ネットワーク・ツールで利用可能です:LinkSprinter、LinkRunner AT、AirCheck G2。これらはすべて、発生と同時にテスト結果を自動的にアップロードします。そのドロップで接続性がない場合、テスターは結果をバッファーに格納することができます。接続性が戻ると Link-Live クラウド・サービスに結果がプッシュされます。技術者はもはやテスト・データの保護者や運送人になる必要はなく、「保存」を押すことも覚えておく必要もありません。その代わりに、生産性を倍増させ、これまで数週間かかっていた仕事を数日で終わらせることができます。また、マネージャーはテスト結果ダッシュボードにアクセスできます。

レポート作成 – OneTouch AT がテストし、観察した事項すべての詳細レポートを Link-Live クラウド・サービスに記録することができます。これによって技術者は、問題を監視しながら、発生していることを同僚に示すことができます。これらの結果には、経験の少ない技術者は見落とす可能性のある結果も含まれますが、知識豊富なチーム・メンバーであれば考慮して評価できるはずです。

インライン・パケット・キャプチャ - 非常に難しい問題にとって、あるいはアプリケーション開発者、サービス・プロバイダー、機器サプライヤーなどの外部グループ向けの証拠として、トレース・ファイルは不可欠です。通常、この情報を収集するにはスイッチまたはネットワーク・タップの再構成が必要です。再構成には 30 分以上かかることもあります。さらに、多くの技術者はスイッチのプロビジョニングまたはタップにアクセスできない場合があります。つまり、問題が別の人に上申されるので、ますます遅れてしまいます。

OneTouch AT は、スイッチやタップにアクセスする必要なく、画面に数回タッチするだけでインライン・パケット・キャプチャを実行できます。つまり、技術者はユーザーが問題を示している間に、問題のあるパケットを即座にキャプチャすることができます。

ウェブ・リモート・インターフェース – 問題のある現場に実際にスタッフを送ることは常に可能ではありませんが、OneTouch AT は PC、タブレットまたはスマートフォンなどのリモート・デバイスを通してアクセスし、制御することができます。リモート・ユーザーは、技術者と同じ情報を表示できるだけでなく、OneTouch AT を制御して、トレース・ファイルやレポートを自分のデバイスにエクスポートできます。

カメラ – ウェブカメラを OneTouch AT USB ポートに接続すると、リモートの助手は、技術者が作業している物理環境のライブビデオを見ることができます。これは、たとえば技術者が配線クローゼットまたはデータセンターにおり、リモートのスタッフがスイッチまたはパッチパネルを確認する必要がある場合に役立ちます。

節約

OneTouch AT での節約の見積もりにおける最初のステップは、テストの 3 つの部分のそれぞれで節約された時間を調べることです。

自動テスト – 表 1 は、オートテスト機能の実行にかかる時間の量を、オートテストの実際の時間と比較したものです。この時間は、技術者のスキルと、テストする必要のあるアプリケーションの数によって異なります。

トラブルシューティング – これらの節約を定量化することは、あまり直接的ではありません。これは、実際の問題や技術者のスキルに非常に左右されるためです。他の NETSCOUT 携帯型ネットワーク・テスト・ソリューションのユーザーは一般に、トラブルシューティングが 30 ~ 40 パーセント高速化したと報告しますが、ここではこれを、付加的な「ボーナス」節約として見なします。

共同作業 – これらのシナリオにおける時間の節約を定量化するために、私たちは、ポート・ミラーリングを使ったパケット・キャプチャのセットアップ時間(約 20 分)と OneTouch AT でのインライン・パケット・キャプチャの時間(3 分)を比較しました。技術者がスイッチを再構成する権限を持たない場合は、時間の節約はより大きくなります。

より優れた共同作業により、トラブル・チケットの解決にかかる合計時間が短縮され、利益は大きくなります。OneTouch AT がないと、関係者の前ですべての関連データを素早く入手することは多くの場合困難です。これは、トラブル・チケットの解決に時間がかかる(数日など)大きな原因です。OneTouch AT があれば、最初の回答者はレポートまたはトレース・ファイルを簡単に生成し、これらを共有し、さらにチームの他のメンバーにリアルタイムでリモート・アクセスを提供します。このように、スタッフが問題に費やす全体的な時間は短縮されない場合もありますが、エンドユーザーが解決までに待機するのに費やす時間は大きく短縮されます。

かさねて、このような利益は定量化が困難です。このため私たちは定量化を行いませんが、多くの組織にとってこれは、部門スタッフに対して節約された実際の時間よりも貴重である場合があります。

結論

OneTouch AT の使用から期待される節約の見積もりは、表 1 に記載されています。単独のトラブルシューティングで節約された時間と最上位モデルの購入はさておき、6 ヵ月以内での投資額回収を期待できるでしょう。

オートテストによる節約
技術者 1 人あたりの月間トラブル・チケット数 20(平均)
分/チケット 90
オートテストの時間 1 分
オートテスト機能の手動実行にかかる時間
(表 1 より)
60 分
1 チケットあたりの節約時間 59 分
1 チケットあたりの節約時間数 技術者 1 人あたり 19.7
共同作業による節約
パケット・キャプチャを必要とする割合 19 パーセント(平均)
パケット・キャプチャを必要とする数 3.8
パケット・キャプチャのセットアップにかかる時間 20 分
OneTouch AT でのパケット・キャプチャのセットアップ 3 分
1 キャプチャあたりの節約時間 17 分
1 チケットあたりの節約時間数 技術者 1 人あたり 1.1
ユーザー数 OneTouch AT 1 台あたり 2
節約時間合計 41 時間/月
節約した金額
毎時の割合 60 ドル
月間節約時間合計 2,489 ドル
OneTouch AT のコスト 10,000 ドル
回収 4.0 か月間

表 1:OneTouch AT が提供する時間とコスト節約の見積もり

図 5:本書のコンセプトの概要従来の方法と比較した、問題解決プロセス全体を通して OneTouch AT が時間を節約する方法

付録 A – 1 時間のトラブルシューティングを 1 分で行う

根本原因の発見は重要ですが、余分な手順が発生します。たとえば、診察室に行くと、病気に関係なく、まず看護師が患者の体重、体温、血圧を即座に測り、多くの場合既往歴を確認します。このステップにより医師の時間を節約できるだけでなく、多くの場合、さもないと見落とされがちな問題を見つけることができます。

このコンセプトはネットワークのテストにも当てはまります。チームに看護師はいませんが、OneTouch AT は「ネットワークの生体信号」の完全なテストを自動化し、オートテストは 1 時間かかる従来のテストを約 1 分まで短縮します。その後結果はユーザー定義の制限に対して比較され、シンプルな合格/不合格の結果を提供します。このアプローチは時間を節約するだけでなく、技術者はより多くの問題を解決できるようになります。

テスト・ステップ OneTouch ネットワーク
アシスタント(オートテスト)
従来方式
基本的な接続性(有線または Wi-Fi) 1 分 ケーブル・テスター、PC、Wi-Fi ユーティリティ 5 分
インフラストラクチャ・サービス PC、ユーティリティ 5 分
無線動作とパフォーマンス PC 2 台、iPerf 10 分
ネットワーク・サービスとアプリケーション・パフォーマンス パケット・キャプチャ、プロトコル・アナライザー 40 分
(3 つのアプリ)

表 2:OneTouch オートテストは、約 1 時間かかる手動のテストを 1 分で実行します。

基本的な接続性 – OneTouch AT は有線と Wi-Fi 接続性の両方をテストします。有線のテストでは、物理レイヤー(ケーブル配線と PoE を含む)をチェックし、スイッチ・ポート、速度およびデュプレックス設定を確認し、スイッチ・ポートと VLAN を特定します。Wi-Fi では、最も近い AP の接続性とセキュリティ設定を検証し、接続速度をテストします。

インフラストラクチャ・サービス – OneTouch AT は、有線と無線ネットワーク両方の DNS と DHCP の可用性とレスポンス・タイムをテストします。

無線動作とパフォーマンス – 独自のテストが、最も近い AP、有線インフラストラクチャ、有線ポートを通して、トラフィックの流れを無線ポートに送信することで、実際の無線パフォーマンスを測定します。テストは、プログラム可能なアップストリームとダウンストリームの速度を使って、逆方向で同時に実行されます。テストは、両方向のスループット、損失、レイテンシーおよびジッターを含む測定結果を提供します。これらの最後の 2 つの測定値は、ストリーミング・ビデオやボイス・オーバー Wi-Fi などのリアルタイム・アプリケーションの高品質のパフォーマンスにとって不可欠です。

ネットワーク・サービスとアプリケーション・パフォーマンス – これらのテストは、テスト対象のサーバー/サービスとの実際のやり取りを分析することで、アプリケーション・パフォーマンスの詳細な分析結果を提供します。7 種類のテスト/アプリケーションがサポートされ、ローカルで、またはクラウド・ベースのプロバイダーを通してホストされている特定の現場やアプリケーション用にカスタマイズできます。

詳細な分析結果は図 7 に示されている結果を提供し、有線と Wi-Fi ネットワーク両方の結果が並べて示され、簡単に比較できます。

全体的な測定を使用してアプリケーションのパフォーマンスを定量化できますが、詳細を使ってネットワーク、アプリケーション・サーバー、または DNS サーバーのパフォーマンス低下の原因を判断することができます。専門家は、プロトコル・アナライザーを使って 10 分から20 分でこの水準の分析を提供できますが(トレース・ファイルがある場合)、OneTouch AT は標準のオートテストの一環としてこれを 1 分未満で提供します。

図 6:テストは、有線と Wi-Fi ネットワークのパフォーマンスを測定します。

図 7:アプリケーション・パフォーマンス・テストは、サーバーとサービスのレスポンス・タイムの詳細な分析結果を提供します。

付録 B:OneTouch AT ネットワーク・アシスタントのオートテストが発見できる問題のリスト

ファイバーの問題 不適切な SFP/ベンダーの不一致、ファイバー端面の汚れ*、ポート障害/ファイバーの破損、低電力
ツイスト・ペアーの問題 開放ケーブル、不適切なケーブル・マッピング、ケーブル短絡、不正表示の/文書化されていないケーブル*、過剰なケーブル長、ポート障害
PoE 存在しない/無効、スイッチが十分な電力を供給できない、不適切なピン、低電圧、非 Ethernet 電圧、低電力で負荷がかかっている、クラス 4 ネゴシエーションの不一致
リンク 極性不一致、低リンク・レベル、受信ペアの問題 (MDIX)、速度不一致、デュプレックス不一致
スイッチ・ポート 不適切なスイッチ、不適切なポート、不適切なデータ VLAN*、不適切なボイス VLAN*、不安定なスイッチ・アップタイム*、スイッチの輻輳*、スイッチのエラー*、FCS エラー*、フレーム・サイズ・エラー*、その他のフレーム・エラー(7)*、過剰なブロードキャスト・トラフィック*、過剰なマルチキャスト・トラフィック
Wi-Fi セキュリ設定の誤り、AP の欠如、AP の構成ミス、AP が未接続、WLAN コントローラーの問題*、過剰なノイズ*、AP の輻輳*、チャネルの過度な利用*、チャネル上の AP 数が多すぎる*、チャネル上の AP オーバーラップ*、ローミングの問題*、未許可の AP*、不正 AP の検出*、アドホック・ネットワーク*、ネットワーク受信可能範囲が不十分、接続速度の遅延、帯域幅の AP とクライアントの過剰消費*、不正なクライアント NIC*
Veri-Fi QoS 設定の誤り*、MTU 問題*、ポート問題*、アップストリーム帯域幅の問題、ダウンストリーム帯域幅の問題、IPv6 問題*、過剰な損失、レイテンシー問題*、ジッター問題*、配列の問題*
DHCP 欠如、遅延、アドレス範囲外、不適切なリース機関、不適切な DHCP サーバー、有線対 Wi-Fi 構成の問題、スタティック IP アドレスの重複、IP アドレスのハイジャック、不適切なアドレス配信、不適切なサブネット配信、不適切なルーター・アドレス、不適切な DNS アドレス
DNS 欠落、遅延、セカンダリ・サーバーがない*、有線対 Wi-Fi 構成の問題*
ゲートウェイ 欠落/不具合、IPv6 未対応*、不安定なゲートウェイ・アップタイム*、過負荷*、不適切なトラフィック*、不適切なルーティング・プロトコル*
ディスカバリー 不適切な VLAN*、不適切なサブネット*、予期しない IPv4/IPv6 デバイス
Web (HTTP) DNS ルックアップの障害、DNS ルックアップの遅延、サーバーが利用できない、接続の遅延、サーバーの起動が遅い、サーバーの完了が遅い、有線対 Wi-Fi のトランスポート問題、IPv4 対 IPv6 のトランスポート問題
Ping (ICMP) DNS ルックアップの障害、DNS ルックアップの遅延、サーバーが利用できない、接続の遅延、MTU 構成ミス、有線対 Wi-Fi のトランスポート問題、IPv4 対 IPv6 のトランスポート問題

付録 B:(続き)

接続 (TCP) DNS ルックアップの障害、DNS ルックアップの遅延、サーバーが利用できない、接続の遅延、ファイアウォールのポート構成ミス、有線対 Wi-Fi のトランスポート問題、IPv4 対 IPv6 のトランスポート問題
マルチキャスト (IGMP) サーバーがマルチキャストを実行しない、スイッチの IGMP スヌーピングが無効、不適切なポート構成、サーバー認証
ファイル (FTP) WAN の遅延、DNS ルックアップの障害、DNS ルックアップの遅延、サーバーが利用できない、接続性が遅い、サーバーの起動が遅い、サーバーの完了が遅い、有線対 Wi-Fi のトランスポート問題、IPv4 対 IPv6 のトランスポート問題
ビデオ (RTSP) WAN の遅延、DNS ルックアップの障害、DNS ルックアップの遅延、サーバーが利用できない、接続性が遅い、サーバーの起動が遅い、サーバーの完了が遅い、有線対 Wi-Fi のトランスポート問題、IPv4 対 IPv6 のトランスポート問題

* オートテスト後に二回目のテストが必要な場合があります。

1 付録A「An Hour of Troubleshooting in One Minute」を参照してください。
2Appendix B「OneTouch AT Network Assistant AutoTestで検出される問題」を参照してください。

 
 
Powered By OneLink