Amazon Web Services へのデータの転送方法
このトピックの内容
Amazon Web Services を使用して GIS の配置を作成するには、インターネットを通して GIS データの一部またはすべてをクラウド上の場所に転送する必要があります。このトピックでは、クラウド上でデータを格納できる場所およびデータを転送する方法の選択肢について説明します。データの転送時間に影響する要素についても説明します。
データの格納場所
ArcGIS Server を実行する EC2 インスタンスを作成したら、データをクラウドに転送する準備を行う必要があります。データを格納できる場所はいくつかあります。次のオプションはいずれも Amazon からの請求が発生し、その内容が変更される場合があるため、使用するかどうかを決定する前にご確認ください。
EBS ボリューム - Amazon EBS (Elastic Block Store) ボリュームは、EC2 インスタンスにアタッチしてデータ格納領域を追加できる仮想ディスク ドライブです。実際、ボリュームは ArcGIS Server AMI (Amazon Machine Images) の一部として常にアタッチされます。このアタッチするボリュームのサイズは、ArcGIS Server Cloud Builder on Amazon Web Services でサイトを構築するときに構成できます。ArcGIS サーバーのディレクトリはこのドライブ上で構成されます。したがって、データをサーバーにコピーするオプションを指定してサービスを公開すると、データはこの EBS ボリューム上に配置されます。このボリュームに他のディレクトリを作成して、データを維持することもできます。
Amazon S3 - Amazon S3 (Simple Storage Service) は、クラウドでのデータ ストレージ専用に設計された Amazon のサービスです。このストレージ オプションを利用すると、データの障害や損失が発生する可能性が最も低くなります。S3 は、データのバックアップ用の場所として、またはオンプレミスの配置と EBS ボリューム間でデータを転送する際の中間地点として使用できます。また、作成した EBS ボリュームのスナップショットは、すべて S3 に格納されます。
- EC2 インスタンス - データを直接 EC2 インスタンスに転送できますが、インスタンスを終了すると C またはルート ドライブのデータは直ちに失われます。ArcGIS Server AMI は C: ドライブに比較的小さな領域 (Windows の場合 60 GB) を割り当てて、このドライブがデータの格納用に使用されないようにしています。これに対して、D: ドライブなどのアタッチされた EBS ボリュームはインスタンスが終了しても保持されるため、データ格納用として安全に使用できます。
注意:
GIS データやマップ キャッシュは、運用配置の EC2 インスタンスの C: ドライブまたはルート ドライブに格納しないでください。
クラウドにデータを転送する方法
オンプレミスの配置からクラウドへのデータの転送には時間がかかり、場合によっては IT セキュリティ スタッフと協力して作業を行う必要があります。多くの場合、インターネット上 (つまり、クラウド上) の場所へのデータのエクスポートは、ローカル ネットワーク内での一般的なデータ転送と比べて低速で安全ではありません。
データをクラウドに転送する際にはさまざまな方法を利用できますが、機密データを扱う場合は IT スタッフと協力して作業を行い、選択した方法が安全であること、および組織で承認されていることを確認します。利用できる方法のいくつかを以下に示します。
サービスの公開時にデータをコピーするように ArcGIS を構成する - サービスを公開するときに、そのサービスのデータを常にサーバーにコピーするように ArcGIS を構成できます。データはサービス定義ファイル (*.sd) にパッケージ化され、ArcGIS Server のアップロード ディレクトリに転送された後、最終的に ArcGIS サーバーの入力ディレクトリまたは ArcGIS Server に (ArcGIS Server の管理されたデータベースとして) 登録したデータベースに解凍されます。マップまたはその他のリソースで使用する範囲とデータセットを制限していない場合は、この処理に長い時間がかかり、大量のデータ転送が発生する可能性があります。
このオプションでは、サービス間でデータを共有することはできません。また、クラウドとオンプレミスの配置の間でデータを同期することもできません。
リモート デスクトップ接続によるコピーおよび貼り付け - Windows のリモート デスクトップ接続を使用すると、ファイル システムのリダイレクトを許可して、ローカル ドライブをリモート コンピューターにマップすることができます。リモート デスクトップを通して Windows 上の EC2 インスタンスにログインすると、Windows エクスプローラーを開いて、データをローカル ドライブから EBS ボリュームにコピーすることができます。
ファイル システムのリダイレクトを有効にするには、[リモート デスクトップ接続] ウィンドウで [ローカル リソース] タブをクリックし、ドライブを利用可能にするチェックボックスをオンにします。使用している Windows のバージョンに応じて、表示される内容が異なります。Windows 7 の場合、ドライブを利用可能にするオプションを表示するには [詳細] ボタンをクリックする必要があります。
リモート デスクトップ接続を使用して機密データを転送する場合は、セキュリティの追加レイヤーが設定されていることを確認してください。古いバージョンのリモート デスクトップ接続には、サーバーを装ったコンピューターがデータへのアクセス権を取得できるという、セキュリティの脆弱性 (中間者攻撃とも呼ばれます) が存在することが知られています。
注意:
コピーおよび貼り付けでは、データの転送が完了するまでに時間がかかる場合があります。貼り付けの処理が完了する前に、別のファイルやデータをコピーしないでください。処理が完了する前にコピーを行うと、貼り付けが途中で終了し、初めからやり直す必要があります。
S3 クライアント ユーティリティ - Amazon S3 は、データをオンプレミスの配置から EBS ボリュームに移動する際の中間地点として使用できます。データを S3 に転送するには、AWS Management Console を使用するか、S3 とコンピューターの間でファイルを簡単に移動できるように設計されたサードパーティ製のアプリケーションのいずれかを使用できます。データを S3 に転送した後、EC2 インスタンスで同じユーティリティを使用して、データを S3 からインスタンスに転送することができます。
独自の Web サーバー - HTTP を通して Web 上で利用可能なデータは、EC2 インスタンスからもアクセスできます。組織内に Web に公開されたサーバーがある場合は、このサーバーにデータを配置して、EC2 インスタンスからデータをダウンロードできます。この方法の利点は、Web サーバーでセキュリティを構成して、データをダウンロードできるユーザーを制限し、SSL を使用してトランザクションを暗号化できることです。
FTP - FTP (File Transfer Protocol) を有効にして、ファイルを直接 EC2 インスタンスにアップロードできます。標準的な FTP は情報を暗号化せず、パスワードをプレーン テキストで送信することに注意してください。FTP を安全に使用するには、セキュリティ対策を追加する必要があります。たとえば、SSL を使用して FTP セッションを暗号化したり、FTP を通してインスタンスにデータを転送できるユーザーを制限したり、最初のデータ転送が終わった後に FTP を無効にしたりします。一部のサードパーティ製品は、セキュリティで保護された FTP 接続を設定できるように設計されています。
AWS Import/Export - 大量のデータを Amazon に転送する必要がある場合は、データを持ち運び可能なストレージ デバイスに保存して Amazon 社に送り、データを直接 S3 に読み込むよう有償で依頼する方が、時間がかからずコストも小さくなる場合があります。Amazon では、このサービスを AWS Import/Export として提供しています。
AWS Import/Export の使用を検討する場合は、組織のデータの機密性に対して、この方法が適切であるかどうかを判断する必要があります。デバイスを郵送する場合は常に、データの物理的な破損または盗難のリスクがわずかながら伴います。これらのリスクは、データをバックアップおよび暗号化することで軽減できます。AWS Import/Export がデータに対して適切な方法であるかどうかが不明な場合は、直接 Amazon にお問い合わせください。
Amazon は、さまざまなソリューション プロバイダーと連携しています。これらのプロバイダーのいくつかは、データ転送、ストレージ、およびセキュリティのソリューションを提供しています。これらの企業が各自のクラウドの方針に役立つかどうかを判断するには、「Find an AWS Solution Provider」をご参照ください。Esri はこれらのプロバイダーの 1 つであり、Amazon クラウドに GIS を配置するためのさまざまなプロジェクトおよび実装サービスを提供しています。
データの転送時間に影響を与える要素
データ転送オプションのパフォーマンスは、Amazon クラウドとの物理的な近接性、時間帯、およびインターネット接続の品質に基づいて変化します。
GIS データセット (特に画像やマップのキャッシュ) は大容量を消費する可能性があるため、転送の前に圧縮を行ってファイル サイズを小さくするかファイルの総数を少なくし、転送をより効率的に行う必要があります (特に、マップ キャッシュの場合)。一部の S3 クライアント ユーティリティでは、転送可能な 1 ファイルあたりのサイズや、格納できるファイルの総数が制限されています。また、一部の圧縮プログラムには、圧縮可能なデータの量に制限があります。データ転送オプションを選択する際には、圧縮にかかる時間と必要な操作も考慮する必要があります。
最後に、S3 を使用する場合は、作成できるバケットの数に関する制限と、S3 バケットに関するその他の制限について注意してください。これらの情報については、「Bucket Restrictions and Limitations」をご参照ください。
データ パスの整合性の維持
データを新しい場所に移動する際は常に、そのデータを参照しているパスの更新が必要かどうかにも注意する場合があります。これは、大量のデータ レイヤーをさまざまなパスで参照しているマップ ドキュメントで重要です。
Amazon EC2 のデータの場所を ArcGIS サーバーに登録すると、公開後に壊れたデータ パスを修正する作業を減らすことができます。「ArcGIS for Desktop を使用したデータの ArcGIS Server への登録」をご参照ください。
別の方法として、インスタンスにログインし、ArcMap を使用して古いパスを修正することもできます。ArcGIS Server AMI には ArcGIS for Desktop が含まれているため、修復を簡単に行えます。
データ接続の修復が必要とならないように、マップ ドキュメントで相対パスを使用し、マップとデータを共通のフォルダーに格納する方法もあります。