このチュートリアルでは、ビッグ データ ファイル共有を作成するためにデータを設定する手順を、順を追って説明します。ビッグ データ ファイル共有は、ポータルに作成されるアイテムであり、GeoAnalytics Server が利用可能な場所にあるフィーチャ データ (ポイント、ポリライン、ポリゴン) を参照します。ポータルにあるビッグ データ ファイル共有アイテムを使用すると、データセットに対して GeoAnalytics Toolsを実行できるように、登録済みのデータを参照して選択できます。ビッグ データ ファイル共有の作成後は、[ポイントの集約] ツールを使用してデータを利用します。このチュートリアルでは、タクシーの下車場所と乗車場所のデータセットをダウンロードし、GeoAnalytics Tools を使用して下車が最も頻繁に行われている場所を特定します。
前提条件
ArcGIS Enterprise 管理者が GeoAnalytics Server を構成していることを確認します。GeoAnalytics Server にアクセスできるよう、管理者から ArcGIS Server Manager の URL を入手してください。詳細については、ArcGIS GeoAnalytics Server の設定をご参照ください。
データの準備
ここで示す例で使用されるデータをダウンロードして準備するには、次の 2 つのステップを実行します。
- 「BigDataExample」という名前のフォルダーを、GeoAnalytics Server が利用可能な場所に作成します。BigDataExample フォルダー内に、「NYCTaxi」という名前のフォルダーを作成します。
- http://www.nyc.gov/html/tlc/html/about/trip_record_data.shtml にアクセスして、2014 年 1 月と 2 月の黄色 (Yellow) のタクシー データを BigDataExample > NYCTaxi フォルダーにダウンロードします。
ビッグ データ ファイル共有の作成
すべての GeoAnalytics Server コンピューターがアクセス可能な場所にデータを保存したら、GeoAnalytics Server Manager を使用して、そのデータをビッグ データ ファイル共有として GeoAnalytics Server に登録します。ビッグ データ ファイル共有を作成すると、GeoAnalytics Server ツールで利用できるビッグ データ カタログ サービスも作成されます。ビッグ データ ファイル共有を作成するには、次の手順を実行します。
- GeoAnalytics Server Manager にサイン インします。URL の形式は https://gisserver.domain.com:6443/arcgis/manager です。この URL が分からない場合、管理者にリクエストしてください。
- [サイト] > [データ ストア] の順にクリックして、[ビッグ データ ファイル共有の登録] を選択します。
- [ファイル共有] タイプのデフォルト値をそのまま使用し、一意の名前とフォルダー BigDataExample へのパスを入力して (\\sharedLocation\BigDataExample など)、[作成] をクリックします。ビッグ データ ファイル共有のデータ ストアが作成されます。このデータ ストアは、ポータルのビッグ データ ファイル共有アイテムに対応し、https://gisserver.domain.com:6443/arcgis/rest/services/DataStoreCatalogs/bigDataFileShares_FileShareName/BigDataCatalogServer 形式の URL (FileShareName は、登録時にデータ ストアに指定した名前によって決定される) を介して使用可能なビッグ データ カタログ サービスに基づいています。この例では、ビッグ データ ファイル共有にデータセット [NYCTaxi] があります。これはビッグ データ ファイル共有のフォルダーにちなんで名づけられたものです。
ビッグ データ ファイル共有の編集
このデータセットには複数の日付/時間フィールドが含まれています。マニフェストに含まれるデータセットを調べて、正しいフィールドを使用していることを確認します。マニフェストに含まれるデータセットを表示および編集するには、ArcGIS Server Manager でビッグ データ ファイル共有の横にある鉛筆アイコンをクリックします。マニフェストが最初に生成されたときに、geometry と time パラメーターによって乗車場所が決定されています。乗車場所のフィールドは、マニフェスト生成プロセスによって選択されます。このチュートリアルでは、下車場所の解析を実行します。
注意:
マニフェストが生成されると、ジオメトリと時間を表すためのフィールドを見つけるよう、最適な推定値が適用されます。
このチュートリアルでは、下車時間と下車場所を使用するようにマニフェストを変更します。つまり、解析によって乗車場所ではなく下車場所が集約されるということです。解析では、いずれかのジオメトリ (乗車または下車) を使用できます。適切なジオメトリは、解決しようとしているものによって異なります。これらの変更を行うには、ビッグ データ ファイル共有データセット エディターを使用します。
注意:
また、この操作は、マニフェストをダウンロードして編集し、編集後のマニフェストをアップロードすることによっても完了できます。マニフェスト自体の編集の詳細については、「ビッグ データ ファイル共有のマニフェストについて」をご参照ください。
- ビッグ データ ファイル共有のマニフェストが生成された後にそのマニフェストを編集するには、ビッグ データ ファイル共有の横にある鉛筆ボタンを選択します。
- [データセット] の下の [NYC Taxi] データセットを選択します。
- geometry の横にある情報アイコンの上にポインターを置きます。現在のジオメトリは、[X] の pickup_longitude フィールドと [Y] の pickup_latitude フィールドによって決定されます。
- フィールド セレクターで pickup_longitude フィールドを選択します。このフィールドには [X] 形式のジオメトリが含まれています。[ジオメトリ関連属性] ボタンをオフにします。
- dropoff_longitude フィールドを選択します。このフィールドにジオメトリを適用するには、[ジオメトリ関連属性] ボンの横にあるチェックボックスをオンにします。形式を [X] と指定します。
- ステップ 4 と 5 を繰り返して、[Y] のジオメトリ フィールドを pickup_latitude から dropoff_latitude に変更します。編集が完了したら [保存] をクリックし、ビッグ データ ファイル共有のダイアログを閉じます。
Portal for ArcGIS を使用したタクシー データに対する解析の実行
データが GeoAnalytics Server に登録され、ビッグ データ ファイル共有アイテムがポータルに作成された後は、そのアイテムを参照して選択し、アイテムに対して GeoAnalytics ツールを実行できます。
注意:
GeoAnalytics Server に登録されているデータはご使用のサーバーにアップロードされていません。このデータは GeoAnalytics Server に登録されているだけであり、スキーマを定義するマニフェストを保持しています。
- ポータルにログインします。URL の形式は https://webadaptorhost.domain.com/arcgis/home です、ここで、arcgis はポータルに登録されている ArcGIS Web Adaptor の名前です。[マイ コンテンツ] に移動します。[マイ コンテンツ] テーブルに、作成したビッグ データ ファイル共有アイテムが表示されます。
- [マップ] をクリックして、マップ ビューアーに移動します。
- [解析] ボタンをクリックします。フィーチャ解析とラスター解析の両方が利用可能な場合は、[フィーチャ解析] をクリックしてから、[GeoAnalytics ツール] > [データの集約] > [ポイントの集約] の順にクリックします。
- [ポイントの集約] ツールを実行すると、指定したサイズのポリゴンまたはビンにポイントを集約することで、データへの理解を深めることができます。ここでは、集約先となるポリゴン データセットがないため、空間と時間の両面でビンに集約します。集約先のレイヤーとして「New York City taxi cab」データセットを追加するには、最初のツール パラメーターとして [レイヤーの参照] を選択します。表示されるダイアログ ボックスで、[マイ コンテンツ] を選択して、「New York City taxi cab」データセットを参照して選択します。レイヤーを選択して [レイヤーの追加] をクリックします。
- サイズが 1 キロメートルの四角形のビンに集約します。
- データは時間対応であるため、タイム スライスを適用できます。データのダウンロードから、2 か月分のデータが存在することがわかっています。このチュートリアルでは、各月の第 1 週目を調査します。これを行うには、[時間間隔] を [1 週間]、[時間ステップ] を [1 か月]、[基準時間] を [1 月 1 日 12:00 AM] に設定します。
- 興味を引く統計情報を選択します。いくつか例を挙げると、total_amount の [平均値] や Trip Distance の [分散] などがあります。
- 空間参照をニューヨーク市のローカル投影法に設定します。歯車ボタンをクリックし、解析設定にアクセスします。[処理に使用する座標系] では [値指定] を選択し、グローブを選択して UTM ゾーン 18N を参照します。ニューヨーク市の地域にズームして、解析を実行します。この解析は、GeoAnalytics Server に属するコンピューター上で実行されます。解析が完了した時点で、結果がマップに追加されます。結果として、各ポリゴン内でタクシーの下車場所を表現する矩形ポリゴンに加え、計算した追加の統計情報が提供されます。