このチュートリアルでは、ビッグ データ ファイル共有を作成するためにデータを設定する手順を、順を追って説明します。 ビッグ データ ファイル共有は、ポータルに作成されるアイテムであり、GeoAnalytics Server が利用可能な場所にあるフィーチャ データ (テーブル、ポイント、ポリライン、ポリゴン) を参照します。 ポータル内のビッグ データ ファイル共有アイテムにより、登録されたデータを管理して参照し、データセットに対して GeoAnalytics Tools を実行できます。 ビッグ データ ファイル共有の作成後は、[ポイントの集約] ツールを使用してデータを利用します。 このチュートリアルでは、タクシーの下車場所と乗車場所のデータセットをダウンロードし、GeoAnalytics Tools を使用して下車が最も頻繁に行われている場所を特定します。
前提条件
ArcGIS Enterprise 管理者が GeoAnalytics Server を構成していることを確認します。 詳細については、「ArcGIS GeoAnalytics Server の設定」をご参照ください。
データの準備
ここで示す例で使用されるデータをダウンロードして準備するには、次の 2 つのステップを実行します。
- 「BigDataExample」という名前のフォルダーを、GeoAnalytics Server が利用可能な場所に作成します。 BigDataExample フォルダー内に、「NYCTaxi」という名前のフォルダーを作成します。
- https://www1.nyc.gov/site/tlc/about/tlc-trip-record-data.page にアクセスして、2014 年 1 月と 2 月の Yellow Taxi データを BigDataExample > NYCTaxi フォルダーにダウンロードします。
ビッグ データ ファイル共有の作成
すべての GeoAnalytics Server コンピューターがアクセス可能な場所にデータを保存したら、ポータルを使用して、そのデータをビッグ データ ファイル共有として GeoAnalytics Server に登録します。 ビッグ データ ファイル共有を作成すると、GeoAnalytics Server ツールで利用できるビッグ データ カタログ サービスが作成されます。 ビッグ データ ファイル共有を作成するには、次の手順を実行します。
- ArcGIS Enterprise ポータルにサイン インします。
URL の形式は https://webadaptorhost.domain.com/arcgis/home です、ここで、arcgis はポータルに登録されている ArcGIS Web Adaptor の名前です。
- [コンテンツ] > [新しいアイテム] を参照して [データ ストア] を選択します。
- ビッグ データ ファイル共有の名前を [タイトル] フィールドに入力します。
- [ビッグ データ ファイル共有] オプションを選択します。 [次へ] をクリックして [ステップ 2: 接続の構成] に進みます。
- [ファイル共有] の最初のオプションを選択して、[次へ] をクリックします。
- [パス] フィールドに、BigDataExample フォルダーのファイル パスを入力します。
たとえば、Microsoft Windows 上の sharedLocation という名前のディレクトリ内の BigDataExample という名前のフォルダーの場合、「\\sharedLocation\BigDataExample」と入力します。 Linux 上の同じフォルダー パスの場合、「/sharedLocation/BigDataExample」と入力します。
- [次へ] をクリックして [ステップ 3: サーバーの構成] に進みます。
- GeoAnalytics Server の検証を待ちます。
- [ステータス] 列に緑のチェック マークが表示されたら、[データ ストアの追加] をクリックします。
ビッグ データ ファイル共有アイテムとデータ ストア アイテムが作成されます。 ビッグ データ ファイル共有アイテムによりデータセットが公開されるため、スキーマ、ジオメトリ、時間などのプロパティを確認および更新できます。 ビッグ データ ファイル共有アイテムは、次の形式の形式の URL を介して使用可能な、基盤となるビッグ データ カタログ サービスに対応します。
https://gisserver.domain.com:6443/arcgis/rest/services/DataStoreCatalogs/bigDataFileShares_FileShareName/BigDataCatalogServer
上の URL の例では、FileShareName は、データ ストアを GeoAnalytics Server に登録するときに指定したデータ ストアのタイトルです。
ビッグ データ ファイル共有の編集
このチュートリアルでは、ビッグ データ ファイル共有にデータセット [NYCTaxi] があります。これはビッグ データ ファイル共有のフォルダーにちなんで名づけられたものです。
このデータセットには複数の日付/時間フィールドが含まれています。 データセットを調べて、正しいフィールドを使用していることを確認します。 ビッグ データ ファイル共有のデータセットを編集および表示するには、 新しい [ビッグ データ ファイル共有] ポータル コンテンツ アイテムを参照して選択し、[データセット] ページに移動してデータセットの隣にある編集ボタンをクリックします。 ビッグ データ ファイル共有が作成されると、乗車情報を使用するように geometry パラメーターと time パラメーターが設定されます。 このチュートリアルでは、下車場所の解析を実行します。
注意:
ビッグ データ ファイル共有が作成されると、ジオメトリと時間を表すためのフィールドを見つけるよう、最適な推定値が適用されます。
このチュートリアルでは、下車時間と下車場所を使用するようにデータセット プロパティを変更します。 つまり、解析によって乗車場所ではなく下車場所が集約されるということです。 解析では、いずれかのジオメトリ (乗車または下車) を使用できます。 適切なジオメトリは、解決しようとしているものによって異なります。 これらの変更を行うには、ビッグ データ ファイル共有データセットの [データセット プロパティの編集] ダイアログ ボックスを使用します。
注意:
また、この操作は、マニフェストをダウンロードして編集し、編集後のマニフェストをアップロードすることによっても完了できます。 マニフェスト自体の編集の詳細については、「ビッグ データ ファイル共有のマニフェストについて」をご参照ください。
- ビッグ データ ファイル共有アイテム ページで、[データセット] タブを参照して選択します。
- [NYCTaxi] データセットの隣にある編集ボタンをクリックしてプロパティを編集します。
[データセット プロパティの編集] ダイアログ ボックスが表示されます。
- [ジオメトリ] タブは、現在 X および Y の値を表すために使用されているフィールドが pickup_longitude と pickup_latitude であることを示しています。 値を次のように変更します。
- [X フィールド] の値を pickup_longitude から dropoff_longitude に変更します。
- [Y フィールド] の値を pickup_latitude から dropoff_latitude に変更します。
- [時間] タブは、時間値を表すために現在使用されているフィールドが、yyyy-MM-dd HH:mm:ss 形式の pickup_datetime であることを示しています。 [時間] フィールドの設定を pickup_datetime から dropoff_datetime に変更します。
- [保存] ボタンをクリックして、ビッグ データ ファイル共有データセットの変更を保存します。
ArcGIS Enterprise ポータルでのタクシー データに対する解析の実行
データおよびビッグ データ ファイル共有アイテムを作成してから、ポータルの組織サイト内のビッグ データ ファイル共有アイテムを参照して、データセットにアクセスします。 これらのデータセットを使って GeoAnalytics Server ツールを実行できます。
注意:
GeoAnalytics Server に登録されているデータはご使用のサーバーにアップロードされていません。このデータは GeoAnalytics Server に登録されているだけであり、スキーマを定義するマニフェストを使用します。
- ポータルで、[マップ] をクリックして Map Viewer Classic に移動します。
- [解析] ボタンをクリックします。
フィーチャ解析とラスター解析の両方が利用可能な場合は、[フィーチャ解析] をクリックしてから、[GeoAnalytics ツール] > [データの集約] > [ポイントの集約] の順にクリックします。
- [住所または場所の検索] 検索バーに「New York」と入力して、[検索] をクリックします。
マップは、ニューヨーク市の範囲にズームします。
- 集約先のレイヤーとして「New York City taxi cab」データセットを追加するには、最初のツール パラメーターとして [解析レイヤーの選択] を選択します。 表示されたダイアログ ボックスで [コンテンツ] を選択し、ビッグ データ ファイル共有を参照します。 New York City taxi cab レイヤーを選択し、[選択] をクリックします。
- サイズが 1 キロメートルの四角形のビンに集約します。
- データは時間対応であるため、時間ステップを適用できます。 データのダウンロードから、2 か月分のデータが存在することがわかっています。 このチュートリアルでは、各月の第 1 週目を調査します。 これを行うには、[時間間隔] を [1 週間]、[時間ステップの繰り返し頻度] を [1 か月]、[時間ステップを調整する時間] を [2017 年 1 月 1 日 12:00 AM] に設定します。テスト データは 2014 年用ですが、[ポイントの集約] ツールでは、解析の時間を前方および後方の両方に調整できます。
- 興味を引く統計情報を選択します。いくつか例を挙げると、total_amount の [平均値] の値や Trip Distance の [分散] の値などがあります。
- 次の手順に従って、空間参照をニューヨーク市のローカル投影法に設定します。
- 設定ボタンをクリックし、解析設定にアクセスします。
- [処理に使用する座標系] ドロップダウン リストから [指定どおり] を選択します。
- グローブを選択し、[空間参照] → [PCS] → [UTM] → [WGS 1984 UTM Zone 18 N] の順にクリックして、UTM ゾーン 18N を参照します。
- [OK] をクリックして [適用] をクリックします。
- ニューヨーク市の地域にズームし、[ポイントの集約] ツールで [現在のマップ範囲を使用] がオンになっていることを確認し、解析を実行します。
GeoAnalytics Server のコンピューター上で解析が実行されます。 解析が完了した時点で、結果がマップに追加されます。 結果として、各ポリゴン内でタクシーの下車場所を表現する矩形ポリゴンに加え、計算した追加の統計情報が提供されます。 結果には、約 3,500 ~ 4,000 のフィーチャが含まれています。 結果は、画面上のマップの範囲とタイム ゾーンによって異なります。