注意:
ArcGIS Enterprise 10.9.1 以降では、ArcGIS Server Manager ではなく、ポータルのコンテンツ ページを介してビッグ データ ファイル共有の追加または編集を行うことを推奨します。
ビッグ データ ファイル共有の登録と編集は、ポータルのコンテンツ ページで行うことを推奨します。 次のいずれかの条件を満たす場合は、ArcGIS Server Manager を使用します。
- ArcGIS Server Manager を介して登録する必要がある Azure Data Lake を登録したい場合。
- 過去のリリースの ArcGIS Server Manager で作成したビッグ データ ファイル共有の編集または表示を行う場合。
上記のどちらの条件にも当てはまらない場合は、ポータルのコンテンツ ページからビッグ データ ファイル共有を登録し、ビッグ データ ファイル共有アイテムを使用して変更、編集、確認します。
ArcGIS Server Manager を介してビッグ データ ファイル共有を登録する場合は、ArcGIS GeoAnalytics Server を使用します。 ビッグ データ ファイル共有には、入力データのスキーマと、データセット内のジオメトリと時間を表すフィールドおよびフォーマットの概要を示すマニフェストが必要です。 マニフェストは、ビッグ データ ファイル共有を登録したときに自動的に生成されます。 データに対して変更が行われた場合や必要なすべての情報をマニフェストの生成時に決定できなかった場合 (自動生成されたマニフェストでジオメトリまたは時間に対応する正確なフィールドが選択されなかった場合など) は修正が必要とされることもあります。 必要に応じて、ビッグ データ ファイル共有に出力テンプレートを含めることができます。このテンプレートは、ビッグ データ ファイル共有に書き込まれる結果のフォーマットの概要を示すために使用されます。 出力テンプレートは、ビッグ データ ファイル共有を登録し、それを出力先として使用することを選択した場合に生成されます。 時間フィールドやジオメトリ フィールドのフォーマットなど、1 つ以上のテンプレートを変更する必要がある場合や、テンプレートを追加または削除する必要がある場合があります。
ArcGIS GeoAnalytics Server のインストールの ArcGIS Server Manager を介して、データセット、マニフェスト情報、および出力テンプレートを表示および編集できます。
ビッグ データ ファイル共有の編集
ArcGIS Server Manager からビッグ データ ファイル共有を登録したら、ArcGIS Server Manager でビッグ データ ファイル共有のマニフェスト エディターを開いて、そのアイテムの登録済みデータセットの属性や設定を表示および編集できます。 オプションの出力テンプレートの属性と設定を編集することもできます。出力テンプレートは、出力結果がビッグ データ ファイル共有に書き込まれる方法の概要を示しています。
たとえば、入力データに対して、登録したファイル共有内にあるデータセットの数を確認できます。 登録したファイル共有に必要な数のデータセットがなかった場合は、登録済みの場所に有効なデータセットがあるかどうかを確認する必要があります。
出力テンプレートの場合、区切り文字で区切られたファイル出力をフォーマットしてタブ区切りファイルを書き込み、WKT を使用してジオメトリを格納することができます。
また、登録したビッグ データ ファイル共有のデータセット スキーマを確認することもできます。 選択したデータセットのスキーマは、ジオメトリ、時間定義、および関連するマニフェスト リソースのフィールド名を更新することで、変更することができます。
ビッグ データ ファイル共有のマニフェスト エディターの高度な設定タブでは、ヘッダー行の有無、エンコード、フィールド区切り文字、レコード ターミネーターなど、データセットに関する情報を提供するヒント ファイルをアップロードできます。 ヒント ファイルのアップロード後にマニフェストを再生成すると、指定した情報を使用してマニフェストが生成されます。
必要に応じて、マニフェストをダウンロードしたり、編集したり、編集したファイルをアップロードしたりできます。
ビッグ データ ファイル共有の入力データセットの編集
ビッグ データ ファイル共有のマニフェスト エディターでは、選択したビッグ データ ファイル共有と、その中に正常に登録されたデータセットを表示できます。 エディターのドロップダウン メニューからデータセットを選択すると、対応するパラメーターが表示されます。 このダイアログ ボックスにある各オプションの詳細については、「ビッグ データ ファイル共有のパラメーターの編集」をご参照ください。 データセット パラメーターを編集するには、次の操作を実行します。
- [登録済みデータ ストア] ダイアログ ボックスで、編集するビッグ データ ファイル共有を選択します。
- [編集] ボタンをクリックして、対応するデータセットの詳細とオプションを表示します。
- [データセット] タブをクリックして、登録済みデータセットと対応するパラメーターを表示します。
- ドロップダウン メニューからデータセットを選択して、そのマニフェスト内にある情報を表示します。 必要に応じて、データセット プロパティを更新します。
- データセット プロパティの編集が完了したら [保存] をクリックします。
ビッグ データ ファイル共有のマニフェストまたはヒント ファイルの編集
ビッグ データ ファイル共有エディターの [高度な設定] タブでは、関連するマニフェストまたはヒント ファイルをそれぞれのタブから編集することができます。 マニフェストをアップロードした場合、エディターでビッグ データ ファイル共有のマニフェストに加えた変更は上書きされ、現在のマニフェストは置き換えられます。 ビッグ データ ファイル共有のマニフェストの詳細については、「ビッグ データ ファイル共有のマニフェスト」をご参照ください。 ヒント ファイルの使用に関する詳細については、「ヒント ファイル」をご参照ください。 ビッグ データ ファイル共有のマニフェストまたはヒント ファイルを編集するには、次の操作を実行します。
- [登録済みデータ ストア] ダイアログ ボックスで、変更するビッグ データ ファイル共有を選択します。
- [編集] ボタンをクリックして、マニフェスト リソースを変更するためのオプションを表示します。
- [高度な設定] タブをクリックします。
- [高度な設定] タブから、変更する内容に応じて [マニフェスト] タブまたは [ヒント] タブを選択します。
- マニフェスト ファイルをダウンロードするには、[マニフェスト] をクリックして、[ダウンロード] をクリックします。
- ヒント ファイルをダウンロードするには、[ヒント] をクリックして、[ダウンロード] をクリックします。
- テキスト エディターを使用してダウンロードした .json のマニフェスト ファイルまたは .dat のヒント ファイルを変更し、変更内容をローカルに保存します。
ヒント:
ヒント ファイルのデフォルトのファイルフォーマットは、.dat です。 ファイルをダウンロードしたら、拡張子を .txt に変更してファイルを編集できます。 - 編集したファイルをアップロードするには、変更するビッグ データ ファイル共有の [編集] ボタンをクリックします。
- マニフェストを編集するには、[高度な設定] > [マニフェスト] > [アップロード] の順にクリックして、更新した .json ファイルを参照します。
- ヒント ファイルを編集するには、[高度な設定] > [ヒント] > [アップロード] の順にクリックして、更新した .txt ファイルを参照します。
- [アップロード] をクリックします。
ヒント ファイルをアップロードする場合は、必ずマニフェストを再生成してください。 マニフェストを再生成すると、ヒントを含むデータセットまたは新しいデータセットのみが更新され、ヒント ファイルに含まれていない他のデータセットに対する変更は反映されません。
ビッグ データ ファイル共有のマニフェストの再生成
ビッグ データ ファイル共有を作成し、マニフェストを生成すると、[登録済みデータ ストア] ダイアログ ボックスの各エントリにマニフェストの再生成ボタンが表示されます。
新しいデータを追加する場合や、リソースの編集を使用してヒント ファイルをアップロードする場合は、マニフェストを再生成できます。 ヒント ファイルは、マニフェストを再生成するときに使用される仕様を提供します。
注意:
マニフェストを再生成すると、ヒント ファイルを持つ既存のデータセットまたは新しいデータセットのマニフェストが更新されます。 マニフェストに加えた編集は、ヒント ファイルに定義されているルールで上書きされます。ビッグ データ ファイル共有の編集パラメーター
ビッグ データ ファイル共有エディターは、次の 5 つのセクションで構成されています。
- データセット選択
- フィールド
- Geometry
- 時間
- データセット フォーマット
マニフェスト生成によってフィールド名、エンコーディング、フィールド区切り文字、または引用文字が正しく決定されていない場合は、データを編集する前に、ヒント ファイルを使用することをお勧めします。
データセット選択
マニフェストは 1 つ以上のデータセットで構成されます。 データセットの数は、ビッグ データ ファイル共有場所に含まれるフォルダーの数によって決まります。 マニフェスト マネージャーを開くと、ビッグ データ ファイル共有に正常に登録されているデータセットを表示できます。 データセットをドロップダウン メニューから選択したときに、データセット パラメーターにデータセット情報が入力されます。
マニフェスト内にさらに多くのデータセットがあることを期待している場合、またはデータセットがない場合は、以下を実行します。
- 最上位フォルダーを正常に登録していることを確認します。 詳細については、「データの ArcGIS Server Manager への登録」をご参照ください。
- 入力データが、区切り文字で区切られたファイル、シェープファイル、パーケット、Optimized Row Columnar (ORC) のコレクションなどの許容できるフォーマットであることを確認します。
- 対象の入力データセットのスキーマが、ファイルのコレクションで一貫していることを確認します (1 つのデータセット内のすべてのファイルは、同じフィールドを持つ必要があります)。
フィールド
フィールド セクションには、データセット内のフィールドがすべてリスト表示されます。 データセットを選択すると、各フィールドについて以下を確認できます。
- フィールドの名前
- フィールド タイプ
区切り文字で区切られたファイルのフィールド名とタイプを変更できます。 複数のフィールド名を変更する場合は、ヒント ファイルを使用することをお勧めします。
入力データセットが区切り文字で区切られたファイルである場合、マニフェストには、ArcGIS Server Manager で変更できる複数のパラメーターがあります。
Geometry
ジオメトリ セクションには、ジオメトリのタイプとその表記方法が表示されます。 以下の表で、入力データセット タイプに応じて行うことができる変更に関する注釈を含めて、使用可能なオプションの概要を説明します。
ジオメトリ パラメーター
パラメーター | 説明 | 区切り文字で区切られたファイル | シェープファイル | ORC ファイル | パーケット ファイル |
---|---|---|---|---|---|
Geometry | ジオメトリ タイプ。 オプションには、ポイント、ポリライン、ポリゴン、なしがあります。 ジオメトリが存在しない場合、入力はテーブルになります。 | 編集可能 | 変更不可 | 編集可能 | 編集可能 |
空間参照 (WKID/WKT) | データセットの空間参照。 このオプションは、データセットがテーブルでない場合にのみ表示されます。 | このオプションは変更可能です。 デフォルトでは、「4326」(WGS 1984) に設定されます。 | 変更不可 | 編集可能 | 編集可能 |
ジオメトリ フォーマット タイプ | 各フィーチャにおけるジオメトリのフォーマット。 オプションには、XYZ (X、Y、Z (オプション) 値を表すフィールド。XYZ はポイントのみに適用されます)、WKT (Well-Known Text)、GeoJson、EsriJson、および shame です。 このオプションは、データセットがテーブルでもシェープファイルでもない場合にのみ使用できます。 | 編集可能 | 利用不可 | 編集可能 | 編集可能 |
時間
時間セクションでは、時間の表記方法を設定します。 以下の表で、入力データセット タイプに応じて行うことができる変更に関する注釈を含めて、使用可能なオプションの概要を説明します。 時間オプションは、指定されている場合を除き、すべてのデータ タイプで同じです。
時間パラメーター
パラメーター | 説明 | 例 |
---|---|---|
時間タイプ | 入力時間のタイプ。 オプションには、[即時] (ある 1 点の時間)、[期間](開始時間と終了時間を持つ一定の時間)、および [なし] があります。 | インスタント |
タイム ゾーン | 入力時間のタイム ゾーン。 このオプションは、[時間タイプ] が [なし] 以外の場合のみ有効になります。 | UTC |
時間の名前およびフォーマット テーブル | このテーブルでは、時間フィールドを選択し、時間の定義方法を設定します。 時間では、1 つ以上のフィールドを使用して時間を定義したり、単一フィールドに 1 つ以上のフォーマットを使用したりすることができます。 デフォルトでは、time という名前が付いた最初のフィールドが時間フィールドとして、想定される時間フォーマットがとともに使用されます。 シェープファイルが存在する場合、date タイプの最初のフィールドが使用されます。 時間のタイプが [期間] の場合は、開始時刻と終了時刻が指定されている必要があります。 時間フォーマット テーブルは、[時間タイプ] が [なし] 以外の場合のみ有効になります。 | 単一フィールドに 2 つの異なるフォーマットで時間を表記する例
2 つのフィールドで時間を表記する例
|
時間フォーマット
以下の表では、ArcGIS Server Manager を使用して、または直接マニフェストで、ビッグ データ ファイル共有を編集する場合に時間を表す方法の概要を説明します。 例では、2016 年 1 月 2 日 9:45:02.05 PM の時間を表す方法を示します。
ビッグ データ ファイル共有の時間フォーマット
シンボル | 意味 | 例 |
---|---|---|
yy | 2 桁で表された年。 | 16 |
yyyy | 4 桁で表された年。 | 2016 |
MM | 数値で表された月。 | 01 または 1 |
MMM | 3 文字で表された月。 | Jan |
MMMM | 完全なつづりで表された月。 | January |
dd | 日付。 | 02 または 2 |
HH | 24 時間表記の場合の時。値の範囲は 0 ~ 23 です。 | 21 |
hh | 12 時間表記の場合の時。値の範囲は 1 ~ 12 です。 | 9 |
mm | 分 (値の範囲は 0 ~ 59)。 | 45 |
ss | 秒 (値の範囲は 0 ~ 59)。 | 02 |
SSS | ミリ秒 (値の範囲は 0 ~ 999)。 | 50 |
a | AM/PM マーカー。 | PM |
epoch_millis | エポックからの時間 (ミリ秒)。 | 1509581781000 |
epoch_seconds | エポックからの時間 (秒)。 | 1509747601 |
Z | タイムゾーンのオフセット (時)。 | -0100 または -01:00 |
ZZZ | タイムゾーンのオフセット (ID)。 | America/Los_Angeles |
'' | この表に説明されている値を表していないテキストを追加するには、一重引用符を使用します。 | 'T' |
以下の表では、同じ日付 (2016 年 1 月 2 日 9:45:02.05 PM) の異なるフォーマットの例を示します。
時間フォーマットの例
入力データ | 日付フォーマット |
---|---|
01/02/2016 9:45:02PM | MM/dd/yyyy hh:mm:ssa |
Jan02-16 21:45:02 | MMMdd-yy HH:mm:ss |
January 02 2016 9:45:02.050PM | MMMM dd yyyy hh:mm:ss.SSSa |
01/02/2017T9:45:14:05-0000 | MM/dd/yyyy'T'HH:mm:ssZ |
データセット フォーマット
データセット フォーマット セクションでは、データのフォーマットを設定します。 データは、次のいずれかのフォーマットになります。
- シェープファイル (.shp)
- 区切りファイル (例: .csv)
- Parquet ファイル
- ORC ファイル
使用できるパラメーターは、データセットによって異なります。 シェープファイル、ORC、およびパーケット ファイルの場合、パラメーターはファイル タイプのみで、変更することはできません。 入力データセットが区切り文字で区切られたファイルである場合、複数のパラメーターを変更できます。 区切り文字で区切られたファイルの値を変更するには、ヒント ファイルを使用してマニフェストを再生成します。 次の表で、これらのパラメーターを説明します。
データセット フォーマット
パラメーター | 説明 |
---|---|
ファイル拡張子 | 入力データセット上のファイル タイプ拡張子をリスト表示します。 一般的なフォーマットは、.csv および .txt です。 ヒント ファイルを使用して、区切り文字で区切られたファイルのこの情報を変更します。 |
フィールド区切り文字 | フィールドごとの区切り文字を決定します。 一般的なフォーマットは、, および ; です。 ヒント ファイルを使用して、区切り文字で区切られたファイルのこの情報を変更します。 |
レコード ターミネーター | データの行ごとのターミネーターを決定します。 一般的なフォーマットは、\n および \t です。 ヒント ファイルを使用して、区切り文字で区切られたファイルのこの情報を変更します。 |
引用符 | 引用符として使用される文字を決定します。 ヒント ファイルを使用して、区切り文字で区切られたファイルのこの情報を変更します。 |
ヘッダー行を含む | 入力テーブルにヘッダー行が含まれているかどうかを決定するブール値。 ヘッダー行が含まれている場合、そのヘッダーがフィールド名に使用されます。 フィールド名情報から、ジオメトリ フィールドおよび時間フィールドを予測することができます。 ヒント ファイルを使用してヘッダー行を設定します。 |
エンコード | ファイルで使用されるエンコードのタイプ。 デフォルトは UTF-8 です。 これはヒント ファイルで設定されます。 |
ビッグ データ ファイル共有の出力テンプレートの編集パラメーター
ビッグ データ ファイル共有の出力テンプレート エディターは、次の 4 つのセクションで構成されています。
- 出力テンプレート選択
- Geometry
- 時間
- データセット フォーマット
出力テンプレート選択
ビッグ データ ファイル共有は、オプションで 1 つ以上のテンプレートで構成されています。 テンプレートの数は、結果を書き込むフォーマットによって異なります。 出力テンプレート マネージャーを開くと、ビッグ データ ファイル共有に正常に登録されているテンプレートを表示できます。 テンプレートをドロップダウン メニューから選択したときに、テンプレート パラメーターに出力のフォーマット情報が入力されます。 新しいテンプレートを追加する場合は、[テンプレートの追加] オプションを選択して、新しいテンプレートのタイプと名前を選択します。 テンプレートを削除する場合は、該当するテンプレートをテンプレート選択から選択して [テンプレートの削除] を選択します。 既存のテンプレートを選択し、必要に応じて以下のセクションのいずれかを変更することで、テンプレートを変更できます。
注意:
入力ビッグ データ ファイル共有には、フィールド セクションがあります。 結果のフィールドは結果を作成する GeoAnalytics Tools ツールによって決定されるため、出力テンプレートにはフィールド セクションはありません。 ORC では、基本的なラテン アルファベット文字と数字を含むフィールド名のみがサポートされます。 フィールド名にその他の文字があると、アンダースコアに置き換えられます。
Geometry
ジオメトリ セクションには、各ジオメトリ タイプ (ポイント、ライン、ポリゴン) の出力ジオメトリのフォーマット方法が表示されます。 出力ジオメトリを決定する手順は、2 つのパートから構成されます。
- 空間参照 - 空のままにすると、ツールの結果が使用されます (デフォルト)。 必要に応じて WKID または WKT 文字列を指定すると、すべての結果がその空間参照に投影されます。 この値はすべての出力ジオメトリで共有されます。
- ジオメトリ フォーマット タイプおよびフィールド - 内容については以下で詳しく説明します。
出力ジオメトリ フォーマット
ジオメトリ タイプ | 出力フィールド | 区切り文字で区切られたファイル | シェープファイル | ORC ファイル | パーケット ファイル |
---|---|---|---|---|---|
XYZ - X、Y、および Z フィールド (オプション)。 このオプションは、ポイントにのみ利用できます。 | デフォルトでは、X、Y、および Z という名前の 3 つの新しいフィールドが作成されます。 必要に応じて、これらのフィールド名を変更できます。 | ||||
WKT | デフォルトでは、Geometry という名前の新しいフィールドが 1 つ作成されます。 必要に応じて、出力フィールド名を変更できます。 | ||||
GeoJSON | デフォルトでは、Geometry という名前の新しいフィールドが 1 つ作成されます。 必要に応じて、出力フィールド名を変更できます。 | ||||
EsriJSON | デフォルトでは、Geometry という名前の新しいフィールドが 1 つ作成されます。 必要に応じて、出力フィールド名を変更できます。 | ||||
SHP | デフォルトでは、Geometry という名前の新しいフィールドが 1 つ作成されます。 必要に応じて、出力フィールド名を変更できます。 | ||||
WKB | デフォルトでは、Geometry という名前の新しいフィールドが 1 つ作成されます。 必要に応じて、出力フィールド名を変更できます。 | ||||
シェープ バッファー | デフォルトでは、Geometry という名前の新しいフィールドが 1 つ作成されます。 必要に応じて、出力フィールド名を変更できます。 |
時間
時間セクションでは、出力時間の表記方法を設定します。 時間フォーマットには、以下の情報が必要です。
- インスタントおよび間隔の両方のフォーマット。
- 時間が書き込まれるフィールド名。
- 時間が書き込まれるフォーマット (文字列または日付)。 区切り文字で区切られたファイルは、文字列でのみフォーマットできます。
- 間隔の場合、フィールドは開始時間と終了時間を表します。
時間フォーマットは、入力ビッグ データ ファイルと同じです。 「ビッグ データ ファイル共有の時間フォーマット」をご参照ください。
データセット フォーマット
データセット フォーマット セクションは、データが書き込まれる出力フォーマットの概要を示します。 データは、次のいずれかのフォーマットになります。
- シェープファイル (.shp)
- 区切りファイル (例: .csv)
- Parquet ファイル
- ORC ファイル
使用できるパラメーターは、データセットによって異なります。 シェープファイル、ORC、およびパーケット ファイルの場合、パラメーターはファイル タイプのみで、変更することはできません。 入力データセットが区切り文字で区切られたファイルである場合、ArcGIS Server Manager で複数のパラメーターを変更できます。 次の表で、これらのパラメーターを説明します。
データセット フォーマット
パラメーター | 説明 |
---|---|
ファイル拡張子 | 拡張子は出力データセットには適用されません。 |
フィールド区切り文字 | フィールドごとの区切り文字を決定します。 一般的なフォーマットは、, および ; です。 |
レコード ターミネーター | データの各行のターミネーターは設定できません。 Windows の場合、ターミネーターは \r\n です。Linux の場合は、\n です。 |
引用符 | 引用符として使用される文字を決定します。 |
ヘッダー行を含む | 出力テーブルにフィールド名を表すヘッダー行が含まれているかどうかを決定するブール値。 デフォルトでは、この値は true です。 |
エンコード | 常に UTF-8 になります。 |