이 자습서는 빅데이터 파일 공유를 생성하기 위한 데이터를 설정하는 단계를 안내합니다. 빅데이터 파일 공유는 포털에 생성되는 항목으로, GeoAnalytics Server에서 사용 가능한 위치에 있는 테이블, 포인트, 폴리라인, 폴리곤 등의 피처 데이터를 참조합니다. 포털의 빅데이터 파일 공유 항목을 사용하면 데이터셋에 대해 GeoAnalytics 도구를 실행하기 위해 등록된 데이터를 찾아볼 수 있습니다. 빅데이터 파일 공유를 생성한 후에는 포인트 집약 도구를 통해 데이터를 사용합니다. 이 튜토리얼에서는 택시 드롭 오프 및 픽업 위치 데이터셋을 다운로드한 다음 GeoAnalytics 도구를 사용하여 택시 드롭 오프가 더 빈번한 위치를 확인합니다.
필수 구성 요소
ArcGIS Enterprise 관리자가 GeoAnalytics Server를 구성했는지 확인합니다. GeoAnalytics Server에 접근할 수 있도록 관리자로부터 ArcGIS Server Manager URL을 받아야 합니다. ArcGIS GeoAnalytics Server 설정에 대해 자세히 알아보세요.
데이터 준비
이 예시에서 사용되는 데이터를 다운로드하고 준비하려면 다음 단계를 수행합니다.
- GeoAnalytics Server.에서 사용 가능한 위치에 BigDataExample 폴더를 생성합니다. BigDataExample폴더 내에 NYCTaxi 폴더를 생성합니다.
- http://www.nyc.gov/html/tlc/html/about/trip_record_data.shtml로 이동하여 2014년 1월과 2월의 뉴욕 택시 데이터를 BigDataExample > NYCTaxi 폴더에 다운로드합니다.
빅데이터 파일 공유 생성
모든 GeoAnalytics Server 머신에서 접근 가능한 위치에서 데이터를 저장한 후 GeoAnalytics Server Manager를 통해 해당 위치를 빅데이터 파일 공유로 GeoAnalytics Server에 등록합니다. 빅데이터 파일 공유를 등록하면 GeoAnalytics Server 도구에서 사용할 수 있는 빅데이터 카탈로그 서비스가 생성됩니다. 빅데이터 파일 공유를 생성하려면 다음 단계를 수행합니다.
- GeoAnalytics Server Manager에 로그인합니다. URL은 https://gisserver.domain.com:6443/arcgis/manager 형식입니다. 이 URL을 모르는 경우 관리자에게 요청하세요.
- 사이트 > 데이터 저장소를 클릭하고 빅데이터 파일 공유 등록을 선택합니다.
- 기본값인 파일 공유 유형을 적용하고 BigDataExample 폴더의 고유한 이름과 경로를 입력(예시: Windows의 경우 \\sharedLocation\BigDataExample, Linux의 경우 /sharedLocation/BigDataExample)한 후에 생성을 클릭합니다. 그러면 빅데이터 파일 공유 데이터 저장소가 생성됩니다. 이 저장소는 포털의 빅데이터 파일 공유 항목에 해당하며, https://gisserver.domain.com:6443/arcgis/rest/services/DataStoreCatalogs/bigDataFileShares_FileShareName/BigDataCatalogServer 형식의 URL을 통해 기본 빅데이터 카탈로그 서비스가 제공됩니다. 여기서 FileShareName은(는) 등록 시 데이터 저장소에 대해 지정한 이름에 따라 결정됩니다. 이 예시에서 빅데이터 파일 공유에는 빅데이터 파일 공유의 폴더 이름을 따라 명명된 NYCTaxi라는 데이터셋이 한 개 있습니다.
빅데이터 파일 공유 편집
이 데이터셋에는 날짜 및 시간 필드가 여러 개 있습니다. 매니페스트에서 데이터셋을 검사하여 올바른 필드를 사용 중인지 확인합니다. 매니페스트에서 데이터셋을 편집하고 확인하려면 Server Manager에서 빅데이터 파일 공유 옆의 연필 아이콘을 클릭합니다. 매니페스트가 처음 생성될 때 geometry 및 time 매개변수가 픽업 위치를 사용합니다. 매니페스트 생성 절차에서 픽업 위치 필드가 선택되었습니다. 이 튜토리얼에서는 드롭 오프 위치에 대한 분석 실행하는 데 관심이 있습니다.
비고:
매니페스트가 생성된 경우 지오메트리와 시간을 나타내는 데 사용된 필드를 추측을 통해 찾게 됩니다.
이 튜토리얼에서는 드롭 오프 시간과 드롭 오프 위치를 사용하도록 메니페스트를 수정합니다. 즉, 분석에서 픽업 위치 대신 드롭 오프 위치를 집약하게 됩니다. 지오메트리 집합 중 하나(픽업 또는 드롭 오프)가 분석에 사용할 수 있습니다. 확인하고자 하는 항목에 따라 올바른 지오메트리가 사용됩니다. 빅데이터 파일 공유 데이터셋 편집기를 사용하여 이러한 변경을 수행합니다.
비고:
매니페스트를 다운로드하여 편집한 다음 편집된 매니페스트를 업로드하여 이 작업을 완료할 수도 있습니다. 매니페스트 자체를 편집하는 방법에 대한 자세한 내용은 빅데이터 파일 공유 매니페스트 이해를 참고하세요.
- 빅데이터 파일 공유 옆의 연필 아이콘을 선택하여 생성된 빅데이터 파일 공유 매니페스트를 편집합니다.
- 데이터셋 아래에서 NYCTaxi 데이터셋을 선택합니다.
- 지오메트리 섹션에는 X 및 Y 값을 나타내기 위해 현재 사용된 필드가 pickup_longitude 및 pickup_latitude로 나와 있습니다. X 값을 나타내는 데 사용되는 필드의 값을 pickup_longitude에서 dropoff_longitude로 변경합니다. Y 값을 나타내는 데 사용되는 필드의 값을 pickup_latitude에서 dropoff_latitude로 변경합니다.
- 시간 섹션에는 시간 값을 나타내기 위해 현재 사용된 필드가 pickup_datetime이며 yyyy-MM-dd HH:mm:ss 형식이 사용된 것으로 나와 있습니다. pickup_datetime에서 dropoff_datetime으로 시간 필드를 변경합니다.
- 저장 버튼을 클릭하여 빅데이터 파일 공유에 대한 변경 사항을 저장합니다.
Portal for ArcGIS를 통해 택시 데이터에 대한 분석 실행
GeoAnalytics Server에 데이터를 등록하고 포털에서 빅데이터 파일 공유 항목을 생성한 후에는 GeoAnalytics Server 도구를 찾아 항목에 대해 실행할 수 있습니다.
비고:
GeoAnalytics Server에 등록된 데이터는 서버에 업로드되지 않고 GeoAnalytics Server에만 등록되어 있으며 스키마 정의를 위한 매니페스트를 사용합니다.
- 포털에 로그인합니다. URL은 https://webadaptorhost.domain.com/arcgis/home 형식이며 여기서 arcgis은(는) 포털에 등록된 Web Adaptor의 이름입니다. 콘텐츠로 이동합니다. 콘텐츠 테이블에 방금 생성한 빅데이터 파일 공유 항목이 보입니다.
- 맵을 클릭하여 Map Viewer로 이동합니다.
- 분석 버튼을 클릭합니다. 피처 분석과 래스터 분석을 모두 사용할 수 있는 경우 피처 분석을 클릭하고 GeoAnalytics 도구 > 데이터 요약 > 포인트 집약을 클릭합니다.
- 검색 창에 New York을 입력하고 검색을 클릭합니다. 맵이 New York City 범위로 확대됩니다.
- 포인트 집계 도구를 실행하면 지정된 크기의 폴리곤이나 그룹으로 포인트를 집계하여 데이터를 더욱 효율적으로 파악할 수 있습니다. 여기서는 포인트를 집약할 폴리곤 데이터셋이 없으므로 시간과 공간 둘 다에서 그룹으로 포인트를 집약합니다. New York City 택시 데이터셋을 집계 대상 레이어로 추가하려면 첫 번째 도구 매개변수에 대해 분석 레이어 선택을 선택합니다. 그러면 나타나는 대화 상자에서 콘텐츠를 선택하고 New York 택시 데이터셋을 찾습니다. 레이어를 선택하고 레이어 추가를 클릭합니다.
- 크기가 1km인 정사각형 그룹으로 포인트를 집약합니다.
- 데이터는 시간을 지원하므로 시간 단계를 적용할 수 있습니다. 데이터를 다운로드하면 2개월 분량의 데이터가 있음을 확인할 수 있습니다. 이 튜토리얼에서는 매월 첫 주의 데이터를 검사합니다. 이를 위해서는 시간 단계 간격을 1주로, 시간 단계 반복 빈도를 1개월로, 시간 단계를 정렬하기 위한 시간을 2017년 1월 1일 오전 12시로 설정합니다. 테스트 데이터가 2014년에 대한 것이라도 포인트 집계는 분석을 해당 시간의 전과 후로 모두 정렬할 수 있는 기능을 제공합니다.
- 관심 통계를 선택합니다. total_amount의 평균 또는 이동 거리의 변수 등을 선택할 수 있습니다.
- 로컬 New York 투영에 대한 공간 참조를 설정합니다. 분석 설정에 접근하려면 기어 버튼을 클릭합니다. 처리 좌표계에 대해 지정한 대로를 선택하고 글로브를 선택한 다음, 공간 참조 > PCS > UTM WGS 1984 UTM Zone 18 N을 클릭하여 UTM 구역 18N(북위)을 검색한 후 확인 및 적용을 선택합니다. New York 지역을 확대하고 현재 맵 범위 사용이 선택되어 있는지 확인한 후 분석을 실행합니다. GeoAnalytics Server 머신에서 분석이 실행됩니다. 분석이 완료되면 결과가 맵에 추가됩니다. 이 튜토리얼의 결과는 각 폴리곤의 택시 드롭 오프 위치 및 추가로 계산한 통계를 나타내는 정사각형 폴리곤입니다. 약 3,500~4,000개의 피처가 결과에 포함됩니다. 결과는 화면의 맵 범위와 표준 시간대에 따라 달라집니다.