В данном руководстве описывается процедура настройки данных для создания файлового хранилища больших данных. Файловое хранилище больших данных представляет собой созданный на портале элемент, который ссылается на данные объектов (точки, полилинии и полигоны) в местоположении, доступном для GeoAnalytics Server. Элемент файлового хранилища больших данных на портале позволяет просматривать зарегистрированные данные, что позволяет использовать GeoAnalytics Tools для работы с наборами данных. После того, как файловое хранилище больших данных будет создано, вы сможете использовать эти данные с помощью инструмента Агрегировать точки. В этом учебном пособии вы скачаете набор данных мест высадки и посадки автомобилей такси и используете GeoAnalytics Tools, чтобы определить, где у такси чаще всего происходит высадка пассажиров.
Предварительные действия
Убедитесь, что администратор ArcGIS Enterprise настроил GeoAnalytics Server. Вам необходимо получить адрес URL для ArcGIS Server Manager от администратора, чтобы иметь доступ к GeoAnalytics Server. Дополнительные сведения о Настройке ArcGIS GeoAnalytics Server.
Подготовка данных
Чтобы загрузить и подготовить данные, которые будут использоваться в этом примере, выполните следующие действия:
- Создайте папку с именем BigDataExample в расположении, доступном для GeoAnalytics Server. В папке BigDataExample создайте папку с именем NYCTaxi.
- Перейдите на http://www.nyc.gov/html/tlc/html/about/trip_record_data.shtml и загрузите в папку BigDataExample > NYCTaxi данные yellow taxi за январь и февраль 2014 г.
Создание файлового хранилища больших данных
После сохранения данных в расположении, которое будет доступно для всех компьютеров GeoAnalytics Server, зарегистрируйте их на GeoAnalytics Server как файловое хранилище больших данных через GeoAnalytics Server Manager. Файловой хранилище больших данных создаст также сервис каталога больших данных, который может использоваться в инструментах GeoAnalytics Server. Чтобы создать файловое хранилище больших данных выполните следующее:
- Войдите в GeoAnalytics Server Manager. URL-адрес имеет вид https://gisserver.domain.com:6443/arcgis/manager. Если вам не известен этот URL-адрес, запросите его у администратора.
- Щёлкните Сайт > Хранилища данных и выберите Зарегистрировать файловое хранилище больших данных.
- Примите установленный по умолчанию тип файлового хранилища, введите уникальное имя и путь к папке BigDataExample (например, \\sharedLocation\BigDataExample для Windows или /sharedLocation/BigDataExample для Linux), после чего щелкните Создать. Так будет создано хранилище данных файлового хранилища больших данных. Оно соответствует элементу файлового хранилища больших данных на портале и его сервиса каталога больших данных, доступного через URL в формате https://gisserver.domain.com:6443/arcgis/rest/services/DataStoreCatalogs/bigDataFileShares_FileShareName/BigDataCatalogServer, где FileShareName определяется именем, которое было дано этому хранилищу данных при регистрации. В этом примере файловое хранилище больших данных имеет один набор данных, NYCTaxi, получивший своё имя вслед за названием папки в файловом хранилище больших данных.
Редактирование файлового хранилища больших данных
Этот набор данных имеет несколько полей даты и времени. Вы можете проверить этот набор данных в манифесте, чтобы убедиться, что используете правильные поля. Для изменения и просмотра наборов данных в манифесте щёлкните значок карандаша рядом с файловым хранилищем больших данных в Server Manager. Когда манифест генерируется в первый раз, места посадки пассажиров используют параметры geometry и time. Поля местоположений посадки пассажиров выбираются в процессе генерации манифеста. В этом упражнении вас интересует запуск анализа для местоположений высадки пассажиров.
Примечание:
Когда генерируется манифест, для поиска полей, которые используются для отображения геометрии и времени, применяется наилучшее предположение.
В этом учебном пособии вы будете работать с манифестом, изменяя время и места высадки. Это значит, что вместо мест посадки пассажиров анализ агрегирует места их высадки. Для анализа может использоваться любой набор геометрии (посадка и высадка). Какой из них использовать зависит от того, какую задачу вы пытаетесь решить. Эти изменения будут сделаны с помощью редактора наборов данных файлового хранилища больших данных.
Примечание:
Такие же изменения можно выполнить, если этот манифест скачать, изменить, а потом загрузить уже измененный манифест. Дополнительные сведения о редактировании манифеста см. в разделе Знакомство с манифестом файлового хранилища больших данных.
- Выберите кнопку карандаша рядом с файловым хранилищем больших данных для редактирования манифеста файлового хранилища больших данных после того, как этот манифест будет сгенерирован.
- В Набор данных выберите набор данныхNYCTaxi.
- В разделе Геометрия показано, что в данный момент для представления значений X и Y используются поля pickup_longitude и pickup_latitude. Измените значения Поля, используемого для представления X-значений с pickup_longitude на dropoff_longitude. Измените значения Поля, используемого для представления Y-значений с pickup_latitude на dropoff_latitude
- Раздел Время показывает, что поле, используемое в данный момент для представления значений времени – pickup_datetime в формате yyyy-MM-dd HH:mm:ss. Измените поле времени с pickup_datetime на dropoff_datetime.
- Щёлкните кнопку Сохранить, чтобы сохранить изменения в вашем хранилище больших данных.
Выполнение анализа на данных такси через Portal for ArcGIS.
После регистрации данных на GeoAnalytics Server, и когда на портале будет создан элемент файлового хранилища больших данных, вы сможете перейти к инструменту GeoAnalytics Serverи запустить его для упомянутого выше элемента.
Примечание:
Данные, которые были зарегистрированы на GeoAnalytics Server , на сервер не загружаются, они только регистрируются на GeoAnalytics Server и имеют манифест, определяющий схему.
- Войдите на портал. URL-адрес имеет формат https://webadaptorhost.domain.com/arcgis/home, где arcgis – это имя Web Adaptor, зарегистрированного на портале. Перейдите в Ресурсы. В таблице Ресурсы вы увидите элемент только что созданного файлового хранилища больших данных.
- Щёлкните Карта, чтобы перейти в Map Viewer.
- Нажмите кнопку Анализировать. Если вам доступны и векторный анализ, и анализ растров, выберите Анализ объектов и щелкните Инструменты GeoAnalytics > Суммировать данные > Агрегировать точки.
- Введите Нью-Йорк в строку поиска и щелкните Поиск. Карта приблизится к городу Нью-Йорк.
- Инструмент Агрегировать точки позволяет агрегировать точки в полигоны или бины заданного размера для лучшего восприятия этих данных. Поскольку набора данных полигонов для агрегирования у вас нет, агрегировать будете в бины и в пространстве, и во времени. Чтобы добавить набор данных New York City taxi cab как слой для агрегации, выберите Выбрать слой анализа для первого параметра инструмента. В открывшемся диалоговом окне выберите Ресурсы и перейдите к набору данных New York City taxi cab. Выберите слой и щёлкните Добавить слой.
- Агрегируйте в квадратные бины размером 1 километр.
- Поскольку эти данные содержат информацию о времени, можно применить временные срезы. Скачав эти данные, вы знаете, что они охватывают период два месяца. В этом пособии мы рассмотрим первую неделю каждого месяца. Для этого следует задать параметр Интервал временного шага равным 1 неделе, Как часто повторять временной шаг равным 1 месяцу, а Время для выравнивания временных шагов как 1 января 2017 г., 12:00 am. Несмотря на то, что тестовые данные за 2014 год, инструмент Агрегировать точки предоставляет возможность выравнивать анализ как вперед, так и назад во времени.
- Выберите интересующую статистику; некоторые примеры представлены Средним значением total_amount (общей суммы), другие – Дисперсией Расстояния Поездки.
- Задайте пространственную привязку, указав локальную проекцию Нью-Йорка. Щёлкните кнопку с шестерёнкой, чтобы получить доступ к параметрам среды анализа. Выберите Как указано для Обработка системы координат и выберите глобус, чтобы указать UTM Zone 18N, щёлкнув Пространственные привязки > PCS > UTM WGS 1984 UTM Zone 18 N и выбрав OK и Применить. Приблизьтесь к окрестностям Нью-Йорка, убедитесь что отмечено Использовать текущий экстент карты и запустите анализ. Анализ будет выполняться на компьютерах в GeoAnalytics Server. По окончанию анализа на карту будут добавлены результаты. Результаты будут представлены в виде квадратных полигонов, отражающих число мест для высадки в каждом полигоне, а также в виде статистических данных. Ваши результаты будут содержать от 3500 до 4000 объектов. Результаты будут различаться, в зависимости от размера карты на экране и вашего часового пояса.