Практический пример
Очистка данных в округе South Adams
Район водоснабжения и канализации округа South Adams (SACWSD) был образован в 1953 году в соответствии с положениями Специального района штата Колорадо для обслуживания района, ныне известного как Коммерс-Сити. Хотя этот отдел обслуживает население Коммерс-Сити, он является отдельной единицей и в настоящее время представляет собой крупнейший объединенный район водоснабжения и канализации штата Колорадо, занимающий площадь 65 квадратных миль и обслуживающий почти 50 000 клиентов.
Задача
Группа географических информационных систем в SACWSD использует несколько источников данных, в том числе собственные полевые исследования, для формирования трех отдельных наборов данных, охватывающих системы питьевой воды, орошения и канализации. Команда использует ArcGIS для поддержки расширения, обслуживания, замены и улучшения систем. Кроме того, данные публикуются сторонними приложениями, к примеру, районной системой управления оборудованием (для ежедневных запросов на обслуживание и выполненных рабочих заданий) и программное обеспечение для моделирования водоснабжения, которое имеет свои собственные требования. Так что надежные данные просто необходимы.
Осенью 2016 года отдел водоснабжения и канализации завершил сбор данных с помощью GPS. ГИС-супервайзер Клифф Салливан и техник ГИС Марк Дикман вскоре поняли, что качество данных бывает очень разным. Неточные данные могут потенциально снизить эффективность работ из-за неправильного расположения оборудования и затруднить интеграцию с другими бизнес-системами. Более качественные данные также позволяют повысить качество обслуживания клиентов благодаря правильному назначению задач и более эффективному реагированию на чрезвычайные ситуации.
Работа по очистке данных представлялась долгой и утомительной. Салливану, Дикману и стажеру пришлось проверять пространственную точность и корректность атрибутов каждого объекта вручную. Этот тип процесса контроля качества (QC) носил лишь исследовательский, а не всеобъемлющий характер.
Решение
Салливан увидел Проверку работоспособности данных Esri в программе предстоящей конференции. Он узнал, что дополнительный модуль ArcGIS Data Reviewer может выполнить эту работу значительно быстрее. В дополнение к модулю ArcGIS район приобрел консультационные услуги на месте и работал с инженером по геоданным Esri над внедрением Data Reviewer и обеспечением передачи знаний.
Результаты
Участники группы ГИС в SACWSD сначала использовали Data Reviewer, чтобы получить общий снимок данных, позволяющий определить, какие из сотен возможных проверок данных будут выполняться в первую очередь.
Салливан сказал: "Наш консультант Esri терпеливо и очень подробно показал [нам], как использовать продукт. Мы многое узнали за те два дня, в течение которых консультант был на месте. Наш опыт работы с Esri Professional Services был потрясающим".
"Сотрудничествос Esri позволила сотрудникам SACWSD добиться быстрого прогресса. Хотя некоторые проверки вполне очевидны, персоналу требовалась помощь экспертов, чтобы понять логику настройки более сложных и заставить их работать правильно", - рассказывает Дикман. Лучшие практики теперь собраны в шаблоне и доступны для всех.
С помощью Data Reviewer удалось стандартизировать процесс контроля качества поиска и определения основных ошибок и отслеживания их исправлений. В течение трех месяцев один набор данных был полностью очищен. Пространственное редактирование оставшихся двух больших наборов данных вскоре было завершено. Первоначально основное внимание уделялось поиску несвязанных объектов. Проверки связности гарантировали, что все объекты были правильно соединены для программного обеспечения моделирования водоснабжения и получения точных результатов. Затем для создания корректных запросов на обслуживание и рабочих заданий в программном обеспечении управления оборудованием необходимо указать уникальный идентификатор каждого оборудования. Этого можно достичь с помощью проверки Уникальный ID.
Esri также сыграла важную роль в оказании помощи району в создании баз данных и предоставлении рекомендаций в области моделирования данных, в частности, в отношении использования доменов вместо подтипов. Район сотрудничал с Esri для создания схемы данных, которая теперь не требует пояснений для пользователей в организации.
Перед покупкой Data Reviewer и обращением за помощью к Esri, Салливан и Дикман годами вручную проверяли объекты при создании своей базы данных. Сейчас над проектом работает только Дикман, и он уже опережает график на полгода! Ожидается, что по завершении формирования трех наборов данных экономия составит более одного человеко-года.
По мере развития новой инфраструктуры округ планирует использовать ArcGIS Data Reviewer для контроля качества новых данных, а также для поддержки имеющихся данных.
I highly recommend this approach for small shops like ours [whose staff] are not able to dedicate 100 percent of their time to doing QC.