Лекция 5 ГИС

5 МОДЕЛИ ПРОСТРАНСТВЕННЫХ ДАННЫХ
План:
Определение и характеристика пространственных объектов.
Растровая модель данных.
Регулярно-ячеистая модель данных.
1. Определение и характеристика пространственных объектов.
Информационную основу ГИС образуют цифровые представления (Модели) реальности. С появлением компьютера все множество данных разделилось на два типа: цифровые и аналоговые данные. Последними стали именовать данные на традиционных «бумажных» носителях, используя этот термин как антоним цифровым данным. В отличие от аналоговой, цифровая форма представления, хранения и передачи данных реализуется в виде цифровых кодов или цифровых сигналов.
Рассматривая данные по отношению к описываемым ими объектам, говорят о цифровых моделях объектов, а применительно к пространственным объектам в ГИС - о цифровых моделях пространственных объектов. Термин «цифровая модель» нельзя признать удачным - он отражает внешнюю форму их представления, а не его суть как набор логических правил построения системы из слагающих ее элементов - в данном случае элементарных (атомарных) пространственных объектов, имеющих аналогии в компьютерной графике и называемых там графическими примитивами. Цифровые по форме, по своей сути модели пространственных данных относятся к типу информационных моделей, отличных от реальных (например, физических), математических, мысленных или моделей особого типа, например картографических.
Объектом информационного моделирования в ГИС является пространственный объект. Это одно из ключевых понятий геоинформатики. Он может быть определен как цифровое представление (модель) объекта реальности (местности), содержащее его местоуказание и набор свойств (характеристик, атрибутов), или сам этот объект.
Некоторое множество цифровых данных о пространственных объектах образует пространственные данные. Они состоят из двух взаимосвязанных частей: позиционной (тополого-геометрической) и непозиционной (атрибутивной) составляющих, которые образуют описание пространственного положения и тематического содержания данных соответственно.
Пространственные объекты как абстрактные представления реальных объектов и предмет информационного моделирования (цифрового описания) в ГИС разнообразны и традиционно классифицируются сообразно характеру пространственной локализации отображаемых ими объектов реальности, мерности пространства, которое они образуют, модели данных, используемой для их описания, и по другим основаниям. В рамках объектно-ориентированных моделей данные могут конструироваться в новые классы объектов, отличные от базовых или созданных ранее. Базовыми (элементарными) типами пространственных объектов, которыми оперируют современные ГИС, обычно считаются (в скобках приведены их синонимы) следующие:
точка (точечный объект) - 0-мерный объект, характеризуемый плано выми координатами;
линия (линейный объект, полилиния) - 1 -мерный объект, образован ный последовательностью не менее двух точек с известными плановыми ко ординатами (линейными сегментами или дугами);
область (полигон, полигональный объект, контур, контурный объект) - 2-мерный (площадной) объект, внутренняя область, ограниченная замкну той последовательностью линий (дуг в векторных топологических моделях (данных) или сегментов в модели «спагетти») и идентифицируемая внутрен ней точкой {меткой);
пиксел (пиксель, пэл) - 2-мерный объект, элемент цифрового изобра жения, наименьшая из его составляющих, получаемая в результате дискрети зации изображения (разбиения на далее неделимые элементы растра); эле мент дискретизации координатной плоскости в растровой модели (данных)
ГИС;
ячейка (регулярная ячейка) - 2-мерный объект, элемент разбиения земной поверхности линиями регулярной сети;
поверхность (рельеф) - 2-мерный объект, определяемый не только плановыми координатами, но и аппликатой Z, которая входит в число атри бутов образующих ее объектов; оболочка тела;
тело - 3-мерный (объемный) объект, описываемый тройкой (трипле том) координат, включающей аппликату Z, и ограниченный поверхностями.
Общее цифровое описание пространственного объекта включает:
наименование;
указание местоположения (местонахождения, локализации);
набор свойств;
отношения с иными объектами;
пространственное «поведение».
Два последних элемента описания пространственного объекта факультативны.
Наименованием объекта служит его географическое наименование (имя собственное, если оно есть), его условный код и/или идентификатор, присваиваемый пользователем или назначаемый системой.
В зависимости от типа объекта его местоположение определяется парой (триплетом) координат (для точечного объекта) или набором координат, организованным определенным образом в рамках некоторой модели данных, о которых речь пойдет ниже. Это геометрическая часть описания данных. геометрия (метрика) рассматриваемых пространственных объектов, отличная от их семантики (непозиционных свойств).
Перечень свойств соответствует атрибутам объекта, качественным и количественным его характеристикам, которые приписываются ему в цифровом виде пользователем, могут быть получены в ходе обработки данных или генерируются системой автоматически (к последнему типу атрибутов принадлежат, например, значения площадей и периметров полигональных объ-
ектов). Существует расширенное толкование понятия атрибута объекта; последнему могут быть поставлены в соответствие любые типы данных текст, цифровое изображение, видео- или аудиозапись, график; (включая карту), что, по существу, реализуется на практике в мультимедийных электронных атласах. Под атрибутами понимаются именно содержательные, тематические (непозиционные, непространственные) свойства объектов.
Под отношениями понимают прежде всего топологические свойства (топологию). К топологическим свойствам пространственного объект принято относить его размерность (мерность, пространственную размерность), сообразно которой выше были выделены 0, 1, 2 и 3-мерные объекты; замкнутость, если речь идет о линейных объектах в широком смысле слова; связность; простота (отсутствие самопересечения линейных объектов и «островов» в полигоне); нахождение на границе, внутри или вне полигона; признак точечного объекта, указывающий, является ли он конечным для некоторой линии. Примерами топологических отношений объектов являются их свойства «пересекаться» (или «не пересекаться»), «касаться», «быть внутри», «содержать», «совпадать» [С.Ф.Трофимова, 2000].
Топология вместе с геометрией образует тополого-геометрическую часть описания данных, его позиционную часть.
Таким образом, в самом общем виде в пространственных данных следует различать и выделять три составные части: топологическую, геометрическую и атрибутивную - «геометрию», «топологию» и «атрибутику» цифровой модели пространственного объекта.
Четкое разделение позиционных и непозиционных данных - историческая традиция, имеющая определенные технологические корни. Управление атрибутивной частью данных обычно возлагается на средства систем управления базами данных (СУБД), встроенных в программные средства ГИС или внешних по отношению к ним (см. 2.1.4). В наиболее яркой форме оно реализовано в рассмотренной ниже векторной модели данных, атрибуты которой представлены таблицей, хранятся и управляются СУБД, поддерживающей
5
реляционную модель данных, а их позиционная часть, связанная с атрибутивной через идентификаторы пространственных объектов, управляется другими средствами. Модели пространственных данных такого типа получили широкое распространение и наименование геореляционных. Будучи еще недавно практически единственной и став классической, геореляционная модель не выглядит достаточно изящной. Современной альтернативой этой модели является интегрированный подход, когда и атрибутивная, и тополо-го-геометрическая части данных хранятся и управляются в единой среде СУБД, а также объектный и объектно-реляционный подходы (и одноименные им типы моделей данных) [Ю.К.Королев, 1998].
Объектно-ориентированный подход к моделированию пространственных объектов вводит также понятие их «пространственного поведения».
Способы организации цифровых описаний пространственных данных принято называть моделями данных по традиции, унаследованной из теоретических обобщений проектирования систем управления базами данных. Они называются также цифровыми представлениями или просто представлениями пространственных данных.
На концептуальном уровне все множество моделей пространственных данных можно разделить на три типа: модели дискретных объектов, модели непрерывных полей и модели сетей.
Типами (классами) моделей именуют также модели, различающиеся по своему внутреннему устройству. В литературе существует множество классификаций моделей и наименований конкретных моделей. Построить исчерпывающую классификацию моделей пространственных данных вряд ли возможно: чуть ниже будет показано, что особенности моделируемой предметной области и специфические требования к функциональности ГИС могут потребовать разработки и использования весьма специальных моделей данных. Кроме того, как справедливо заметил Ю. К. Королев, «их нельзя расклассифицировать по одной оси, они различаются как бы «в разные стороны» [Ю.К.Королев, 1998. - С. 110]. Тем не менее в практике геоинформатики уже
6
достаточно давно определился набор базовых моделей (представлений) пространственных данных, используемых для описания объектов размерности не более двух (планиметрических объектов):
растровая модель;
регулярно-ячеистая (матричная) модель;
квадротомическая модель (квадродерево, дерево квадратов, квадрант ное дерево, Q-дерево, 4-дерево);
векторная модель:
векторная топологическая (линейно-узловая) модель;
векторная нетопологическая модель (модель «спагетти»).
Это список рекомендуемых терминов для обозначения базовых моделей данных. Он не включает модели, используемые для представления поверхностей (рельефов) и рассмотренные ниже в разделе о цифровом моделировании рельефа, а также трехмерных расширений базовых моделей и специальных типов моделей для особых объектов (например, геометрических сетей). Рассмотрим перечисленные модели более подробно.
2. Растровая модель данных.
Модель данных, именуемая растровой взамен устаревшего наименования матричной модели данных, имеет аналогии в компьютерной графике, где растр - прямоугольная решетка - разбивает изображение на составные однородные (гомогенные) далее неделимые части, называемые пикселами (от английского pixel, сокращение от «picture element» - элемент изображения), каждому из которых поставлен в соответствие некоторый код, обычно идентифицирующий цвет в той или иной системе цветов (цветовой модели). Из множества значений логических пикселов складывается цифровое изображение. Растровая модель данных в ГИС предполагает разбиение пространства (координатной плоскости) с вмещающими ее пространственными объектами на аналогичные пикселам дискретные элементы, упорядоченные в виде прямоугольной матрицы. Для цифрового описания (позиционирования) точечного объекта при этом будет достаточно указать его принадлежность к тому
7
или иному элементу дискретизации, учитывая, что его положение однозначно определено номерами столбца и строки матрицы (при необходимости координаты пиксела, либо его центроида или любого угла могут быть вычислены). Пикселу присваивается цифровое значение, определяющее имя или семантику (атрибут) объекта. Аналогичным образом описываются линейные и полигональные объекты: каждый элемент матрицы получает значение, соответствующее принадлежности или непринадлежности к нему того или иного объекта (рис. 1).
Представление исходных полигональных объектов на рис. 6 в виде растра может показаться весьма грубым приближением их истинной формы. Однако, выбрав подходящий размер пиксела растровой модели, можно добиться пространственного разрешения (точности представления объектов), удовлетворяющего целям их цифрового описания и последующей обработки, если этому не препятствуют соображения экономии машинной памяти: двукратное увеличение разрешения ведет к четырехкратному росту объемов

Рис. 1. Растровая модель данных. Исходные полигональные объекты (а) с атрибутами (классами) А, В, С, D и Е и матрица размером 7x7 растровой модели (6), каждому элементу которой присвоено значение атрибута объекта [Картография..., 1994. - С. 198].
хранимых данных и т.д. Полученная матрица образует растровый слой с однотипными объектами; множество разнотипных объекта образует набор слоев, составляющих полное цифровое описание моделируемой предметной области. С каждым семантическим значением или кодом пиксела, кроме того,
может быть связан неограниченный по длине набор (таблица) атрибутов, каждый из которых можно развернуть в производный слой, соответствующий размеру исходной матрицы. Таким образом, становится не столь Обязательным разделение данных на позиционную и семантическую составляющие, отпадает необходимость в особых средствах хранения и манипулирования метрикой и семантикой пространственных данных, как это принято в векторных системах, существенно упрощаются аналитические операции, многие из которых (включая обработку запросов с логическими условиями) сводятся к попиксельным операциям с набором растровых слоев, которые могут быть легко «распараллелены».
В ГИС растрового типа (с возможностями поддержки растровой модели данных) достаточно просто могут быть реализованы функции их обработки, включая пространственный анализ. Зачастую они содержат также аппарат, получивший название «картографической алгебры» (неудачный дословный перевод с английского «тар algebra»), аналогичный по языковым средствам матричным операциям в некоторых языках программирования. Поддержка растровой модели данных - хорошая предпосылка (и условие) интеграции программных продуктов ГИС со средствами цифровой обработки данных дистанционного зондирования и обработки изображений в целом.
Простота машинной реализации операций с растровыми данными находится в противоречии с другой главной их особенностью - значительными затратами машинной памяти, требуемой для их хранения (в сравнении с объемами данных в описываемых ниже векторных моделях). Существуют способы сжатия (компрессии, упаковки) растровых данных. Простейший и достаточно популярный из них - групповое кодирование. Групповой код преобразует исходный растровый слой в ряд пар целых (обычно двухбайтовых) чисел, нечетные позиции которого отводятся для указания числа повторяющихся пикселов (групп) со значениями, занимающими четные позиции ряда, образуя счетчик и значение группы соответственно. Порядок просмотра исходной матрицы конвенциализируется, и в случае движения компрессора
слева направо и сверху вниз (в лексикографическом порядке) матрица на рис. 6 будет свернута в одномерный массив вида:
4С ID 2С IB 2Е 3D 1С IB IE 1С 3D 4С 3D IB ЗС ЗА IB ЗС 1А ЗВ
4D 1А2В. Новая пара чисел (пакет) генерируется тогда, когда изменяется группа
или когда количество ее элементов превысит допустимое двухбайтовое значение счетчика.
Степень сжатия данных, в нашем примере составляющая всего около 2 %, в общем случае будет зависеть от пространственной структуры исходного растрового слоя, составляя многие порядки, а при определенных условиях приближаясь по компактности к векторным представлениям и форматам (которые сами по себе обычно настолько компактны, что не нуждаются в сжатии). Существуют различные модификации группового кода, широко используемого также для сжатия цифровых изображений.
3. Регулярно-ячеистая модель данных.
Описанная выше растровая модель данных пригодна для цифрового представления не только пространственных объектов в ГИС, но и изображений. Примерами могут служить цифровые фотоизображения, снятые непосредственно цифровой фотокамерой или полученные путем цифрования аналоговых негативов или фотоотпечатков на сканере хорошего разрешения и далее превращенные (возвращенные) в графику на страницах иллюстрированных журналов или в семейном фотоальбоме. Данные дистанционного зондирования Земли - аэроснимки и космические снимки, получаемые с борта космических платформ и других летательных аппаратов и представляющие собой, как отмечалось ранее, один из основных источников данных для ГИС, в настоящее время в существенной своей части по форме тоже цифровые, образуют класс растровых цифровых изображений, обрабатываемых программными средствами цифровой обработки изображений. Растровой цифровой копией можно назвать оцифрованную на том же сканере бумажную карту, используемую в качестве графической подложки (растровой цифровой карты-основы) в малозатратных геоинформационных проектах.
10

Рис. 2. Разбиение сферы на равновеликие трапеции [Картография..., 1994. - С. 95].
Во всех перечисленных выше случаях речь идет о цифровых растровых изображениях, образованных множеством его элементов - пикселов, каждому из которых ставится в соответствие значение (код) цвета или спектрального коэффициента яркости объекта съемки. На эти далее неделимые элементы растра «разбивается» и координатная плоскость с пространственными объектами в их растровом представлении. Если атомарной единицей данных при их описании служит элемент «разбиения» территории - регулярная пространственная ячейка (территориальная ячейка) правильной геометрической формы - речь идет о другой, отличной от растровой, хотя и формально с нею схожей, регулярно-ячеистой модели данных. Формальное сходство абсолютно в случае квадратной (прямоугольной) формы ячеек, хотя известны примеры регулярных (или квазирегулярных) сетей (решеток) с ячейками правильной треугольной, гексагональной или трапециевидной формы, равновеликих или квазиравновеликих. При этом сеть может строиться (разумеется мысленно) на плоскости в условных прямоугольных координатах некоторой картографической проекции или на поверхности шара или эллипсоида; в последнем случае регулярными ячейками обычно являются сферические трапеции фиксированного или переменного углового размера. Пример построения сети равновеликих трапеций на сфере (что эквивалентно равновеликой цилиндрической (квадратной) проекции Ламберта) прицелен на рис. 2.
11
По ряду технологических и технических причин ГИС первых поколений (60 -70-е годы XX в.) использовали регулярно-ячеистую модель данных. На рис. 3. дан пример одной из ранних австралийских геоинформационных систем континентального масштаба ARIS, создаваемой с начала 70- годов,

Рис. 3. Регулярная сеть картографической БД GRID 0.5 австралийской национальной геоинформационной системы APJS [Картография..., 1994. - С. 169]
основу которой составляла картографическая БД GRID с представлением данных в ячейках 0,5 х 0,5 мин и 0,25 х 0,25 мин и БД EIGHT с 50 гыс. ячеек 1/8x1/8 мин.
Размеры ячеек могут быть различны, определяясь необходимым пространственным разрешением, образуя иерархически организованные системы из трех, как в вышеприведенном примере ГИС ARIS, или более вложенных друг в друга территориальных ячеек, соответствующих разным уровням разрешения (рис. 4).

Рис. 4. Иерархическая организация регулярной сети представления данных в информационной системе для регионального планирования Окриджа ORMIS (США) [Computer software, 1981]
Представление данных на основе регулярных пространственных сетей образует основу глобальных цифровых моделей рельефа (ЦМР) Земли ЕТОР05 и GTOPO30. Первая из них содержит более 8 млн высотных отметок в узлах регулярной сети сферических трапеций с размерами 5x5 утл. мин, вторая, более детальная, представляет высоты в узлах трапеций 30 х 30 с. Аналогичный регулярно-ячеистый принцип организации данных, как будет показано в разделе о цифровом моделировании рельефа, положен в основу американского национального стандарта на цифровую модель рельефа DEM геологической съемки США с хранением высотных отметок по профилям в узлах ячеек 30 х 30 м в системе координат километровой сетки американских топографических карт (в проекции UTM), а также в узлах трапеций разных размеров.
Заметим в заключение, что зачастую в понятие растровой модели данных объединяются как собственно растровые, так и регулярно-ячеистые модели данных, а разница между пикселом (элементом изображения) и регулярной ячейкой (территориальным элементом), четко различаемых, как упоминалось выше, стандартом SDTS, игнорируется. Причина в том, что и те и другие данные могут храниться в идентичных форматах и обрабатываться
\3
одними и теми же средствами, не принимая во внимание (за немногими исключениями) семантического различия между ними.
Ранние реализации ГИС (конца 60-х - начала 70-х годов XX в.) ориентировались преимущественно на растровые и регулярно-ячеистые модели данных, что объясняется техническими и технологическими причинами: неразработанностью и непопулярностью векторных моделей в условиях отсутствия или недоступности средств векторного цифрования картографических источников и средств компьютерной графики, используемых в то время в основном в экспериментах по автоматизированному картографированию.
Контрольные вопросы.
Что представляет собой пространственный объект0
Почему среди многочисленных синонимов термина «пространствен ный объект» в качестве нормализованного предлагается именно этот термин?
В каких двух значениях употребляется термин «пространственные данные»?
4 Может ли быть исчерпан список элементарных пространственных объектов?
Каковы мотивы отнесения моделей пространственных данных к ба зовым?
В чем суть растровой модели данных в ГИС?
Чем растровая модель данных отличается от регулярно-ячеистой и насколько важно различие между ними?
15

Приложенные файлы

  • doc 8871346
    Размер файла: 290 kB Загрузок: 0

Добавить комментарий