Рекс Л. М., Умывакин В. М. Эколого-хозяйственное состояние земель как объект оценки и управления территориальными ресурсами - 9 Рис.4.5. y Учебный сайт

Рекс Л. М., Умывакин В. М. Эколого-хозяйственное состояние земель как объект оценки и управления территориальными ресурсами - 9




religioznoe-obrazovanie-katehizaciya-doklad-2011-goda-vashi-visokopreosvyashenstva-i-preosvyashenstva-vsechestnie-otci.html
religioznoe-svobodomislie-v-epohu-vozrozhdeniya.html
Рис.4.4. Мультимодальная область распределения геообъектов
В основе определения нечеткого множества лежит представление о том, что элементы произвольного класса, обладающие некоторым общим свойством (признаком), могут обладать им в различной мере, т.е. принадлежать этому классу в различной степени. Поэтому здесь используется "нечеткая" характеристическая функция (функции принадлежности), позволяющая измерить степень принадлежности элемента заданному "расплывчатому" множеству. Приведем определение нечеткого множества. Говорят, что на множестве  задано нечеткое множество F, если определена числовая функция F(), характеризующая степень принадлежности объектов к множеству F. Функция F() называется функцией принадлежности множеству F. Она ставит в соответствии каждому объекту  из F число из интервала [0,1].
Методы нечеткой классификации можно рассматривать как естественное развитие соответствующих "традиционных", детерминированных и вероятностных методов автоматизированной классификации, которые позволяют получить более детальные количественные данные о принадлежности геообъектов классам (образам). Их отличительной особенностью является то, что помимо разбиения на классы для каждого геообъекта указывается количественная мера его принадлежности к классу. Последнее дает возможность определить в каждом классе типичных представителей, которые могут быть рекомендованы в качестве репрезентативных объектов мониторинга и управления земельными ресурсами. Кроме того, число классов разбиения здесь заранее не задается. Поэтому результаты нечеткой классификации более объективно отражают внутреннюю структуру анализируемых геоданных.
Предлагаемый метод распознавания образов [И.Б.Руссман, В.М.Умывакин, 1985. - 105 с.] основан на рассмотрении исходной совокупности (множества) геообъектов =1,2,...,N как нечеткого множества. Он позволяет: 1) строить функцию принадлежности геообъектов i=(y1i,y2i,...,yMi) к множеству ; 2) разбивать нечеткое множество  на классы (нечеткие подмножества) 1, 2,..., L, каждое из которых содержит ОР, попавшие в одномодальную область; 3) строить функции принадлежности ОР к соответствующим классам. Согласно гипотезе "модальности" предполагается, что одномодальным областям (областям, имеющим одну точку максимума функции принадлежности) соответствуют однородные классы геообъектов.
Рассмотрим один из способов построения функций принадлежности. Пусть il - мера сходства ("расстояние") между i-м и l-м геообъектами в
M-мерном пространстве ПХП. Тогда величина 'il=1/(1+il) будет отражать меру подобия этих ОР. Причем 'il=1, если геообъекты совпадают (очень «близки») в исходном пространстве ПХП и 'il=0, если они "бесконечно" удалены друг от друга. Очевидно, что чем больше показатель степени  при il, тем быстрее убывает величина 'il с увеличением il. Естественно предположить, что чем ближе ОР расположен к другим объектам множества , тем больше должно быть его значение функции принадлежности. В связи с этим можно считать, что мера принадлежности MF() данному множеству имеет вид:
MF(i)='il , i, l=1,2,...,N.
Чтобы данная функция принимала значения из интервала [0,1], ее нужно нормировать, разделив на максимальное значение:
F(i) = MF(Ii)/maxMF(i).
Отметим, что с увеличением показателя степени  влияние "дальних" геообъектов на величину MF(i) уменьшается и возрастает влияние "близких" ОР. С увеличением , таким образом, повышается чувствительность функции принадлежности к локальным изменениям плотности распределения ОР в пространстве исходных ПХП. При достаточно равномерном распределении ОР можно получить одномодальную функцию принадлежности и тогда разбиение на классы не произойдет. Можно предложить и другие способы построения этих функций. [Андреев В.Л., 1987. - 154с.; Gitman I., Levine M.D., 1970. - P.583-593.].
После построения функции принадлежности множеству  отыскиваются модальные точки (локальные максимумы этой функции). Затем из ОР, расположенных вблизи модальных точек, формируются классы (нечеткие множества). В каждом классе строится своя функция принадлежности. Она вычисляется так же, как и для всего множества .
В тех случаях, когда формальный анализ является вспомогательным средством для решения задач многомерной классификации ОР, экспертам целесообразно выдавать информацию в наглядно - обозримой форме. В связи с этим в комплексе с методами автоматизированной классификации рекомендуется применять методы многомерного шкалирования (визуализации геоданных) [Терехина А.Ю., 1986. - 168 с.; Sammon J.W., 1969. - P.401-409]. Они могут быть отнесены к методам кластер-анализа, в основу которых положена гипотеза "компактности", т.е. предположение о том, что классу в пространстве обобщенных ПХП соответствует изолированная группа близких точек (геообъектов). Методы компьютерной визуализации позволяют получать наглядное представление о взаимном расположении ОР, что значительно облегчает содержательный анализ и интерпретацию результатов многомерной классификации. В отличие от других используемых методов анализа геоданных, методы многомерного шкалирования оперируют с матрицей различий между парами ОР. Они основаны на построении обобщенных ПХП ("ведущих" факторов), которые дают возможность получать информацию об анализируемых ОР в сжатом, агрегированном виде. Очень важно, чтобы указанные факторы включали в себя информацию, необходимую для принятия обоснованных эколого-экономических решений по рациональному использованию и охране земель.
В методах компьютерной визуализации множеству ОР ставится в соответствие конфигурация точек в M-мерном пространстве исходных ПХП (исходном пространстве). Требуется осуществить отображение ("перевод") N точек из исходного пространства ПХП в результирующее пространство меньшей размерности mdil=[Фik-Фlk)2]1/2 , (4.5)
где Фik - значение k-го обобщенного ПХП i-го ОР (i-й точки), k=1,2,3; i=1,2,...,N.
Для поиска оптимальной конфигурации точек в результирующем пространстве можно использовать различные критерии качества отображения [Терехина А.Ю., 1986. - 168 с.; Sammon J.W., 1969. - P.401-409]. Так, в методе главных компонент [Айвазян С.А., Бухштабер В.М., Енюков И.С. и др., 1989. - 607 с.] фактически отыскивается конфигурация точек, которая минимизирует критерий:
S0= il2-dil2) = il2-dil2), (4.6)
где il - евклидово расстояние между точками в исходном пространстве, а dil - в пространстве размерности mПреобразование к главным компонентам (фактором) оптимально в том плане, что первому фактору соответствует наибольший разброс спроецированных на его ось точек из исходного пространства, первому и второму факторам – наибольшее рассеяние точек, спроецированных на плоскость, образованную этими главными компонентами и т.д. Методы визуализации геоданных являются обобщением метода главных компонент, т.к. используют различные нелинейные критерии качества отображения исходного пространства в базовое, например,
S1= il-dil)2, (4.7)
S2= il-dil)2 / il, (4.8)
S3= il-dil)il, (4.9)
Эти критерии являются более гибкими с точки зрения разбиения ОР на однородные классы. Так, критерий S1 соответствует отображению, для которого в среднем хорошо передаются все расстояния (различия) между геообъектами; для критерия S2 более точно сохраняются малые различия (т.к. им соответствуют большие "веса" 1/il) и менее точно - существенные. Для построения многомерной классификации ОР целесообразно использовать критерий [Терехина А.Ю., 1986. - 168 с.]:
(4.10)
Критерий S4 имеет следующий смысл: если конфигурация точек из исходного пространства в результирующее передается с ошибками, то искажения будут в большую сторону для больших расстояний и в меньшую для небольших. Другими словами, S4 препятствует удалению близких геообъектов и сближению далеких, что позволяет различать отдельные классы. Критерии типа S1-S4 являются функцией Nm координат N точек в пространстве размерности m. Для поиска оптимальной конфигурации точек в результирующем пространстве используются различные методы минимизации [Гилл Ф., Мюррей У., Райт М., 1985. – 317с.]. При этом в качестве начального приближения рекомендуется использовать проекцию ОР из исходного пространства ПХП в результирующее пространство, образованное первыми m признаками с наибольшими весовыми коэффициентами или первыми m главными компонентами.
В заключение подчеркнем основные возможности методов многомерного шкалирования: 1) построение результирующего пространства малой размерности, в котором наилучшим образом сохраняется внутренняя структура исходных геоданных о различии пар ОР. Проецирование геообъектов на оси полученного пространства определяет их координаты в этом пространстве, т.е. осуществляется процесс многомерного шкалирования; 2) визуальное представление совокупности ОР в виде оптимальной конфигурации точек в результирующем пространстве;
3) содержательная интерпретация полученных осей результирующего пространства (обобщенных ПХП) - конечный результат многомерного шкалирования, позволяющий получить новое знание - выявить "скрытые" факторы, определяющие сходство и различие ОР.

4.2.3. Содержательный анализ и интерпретация результатов многомерной классификации


При содержательном анализе и интерпретации результатов многомерной классификации ОР осуществляют [Жердев В.Н., Умывакин В.М., 1997. - С.65-69; Рекс Л.М., Руссман И.Б., Умывакин В.М., 1989. - 29 с.; Рекс Л.М., Русинов П.С., Умывакин В.М., 1999. - 32 с.]: 1) уточнение состава и границ классов ОР; 2) описание классов на языке исходных разноименных ПХП; 3) интерпретацию обобщенных ПХП и описание классов на их языке; 4) образование районов и построение легенды комплексной тематической карты состояния земель в регионе на основе анализа своеобразия природно-хозяйственных условий классов ОР.
Уточнение состава и границ классов, полученных с помощью методов анализа геоданных производится на основе сопоставления результатов многомерной классификации и карты базового природно-хозяйственного районирования территории следующим образом: 1) все ОР выделяются на карте базового районирования (на базовом тематическом слое в ГИС);
2) отмечаются ОР, отнесенные к одному классу; 3) сравниваются границы классов и границы районов на карте; 4) выявляются причины отнесения отдельных ОР, входящих в определенный район, к классу, не имеющему общих границ с этим районом; 5) принимается решение о "переводе" единичных ОР в состав классов, образующих определенный район на комплексной тематической карте, или решение об уточнении границ данного района.
При описании классов на языке исходных ПХП указываются статистическая информация о диапазоне изменения, минимальных, максимальных, средних значениях и среднеквадратических отклонениях этих показателей. Интерпретация обобщенных ПХП и описание классов на их языке производится на основе анализа результатов анализированной классификации и компьютерной визуализации ОР.
Сначала на диаграмме рассеяния точек в результирующем пространстве ПХП (рис.4.5.) выделяются (определенным цветом или символом) геообъекты, принадлежащие конкретному классу и границы классов, а затем выделяются аномальные ОР (точки).

Рис.4.5.

Визуальное представление объектов районирования (диаграмма рассеяния точек) в двумерном результирующем пространстве
Ф1 - обобщенный показатель плоскостной эрозии
Ф2 - обобщенный показатель овражной эрозии
- граница класса при классификации в нечетких множествах
- граница класса при классификации по дереву кратчайших расстояний
Под такими геообъектами понимаются ОР, которые имеют экстремальные (минимальные или максимальные) значения обобщенных ОР и резко выделяются на диаграмме своим положением вдоль их осей.
Для каждого аномального ОР определяются те исходные ПХП, которые имеют экстремальные значения. Если аномальные ОР соответствуют направлению улучшения (снижению или увеличению значений) исходных ПХП, то они маркируются символами "+". В противном случае, данные объекты отмечаются символами "–". Выявленная тенденция изменения исходных ПХП должна быть проверена на "промежуточных" ОР. Кроме того, целесообразно определить коэффициенты парной корреляции между обобщенными и исходными ПХП. На основе проведенного анализа устанавливаются направления улучшения обобщенных ПХП и выделяются группы исходных ПХП, вносящих наибольший вклад в формирование первого и второго обобщенных ПХП (ведущих факторов) Затем проводится интерпретация (формулировка наименований) обобщенных ПХП. На диаграмме рассеяния выделяются ОР, имеющие близкие значения по одному ведущему фактору и существенно различные по другому. При этом эксперт отвечает на вопрос: "Как назвать единым термином тот обобщенный ПХП, по которому резко отличаются выделенные объекты районирования?"
При описании классов на языке обобщенных ПХП учитывается положение ОР относительно осей этих факторов на диаграмме рассеяния.
Образование районов и построение легенды комплексной тематической карты состояния земель в регионе на основе анализа своеобразия природно-хозяйственных условий классов ОР проводится в результате анализа состава, границ и описания классов ОР на языке исходных и обобщенных ПХП. Составление комплексной тематической карты состояния земель в регионе осуществляется путем выделения искомых природно-хозяйственных районов и их раскрашивания или штриховки с помощью компьютерных средств геоинформационных систем [Кошкарев А.В., Тикунов В.С., 1993. - 213с.].
Применение автоматизированной методики комплексного природно-хозяйственного районирования позволяет повысить обоснованность и качество эколого-экономических решений, принимаемых при разработке комплекса мероприятий по охране и рациональному использованию земель в регионе.
Автоматизированная методика комплексного природно-хозяйственного районирования территории региона реализуется с помощью стандартных геоинформационных систем (типа ARC/INFO) и программных систем статистического анализа геоданных (например, S-PLUS). Для иерархической структуризации и определения весовых коэффициентов природно-хозяйственных показателей разработан оригинальный комплекс программ. Анализ выходной информации программных систем анализа геоданных осуществляется по описанный выше методике в соответствии с технологическими этапами, приведенными на рис.4.1.
ПРИЛОЖЕНИЕ. Построение дискретно-непрерывных моделей показателей качества природно-хозяйственных геосистем
Предположим, что для математической формулировки задач выбора наилучших вариантов комплекса мероприятий по рациональному использованию и охране земель в регионе (в частности, мероприятий по борьбе с негативными последствиями антропогенного воздействия на земельные ресурсы) имеется возможность статистического моделирования взаимосвязей показателей качества природно-хозяйственных геосистем.
Пусть из всех природно-хозяйственных показателей геообъектов (например, водосборов малых и средних рек), выделен перечень количественных управляемых показателей - критериев качества

y

=(y1,y2,...,yM) и перечень управляющих переменных

-

параметров

x

=(x1,x2,...,xL). Обозначим через yj0 анализируемый (моделируемый) критерий (например, yj – «смытость почв с площади с.-х. угодий, %», связанный статистическими связями с параметрами x1,x2,...,xK (например, х1-

"

облесенность территории,%" и х2 - "глубина местного базиса эрозии, м"), 1j0M. Предположим также, что имеется некоторая совокупность (выборка) из N геообъектов, для которых известны значения величин yij0 и xiK для каждого i-го объекта, K=1,2,...,L; i=1,2,...,N. Требуется определить форму статистической взаимосвязи моделируемого критерия (фактор - функции) и параметров (фактор - аргументов), т.е. установить регрессионную зависимость yj0 от x1,x2,...,xK.
Полученные регрессионные модели могут быть использованы для прогнозирования изменений критериев качества при варьировании значений параметров ПХГС (в частности, при выработке компромиссных эколого-экономических решений по борьбе с эрозией земель на речном водосборе).
Для того, чтобы практически решить задачу исследования статистических зависимостей с помощью методов классического корреляционно

-

регрессионного анализа, необходимо проверить основные предпосылки их применения. Однако, в реальных эколого-географических исследованиях многие из них не выполняются, что не позволяет получить адекватное количественное описание взаимосвязей свойств изучаемых геообъектов. В такой ситуации для установления достоверных статистических зависимостей между характеристиками геообъектов предлагается использовать методы построения дискретно-непрерывных моделей (ДНМ) показателей качества [3, 16]. Такие модели представляют собой комбинацию моделей двух видов - дискретных моделей группировки (типологизации, классификации) и непрерывных моделей многофакторного регрессионного анализа геоданных. При их применении совокупность геообъектов моделируется на двух уровнях - уровне групп (типов, классов) и уровне отдельного объекта. Основная роль группировки (дискретной модели) здесь заключается в том, что она дает возможность получить однородные (в смысле некоторых свойств) группы (типы) геообъектов и тем самым обеспечить построение в каждой группе достоверных уравнений типологической регрессии (непрерывных моделей). Следовательно, исследуемая статистическая зависимость критериев качества и параметров геосистемы может быть представлена не одной непрерывной моделью, а набором уравнений типологической регрессии, каждое их которых применимо только внутри определенной группы объектов, соответствующей строго ограниченной области пространства параметров. Качественное различие групп может проявиться в изменении взаимосвязей между критериями и параметрами. В дальнейшем будем предполагать, что это изменение касается лишь коэффициентов уравнения регрессии при неизменной его форме.
В настоящее время существуют два подхода к построению ДНМ показателей качества сложных систем. Первый подход [3

]

заключается в первоначальном выделении (например, с помощью методов типологической группировки [20] или кластер-анализа [19] по некоторым нечисловым или количественным показателям групп (типов, классов) объектов, для которых затем строятся регрессионные уравнения. Они должны существенно отличаться друг от друга. При этом значения моделируемого критерия, в основном, определяются различиями в значениях параметров в различных группах. В то же время, разделение совокупности геообъектов на четко обособленные группы и построение регрессионных моделей для каждой их них во многих практических ситуациях является затруднительным. Например, когда невозможно разбиение объектов на группы по непересекающимся интервалам диапазона изменения параметров (рис.П.1.). Отметим, что эти интервалы можно рассматривать как значения некоторых нечисловых показателей.
В данном случае применим другой подход [77]. Он основан на предположении, что исходная информация, необходимая для построения ДНМ содержится в самом анализируемом критерии качества. Так, для геообъектов с близкими значениями параметров значения этого критерия могут сильно отличаться. Это позволяет сделать вывод, что измерения показателей сделаны на объектах из разных групп, которым соответствуют существенно различные уравнения регрессии

-

"центры" групп (см.рис.П.1.). Здесь можно рассмотреть вопрос о качестве такой группировки, который решается с помощью проверки статистической гипотезы об идентичности уравнений регрессии. Если гипотеза отвергается, то есть основания считать, что разбиение совокупности геообъектов на группы проведено верно.
Как известно, важнейшими характеристиками качества (достоверности) уравнений регрессии являются выборочный коэффициент множественной корреляции R и дисперсионное отношение Фишера F. Сравнив F с соответствующими критическими значениями Fкр., можно судить об адекватности (в смысле F-критерия Фишера) построенных регрессионных моделей. На практике часто уравнение регрессии, полученное на основе всей совокупности геообъектов, искажает физический смысл зависимости моделируемого критерия и параметров и не является достоверным.

Рис.П.1. Классификация геообъектов по регрессионным моделям анализируемого критерия качества
7 11 -

mpedagog.ru