Автоматическая классификация контуров современных структур при палеотектоническом анализе

 

Е.А. Алейникова, М.С. Шутов (АУ «НАЦ РН им. В.И. Шпильмана»)

Палеотектонический анализ является мощным инструментом исследования особенностей и истории развития толщ земной коры и неотъемлемой составляющей при проведении оценки нефтегазоносного потенциала территории исследования.

Изучение истории геологических поверхностей во многом может объяснить современное состояние геологического разреза, расшифровать историю формирования и развития структур и залежей [1].

Рис. 1. Поведение родственных структур при переходе между картами изопахического треугольника

Рис. 1. Поведение родственных структур при переходе между картами изопахического треугольника

Одним из наиболее широко применяемых способов палеотектонического анализа является создание изопахических схем. В основе этого способа лежит построение набора палеокарт как разностей исходных современных структурных поверхностей [2]. Полученные в результате этого карты совместно с исходными образуют изопахический треугольник. Далее на всех имеющихся поверхностях производится поиск структур в соответствии с ограничениями, накладываемыми на характеристики структур.

Одной из наиболее важных и трудоёмких операций палеотектонического анализа является поиск связей структур различных карт изопахического треугольника. Она необходима для дальнейшего анализа поведения структур при переходе от одного геологического времени к другому. Структура может изменять свою геометрию, размеры, распадаться на несколько структур и т.д. На рисунке 1 представлен пример поведения родственных структур.

Столбец треугольника содержит родственные структуры современной карты на все рассматриваемые геологические времена, строка – родственные структуры современных карт на заданный момент времени.

Сложности при поиске связей структур возникают вследствие необходимости проделывать достаточно много этапов работы не в автоматическом режиме, а «вручную». Например, к числу таких операций относится поиск объединений контуров структур набора карт, дальнейшее принудительное рассечение полученных объединений на основе имеющейся априорной геологической информации, присвоение полученным в результате контурам уникальных идентификаторов и имён.

После завершения процесса поиска связей и именования структур возникает необходимость анализа поведения параметров родственных структур на разные моменты геологического времени. На рисунке 2 приведены примеры графиков изменения площадей и амплитуд.

Рис. 2. Графики изменения амплитуды и площади родственных структур в зависимости от геологического времени  

Рис. 2. Графики изменения амплитуды и площади родственных структур в зависимости от геологического времени 

Ещё одной трудоемкой операцией является классификация контуров структур на основе анализа графиков изменения параметров. На данный момент подобная классификация производится «вручную», то есть для её осуществления необходимо просмотреть большое количество графиков, на которых следует выделить и обобщить схожие тенденции поведения параметров. На основе этих обобщений производится разделение контуров на классы. В классы объединяются контуры, параметры которых имеют схожее поведение на одних и тех же отрезках геологического времени, например, «устойчивый рост», «рост в юрском комплексе с последующим снижением», «снижение в постсеномане», «без выраженных тенденций» и т.д.

В связи с вышеизложенным, появляется необходимость автоматизации как отдельных этапов палеотектонического анализа, так и полной технологической цепочки анализа территории, что позволит повысить точность и оперативность результатов работы.

Для решения указанной задачи в отделении математического моделирования геологических объектов АУ «НАЦ РН им. В. И. Шпильмана» был создан программный комплекс Join, представляющий собой программу палеотектонического анализа структурных поверхностей. К основным задачам комплекса можно отнести: хранение набора анализируемых данных, расчёт совокупности палеокарт, проведение операций палеотектонического анализа (поиск структур, вычисление их характеристик, поиск наследственных связей структур различных геологических поверхностей, вычисление суммарных характеристик для групп родственных структур, построение палеотектонических профилей), формирование отчётной информации.

Исходными данными для проекта служат карты современных структурных поверхностей, полигоны областей определения, геохронологическая привязка, проектные именаьи индексы объектов. На основе загруженных данных происходит вычисление палеокарт – разностей современных карт, таким образом, в проекте создаётся изопахический треугольник. Количество строк и количество столбцов изопахического треугольника равно количеству современных карт проекта.

После вычисления изопахического треугольника происходит поиск структур в соответствии с заданными установками фильтра. Выделенные структуры характеризуются следующим набором признаков: амплитуда, площадь, объём, ранг, замыкающая изогипса и параметры эллипса, равновеликого замыкающей изогипсе. Ранг 1 имеют структуры, которые не содержат других структур (также называются элементарными). Ранг составной (сложной) структуры определяется как старший ранг из включаемых структур плюс единица.

Для проведения дальнейшего анализа производится автоматический расчёт взаимосвязей структур. Поиск взаимосвязей производится отдельно как для положительных, так и для отрицательных структур.

Перед вычислением наследственных связей происходит поиск контуров объединений структур как по вертикали для каждого столбца изопахического треугольника, так и по горизонтали для современных карт. В основе поиска связей между структурами лежит проверка принадлежности структур соответствующим объединениям современных и палеоструктур. Полная цепочка наследования структуры складывается из цепочек наследования по всем столбцам изопахического треугольника.

После вычисления наследственных связей структур появляется возможность проследить их поведение (рост или угасание) несколькими способами.

Во-первых, это изменение структур в плане. При выборе отдельной структуры или их контура объединения, в окне изопахического треугольника отображается изменение структур (их формы и площади), признанных родственными для выбранной (рис. 1).

Во-вторых, это просмотр наследования структур в разрезе. Он используется для изучения изменения формы унаследованных структур, лежащих на линии профиля.

В-третьих, это возможность для цепочки наследования каждой выбранной структуры или их контура объединения проследить изменение каждого из параметров (амплитуда, площадь, объем, параметры эллипса, равновеликого замыкающей изогипсе: большая и малая полуоси, эллиптичность и простирание) с течением времени. Изменение указанных параметров отображается в виде серии графиков, соответствующих разным современным картам.

В-четвёртых, это классификация контуров объединения современных структур в соответствии с поведением того или иного параметра или их совокупности.

Окно классификатора содержит две области: справа – область таблицы динамик параметров контура, слева – область информации и настройки параметров (рис. 3). Таблица динамик (или цветовая схема) изопахического треугольника представляет собой набор ячеек, каждая из которых соответствует одной из карт треугольника. Цвет каждой ячейки несёт информацию об изменении (рост, убывание, стабильность, неоднозначность) параметра группы структур, родственных для рассматриваемого контура объединения. Поведение параметра в каждой ячейке треугольника рассматривается по отношению к состоянию параметра в нижележащей ячейке. Именно поэтому в треугольнике классификатора самая нижняя ячейка каждого столбца всегда окрашена цветом.

Рис. 3. Окно классификатора изменений параметров структур

Рис. 3. Окно классификатора изменений параметров структур

Анализ динамики возможен по одному из семи параметров структур, а также по нескольким параметрам одновременно. Любой конкретный класс – это поведение строго определённого набора параметров (или одного параметра).

За каждым состоянием динамики в цветовой схеме закрепляется свой цвет. По умолчанию задан цвет: зелёный – для роста, жёлтый – для стабильности, красный – для убывания, голубой – для состояния неоднозначности (при сравнении нескольких параметров часто возникает ситуация, когда параметры ведут себя неодинаково, то есть одни – возрастают, другие – убывают), серый – при отсутствии данных. Для состояния «стабильность» дополнительно задаются пределы изменения параметра в процентах, когда его поведение воспринимается как стабильное. Расширение пределов приводит к увеличению количества «стабильных» клеток.

В классификаторе имеется режим создания классов «вручную». Этот режим поддерживает создание классов путём заполнения их цветовых схем. Для создания класса нужно отметить параметр (или несколько) структур, поведение которого описывает класс. Затем последовательно переключая вид динамики параметра (рост, убывание и т.д.) проставить нужный цвет в нужные клетки.

Как уже говорилось ранее, для получения цветовой схемы каждого класса необходимо проделать большой объём работ по анализу и обобщению графиков изменения параметров контуров. Количество контуров в проекте может достигать нескольких сотен, и по каждому контуру в случае создания классов «вручную» необходимо просматривать по несколько графиков.

Предлагаемый способ автоматической классификации контуров современных структур призван решить эти проблемы, то есть заменить операции, проводимые «вручную» автоматической обработкой.

Исходными данными для работы алгоритма являются общее количество контуров объединения структур современных карт, количество классов, на которое нужно произвести разбиение контуров, знак структур, для которых происходит поиск, а также способ учёта стабильности.

Количество классов, на которое происходит разбиение контуров, задаётся пользователем. Ограничения, накладываемые на вводимое число, сводятся к следующему: число должно быть целым положительным, меньшим либо равным количеству контуров объединения современных структур проекта.

Найденные классы могут выводиться в окне классификатора двумя различными способами: либо они добавляются в конец списка уже имеющихся классов, либо обновляют список, стирая его предыдущее содержимое.

Вид структур определяется автоматически исходя из того, с какими из объединений (положительными или отрицательными) идёт работа в главном окне программы.

Следующим параметром, который настраивается перед получением классов, является режим учёта стабильности. Существует два возможных режима: «Единая стабильность» и «Не учитывать стабильность». В случае, когда отмечен пункт «не учитывать», во всех анализируемых контурах границы стабильности сужаются до нуля, а ячейки раскрашиваются в соответствии с динамикой рассматриваемого параметра. Соответственно, в получившихся после такого анализа классах состояние стабильности отсутствует, так как еще на этапе получения исходных данных оно исключается и заменяется другими состояниями.

Напротив, в режиме учёта стабильности «Единая» получившиеся в результате анализа классы могут содержать стабильность среди состояний параметров. В этом случае границы стабильности у всех получившихся классов равны границам стабильности исходных контуров.

Для разделения контуров на классы использовалось несколько критериев. Рассмотрим каждый из них в отдельности:

1) Количество ячеек N с разной динамикой. Для нахождения этого показателя рассматриваются 2 контура, динамики которых сравниваются. Число N увеличивается на 1, если две соответствующие ячейки имеют разную динамику и ни одна из двух динамик не равна стабильности. Для учёта ячеек со стабильностью используется параметр Ns, о котором будет сказано ниже.

2) Количество Ns несовпадений стабильности. Число Ns увеличивается на 1, если динамика одной из двух сравниваемых ячеек равна стабильности, а динамика второй – не равна значению «не однозначная» и не равна стабильности, либо стабильность имеет другую динамику (если у первой ячейки динамика с ростом, то у второй – с падением или наоборот).

3) Сумма разностей процентов динамики Np для ячеек с различным состоянием. Для каждой пары соответствующих ячеек двух контуров сравнивается их динамика. Если динамики различны, то вычисляется разница их числовых характеристик (из большего значения вычитается меньшее), которая затем суммируется с аналогичным показателем предыдущих пар ячеек. Если одна из двух сравниваемых ячеек имеет динамику стабильность, то в случае, если наблюдаются сочетания динамик «стабильность с возрастанием – возрастание» или «стабильность с убыванием – убывание», значение разности не ищется. Сумма всех найденных значений разностей является значением параметра Np.

В наиболее общем виде алгоритм создания классов можно свести к двум основным пунктам:

1) распределение всех имеющихся контуров объединения современных структур на заданное пользователем число классов;

2) поиск для каждого созданного класса треугольника динамики интересующих параметров (параметра), то есть цветовой схемы класса.

Рассмотрим каждый из двух указанных пунктов более подробно. В основе деления контуров на классы лежит сравнение их цветовых схем между собой. Чем больше у двух контуров ячеек с различной динамикой (цветом), тем скорее они окажутся в разных классах. Вначале ищутся два контура с максимальными различиями цветовых схем. Эти различия находятся с помощью отыскания параметров N, Ns и Np. Найденные контуры кладутся в основу двух первых классов и называются классообразующими. Далее на основе различий цветовых схем идет распределение всех остальных контуров между двумя полученными классами. В каждом классе ищется контур, наиболее отличающийся по цветовой схеме от классообразующего. Пара с максимальным различием в динамике фиксируется, её контур, не являющийся классообразующим, будет первым (классообразующим) элементом нового класса. Далее все контуры всех классов сравниваются на различие динамик между классообразующим контуром своего и вновь созданного класса. Контур помещается в тот класс, с которым меньше различий в динамике. Подобная последовательность повторяется до тех пор, пока не будет достигнуто нужное количество классов.

Поиск динамики (цвета) для каждой ячейки треугольника класса происходит исходя из динамик соответствующих ячеек всех контуров, входящих в класс.

В случае, когда требуемое количество классов равно количеству имеющихся контуров объединения структур современных карт, набор цветовых схем классов полностью совпадает с набором цветовых схем контуров, потому что в каждом классе имеется 1 контур.

Рассмотрим использование автоматической классификации на примере проекта, содержащего 17 современных карт, начиная с кровли доюрских отложений и заканчивая надсеноманским комплексом в составе талицкой и нижнеберёзовской свит. Был произведён поиск положительных структур с площадью больше 108 м2. Далее были найдены взаимосвязи структур. В ходе поиска взаимосвязей было выделено 83 контура, объединяющих структуры на современных картах. Дальнейшее разбиение на классы проводится для полученных контуров.

Рассмотрим классификацию контуров в зависимости от поведения параметра амплитуды. Вначале применим для разбиения на классы режим «без учёта стабильности», количество классов равно 15. Среди полученных можно выделить следующие классы с наиболее заметными закономерностями:

1а) рост в апт-сеноманском и надсеноманском комплексах (рис. 4);

Рис. 4. Цветовая схема класса 1а и графики изменения амплитуды одного из контуров класса

Рис. 4. Цветовая схема класса 1а и графики изменения амплитуды одного из контуров класса

2а) рост в юрском и неокомском комплексах (рис. 5);

Рис. 5. Цветовая схема класса 2а и графики изменения амплитуды одного из контуров класса

Рис. 5. Цветовая схема класса 2а и графики изменения амплитуды одного из контуров класса

3а) рост в нижнеюрском комплексе и на время кузнецовской и талицкой свит, разделённых убыванием на время нижнеберёзовской свиты (рис. 6);

Рис. 6. Цветовая схема класса 3а и графики изменения амплитуды одного из контуров класса

Рис. 6. Цветовая схема класса 3а и графики изменения амплитуды одного из контуров класса

4а) устойчивый рост в нижнеюрском комплексе, сменяющийся убыванием на радомское время, а также рост в неокоме(рис. 7).

Рис. 7. Цветовая схема класса 4а и графики изменения амплитуды одного из контуров класса

Рис. 7. Цветовая схема класса 4а и графики изменения амплитуды одного из контуров класса

Ниже для каждого указанного класса приведена его цветовая схема и график поведения амплитуды одного из контуров, входящих в соответствующий класс.

Далее применим для разбиения на классы режим учета стабильности «единая», значение границ стабильности равно 25%, количество классов равно 15. Среди полученных можно выделить следующие классы с наиболее заметными закономерностями:

1б) стабильность в апт-сеноманском и надсеноманском комплексах (рис. 8);

Рис. 8. Цветовая схема класса 1б и графики изменения амплитуды одного из контуров класса

Рис. 8. Цветовая схема класса 1б и графики изменения амплитуды одного из контуров класса

2б) стабильность в апт-сеноманском и надсеноманском комплексах, сменяющаяся убыванием на современный момент времени (рис. 9);

Рис. 9. Цветовая схема класса 2б и графики изменения амплитуды одного из контуров класса

Рис. 9. Цветовая схема класса 2б и графики изменения амплитуды одного из контуров класса

3б) преимущественный рост и стабильность от нижнеюрского комплекса по современный момент времени (рис. 10).

Рис. 10. Цветовая схема класса 3б и графики изменения амплитуды одного из контуров класса

Рис. 10. Цветовая схема класса 3б и графики изменения амплитуды одного из контуров класса

Поставленную задачу разбиения множества контуров на конечное заданное количество классов можно отнести к задачам кластеризации, то есть разбиения заданной выборки объектов на однородные подмножества, называемые кластерами так, чтобы объекты внутри кластеров были в известном смысле похожи друг на друга, а объекты из разных кластеров – нет. Под «похожестью» понимается некоторая заданная степень близости объектов по заданному набору признаков или критериев [3].

В предложенном решении выделяется два принципиально важных этапа распределения контуров между классами. Первый этап (который, собственно, описывается рассматриваемым алгоритмом) – это поиск цветовых схем классов. На этом этапе все контуры разбиваются на непересекающиеся подмножества, то есть один контур может относиться только к одному классу. Далее на основе полученных подмножеств контуров находятся матрицы динамик классов.

Второй этап (который стоит за рамками рассматриваемого алгоритма и применяется к уже сформированным классам) – это распределение всех имеющихся в проекте контуров по классам на основе матриц динамик классов и контуров. На этом этапе один контур может быть отнесён к нескольким классам (наиболее простой случай – класс, полностью состоящий из состояния «нет данных», к нему будут относиться все контуры проекта, каждый из которых, в свою очередь, может относиться ещё к n-му количеству классов).

В ходе работы алгоритма каждому объекту (контуру) ставится в соответствие признаковое описание – матрица динамик заданного набора параметров. Далее на основе этих признаковых описаний находятся расстояния между объектами. В качестве таких расстояний принят набор трёх основных метрик: количество ячеек с разной динамикой (N), количество несовпадений стабильности (Ns), сумма разностей процентов динамики для ячеек с различным состоянием (Np). Приоритеты этих метрик задаются в алгоритме условиями, в основе которых, как правило, лежит количественное соотношение в контурах динамик «стабильность» и «нестабильность» (то есть все остальные состояния).

Разбиение объектов на классы по их сходству основано на гипотезе компактности. Согласно ей, схожие объекты гораздо чаще лежат в одном классе, чем в разных классах, или, другими словами, классы образуют компактно локализованные подмножества в пространстве объектов [4].

В данном случае к основным целям кластеризации можно отнести понимание данных путём выявления кластерной структуры, а также сжатие данных. В первом случае разбиение выборки на группы схожих объектов (то есть разбиение множества контуров объединения современных структур на классы) позволяет упростить процесс принятия решений и дальнейшую обработку данных, применяя к каждому кластеру свой метод анализа. При этом число кластеров (классов) стараются сделать поменьше. Во втором случае, если исходная выборка избыточно большая, сжатие данных может сократить её, оставив по несколько наиболее типичных представителей от каждого кластера. При этом важнее обеспечить высокую степень сходства объектов внутри каждого кластера, а количество кластеров может быть каким угодно.

Таким образом, рассмотренный алгоритм, оформленный в виде программной подсистемы, является одним из инструментов анализа данных, реализованных в комплексе Join. Результаты работы как комплекса в целом, так и описанной подсистемы, имеют практическое значение, поскольку позволяют получить и проанализировать информацию на различных этапах геоморфологического анализа, а также собрать разнообразную статистическую информацию.

ЛИТЕРАТУРА

1. Машкович К.А. Методы палеотектонических исследований в практике поисков нефти и газа. Изд. 2, перераб. и доп. — М.: Недра, 1976. 221 с.

2. Нейман В.Б. Теория и методика палеотектонического анализа. 3-е изд., перераб. и доп.-М.: Недра, 1984, 80 с.

3. Мандель И.Д. Кластерный анализ. – М.: Финансы и статистика. 1988.-176 с.

4. Аркадьев А.Г., Браверман Э.М. Обучение машины распознаванию образов. — М.: Наука, 1964.