Анализ ошибок аппроксимации при геокартировании с использованием сплайн-аппроксимационного метода
А.Г. Плавник, А.Н. Сидоров (ГП «НАЦ РН им. В.И. Шпильмана»)
Вопросы надежности построенных карт изучаемых показателей геологических объектов имеют большое значение. Однако на практике, как правило, их решение ограничивается отслеживанием непротиворечивости исходных данных, а также соответствия построенных карт модельным представлениям, осуществляемым на основе экспертной оценки.
Это обусловлено, с одной стороны, тем, что современные методы геокартирования обеспечивают эффективное построение в отношении согласованности результатов с исходными данными. Высокая вычислительная производительность современных компьютеров предоставляет возможность массовых построений, что позволяет наработать опыт в выборе приемлемых методов и параметров построений для различных условий.
С другой стороны, как представляется, сами методы анализа оценок погрешностей картопостроения и их практического применения разработаны в недостаточной степени. В первую очередь это связано с отсутствием априорных сведений о закономерностях пространственной изменчивости свойств геологических объектов. В этом состоит отличие, например, от возможности использования информации об ограниченности производных в стандартных математических подходах, применяемых для оценки погрешностей приближенных методов.
В этих условиях задача оценки отклонения полученных результатов геокартирования от истинных значений анализируемого показателя (в целом по области картирования, а не только в точках наблюдения) принципиально не решаема. И поскольку именно эта задача в основном имеет практический интерес, то проблематичность ее решения существенно понижает востребованность всех вопросов, связанных с оценкой погрешностей картопостроения.
Тем не менее анализ возможных погрешностей, связанных как с самими методами картирования, так и исходными данными, является полезным инструментом, предоставляющим возможности по количественному сопоставлению исходных данных, выполненных построений и используемых при картировании алгоритмов, не относящихся непосредственно к определению отклонения результатов картопостроения от точного значения. В этом отношении такой анализ имеет несомненную практическую значимость, поскольку сопровождает результаты картопостроения дополнительной информацией, получаемой формализуемыми методами, которая может использоваться в качестве одного из элементов при экспертной оценке достоверности построенных карт.
Самым простым для определения и последующей интерпретации является вычисление отклонения расчетных значений картируемого параметра от исходных данных. Необходимость определения ошибок аппроксимации обусловлена, во-первых, тем, что позволяет судить о недостаточной надежности полученных результатов моделирования, если отклонения расчетных значений в точках наблюдений существенно отличаются от задаваемых в качестве исходных данных величин. Во-вторых, высокие значения ошибки аппроксимации могут свидетельствовать о недостоверности определения самих исходных данных, что позволяет использовать этот показатель для их отбраковки и улучшать качество результирующей карты.
В данной работе рассматриваются вопросы влияния на ошибки аппроксимации основных показателей, контролирующих результат картирования, – шаг сетки, по которой строится решение, а также значения весовых коэффициентов в минимизируемом функционале для локальных уравнений (замеров значений в точках) и глобальных уравнений (модельных представлений о свойствах). В рамках обобщенного сплайн-аппроксимационного подхода, реализованного в программном комплексе GST [3], с применением локальных уравнений общего вида [2] в
для ошибки аппроксимации в точке (xm, ym) очевидно использование следующей формулы
Расчет ошибок аппроксимации не представляет затруднений при использовании локальных уравнений любой сложности. В случае применения в картопостроении нескольких локальных уравнений также легко осуществимы оценки по каждой точке для соответствующего уравнения.
Простейшим примером локального уравнения (и наиболее часто используемым в практике построения карт геологических параметров) являются условия, задаваемые прямыми замерами в точках:
и, соответственно, в этом случае ошибка аппроксимации определяется как разница расчетных F(xm, ym) и фактических значений картируемого параметра zm:
Конечно, в зависимости от конкретных задач картопостроения величины ошибок аппроксимации могут существенно варьировать. Однако, как представляется, направленность изменения ошибок аппроксимации при изменении основных управляющих параметров методов картирования имеет в целом общий характер.
Поэтому здесь в качестве примера используется простая схема построения карты с минимизацией функционала
представляющего собой сумму квадратов ошибок аппроксимации с весовым коэффициентом ρ и c использованием условия минимума кривизны поверхности в качестве стабилизатора.
В качестве объекта картирования рассматривается глубина залегания кровли покурской свиты (кровли апт-альб-сеноманского сеноманского комплекса) в пределах восточной части Ханты-Мансийского автономного округа на основе данных стратиграфических разбивок по 300 разведочным скважинам [1]. Скважины неравномерно располагаются на территории, которая при картировании представляет собой практически квадратную область с каждой из сторон более 500 км. Расстояние от скважин варьирует от 1.2 до 73.4 км и в среднем составляет 9.55 км. Значения глубины залегания кровли покурской свиты по массиву фактических данных изменяются от 514.1 м до 1200.3 м.
Стандартное отклонение равно 93.31 м, что, очевидно, является верхним пределом для оценки ошибки аппроксимации (соответствующей использованию в качестве модели среднего значения глубины кровли покурской свиты по данным о разбивках в скважинах). Вместе с тем это значение (93.31 м) в определенной степени является и масштабирующим показателем, позволяющим соотнести «уровень погрешности» карт, построенных с использованием более детальных методов картирования.
Для рассматриваемой задачи, определяемой условием минимизации функционала (2), результат расчетов устанавливался двумя показателями – шагом сетки, в узлах которой определяется сплайн, используемый для аппроксимации, а также весовым коэффициентом ρ. Далее рассматривается влияние этих двух показателей на результаты картопостроения, точнее, на значения ошибок аппроксимации, а также на соответствие вида получаемых карт общим представлениям о залегании кровли сеноманского комплекса Западно-Сибирского бассейна.
Рис.1. Зависимость результатов картирования от шага сетки (а – 32 км, б – 8 км, в – 2 км)
Представленные на рис. 1 результаты картирования для различных шагов сетки (от 6до 2 км при величине весового коэффициента ρ равным 100) являются достаточно очевидными и вполне ожидаемыми. Для карты, построенной с шагом 64 км (рис. 1а), характерно сглаженное представление структурных форм. Вместе с тем даже при этом шаге общие черты структурного плана кровли покурской свиты прослеживаются весьма надежно. С уменьшением величины шага сетки увеличивается детализация картирования. При этом вид карт становится идентичнее. В частности, карты, построенные при шаге в 8, 4 и 2 км (рис. 1б, в), отличаются незначительными подробностями. По-видимому, это связано с характерным расстоянием между скважинами (как отмечалось ранее, среднее расстояние между ближайшими скважинами составляет 9.55 км).
При шаге сетки в 64 км среднеквадратическая ошибка составляет 25.18 м, что составляет около одной четверти от стандартного отклонения для исходных данных. С уменьшени-ем шага сетки среднеквадратическая ошибка аппроксимации уменьшается и стремится к нулю (рис.2), что является вполне ожидаемым, поскольку при этом повышается возможность более детального описания изменения картируемого показателя относительно «жестким» (в интервале между узлами сетки) кубическим сплайном.
Рис. 2. Зависимость среднеквадратической ошибки аппроксимации от шага сетки
На основании полученных свидетельств об уменьшении ошибок аппроксимации с уменьшением шага сетки можно предположить, что одновременно с этим происходит перераспределение основных ошибок в участки с наиболее высокой плотностью расположения исходных данных и резкое уменьшение ошибок в точках с расстоянием до ближайших точек, кратно превышающее величину шага сетки. Такое предположение выглядит вполне правдоподобным. Однако оно неверно.
На рис.3 представлены графики, на которые вынесены значения ошибок аппроксимации в точках в зависимости от расстояния до ближайших к ним точек с фактическими данными, участвующими в построении карт. Как видно на приведенных рисунках, распределение точек на графиках имеет схожий вид. При этом с уменьшением шага сетки вид графиков становится все более идентичным. В немногочисленных точках, удаленных от ближайших на 35 и более километров, погрешность аппроксимации всегда сравнительно небольшая. На меньших расстояниях разброс в значениях ошибок сохраняется относительно высоким, независимо от шага сетки. В частности, явно прослеживаются точки в интервале от 20 до 35 км, выделяющиеся повышенными значениями ошибок аппроксимации.
Рис. 3. Зависимость абсолютной величины ошибки аппроксимации от расстояния до ближайшей точки (шаг сетки: а – 32 км, б – 8 км, в – 2 км)
Рис. 4. Сопоставление ошибок аппроксимации при разных шагах сетки (а – 16 и 8 км, б– 8 и 4 км, в – 4 и 2 км; r – коэффициент корреляции)
На представленных рисунках не ясно, являются ли точки с относительно повышенными погрешностями общими для картирования с различными шагами сетки или нет. Чтобы это выяснить, выполнено построение сопоставительных графиков ошибок аппроксимации в точках для «смежных» пар шагов сетки (рис.4). Из полученных результатов следует, что действительно существует «унаследованность» в повышенных значениях ошибок аппроксимации в точках независимо от величины шага сетки. При этом с уменьшением шага такая унаследованность принимает практически функциональный характер (коэффициент корреляции для погрешностей при расчетах с шагом 4 и 2 км составляет 0.99).
По-видимому, наличие отмеченной независимости распределения погрешностей аппроксимации от шага сети обусловлено особенностями модели, используемой при картировании, а точнее, ее недостаточной надежности в тех зонах, где расположены точки с повышенными ошибками. На рис. 5 краснозелеными цветами выделены такие точки с повышенным (более 0.1 м) значением ошибки, полученных при построении с шагом сетки 2 км и находящихся на расстоянии от 20 до 35 км до ближайших точек. Видно, что эти точки действительно расположены в зонах, близких к участкам с высоко амплитудной изменчивостью глубины залегания кровли покурской свиты, то есть в зонах, плохо согласованных с моделью, определяемой стабилизатором в виде условия минимизации кривизны поверхности, преимущественно монотонного характера изменения картируемого параметра.
Рис.5. Точки с ошибкой аппроксимации больше 0.1 м и расстоянием до ближайшей точки от 20 до 35 км (при построении с шагом сетки 2 км)
Отметим, что погрешности в рассмотренных точках в целом существенно ниже, чем в точках с высокой плотностью фактических данных. Поэтому, если ограничивать анализ только средними показателями величины ошибок аппроксимации, то можно пропустить важную информацию о приемлемости модели, используемой при картировании, и отдельных зонах, в которых фактические данные не согласуются с этой моделью в наибольшей степени. В свою очередь, учет этой информации может использоваться для корректировки модельных условий, а также при сопоставительном анализе различных моделей.
Важнейшими параметрами, контролирующими результаты картопостроения с использованием сплайн-аппроксимационного подхода, наряду с шагом сетки являются величины весовых коэффициентов, с которыми локальные и глобальные уравнения учитываются в минимизируемом функционале. В рассматриваемом здесь простейшем примере решения задач картирования на основе минимизации функционала (2) такой параметр один – весовой коэффициент при сумме квадратов невязок расчетных и фактических данных по глубине залегания покурской свиты (ρ). Отметим, что эквивалентная задача может быть сформулирована в виде минимизации функционала
где величина 1/ρ является показателем, для которого в литературе широко используется термин «параметр сглаживания». И эта терминология оправдана, поскольку при малых значениях ρ (при больших значениях параметра сглаживания) результаты картирования характеризуются тем, что ошибки аппроксимации весьма велики (и близки для различных значений шага сетки, рис.6), а сами карты фактически представляют собой трендовые зависимости (рис.7а и 8а). С увеличением весового коэффициента ρ ошибка аппроксимации вполне ожидаемо уменьшается (рис.6), а детализация построений увеличивается.
Приведенные на рис.6 данные представлены в полулогарифмическом виде, поскольку темпы изменения ошибки аппроксимации с ростом величины весового коэффициента очень незначительны. Такой характер влияния величины весового коэффициента на результаты картирования имеет большое значение, заключающееся в возможности высокой степени произвольности в определении этого показателя при решении многих практических задач, в которых основным критерием приемлемости является обеспечение нужной точности приближения.
Вместе с тем, как видно на рисунках, результаты расчетов с увеличивающимся весом на значения в точках для различных шагов сетки в 8 и 32 км (рис. 7 и 8, соответственно) имеют принципиально различающийся характер. Для шага сетки 8 км с увеличением весового коэффициента вид результирующих карт в основном стабилизируется, происходит лишь детализация локальных особенностей. В отличие от этого при картировании с шагом сетки 32 км этап детализации не стабилизируется, а сменяется неустойчивым характером картирования в зонах с низкой плотностью (или отсутствием) фактических данных.
Рис. 6. Зависимость среднеквадратической ошибки аппроксимации от весового коэффициента ρ
Рассмотренные примеры влияния основных управляющих параметров на ошибки аппроксимации при решении простейшей задачи картопостроения, конечно, не являются исчерпывающими. В каждой конкретной задаче геокартирования (отличающейся количеством и расположением исходных данных, использованием косвенной информации и дополнительных модельных представлений, а также другими условиями) анализ ошибок аппроксимации неизбежно имеет свои особенности. При этом, как следует из материалов, представленных выше, характер воздействия различных условий на распределение ошибок аппроксимации и надежность построения карт не всегда являются очевидными.
Рис.7. Зависимость результатов картирования при шаге сетки 8 км от весового коэффициента ρ (а – 0.01, б – 100, в – 1000000)
Рис.8. Зависимость результатов картирования при шаге сетки 32 км от весового коэффициента ρ (а – 0.01, б – 100, в – 1000000)
В значительной степени погрешности аппроксимации характеризуют соотношения (во многом неявные) используемых при картопостроении модельных условий и закономерностей в изменении наблюденных значений картируемого параметра, что может служить дополнительным инструментом для обоснования подходящей модели, обеспечивающей надежность результатов картирования. Этим обстоятельством, наряду с важностью непосредственной задачи оценки погрешности использования приближенных по своей природе аппроксимационных методов, определяется практическая значимость выполнения детального анализа ошибок аппроксимации.
ЛИТЕРАТУРА
1. Каталог литолого-стратиграфических разбивок разрезов поисково-разведочных скважин. Т 1. Ханты-Мансийский автономный округ. Под ред. Гришкевича В.Ф., Теплякова Е.А. – Ханты-Мансийск.– 2000. – 432с.
2. Плавник А.Г. Алгоритмизация геоинформационных технологий в задачах, связанных с картопостроением. Автореферат диссертации на соискание ученой степени кандидата геолого-минералогических наук. – Тюмень. – 2004.– 24 с.
3. Сидоров А.Н., Плавник А.Г., Сидоров А.А. и др. Свидетельство о регистрации программы GST в Реестре программ для ЭВМ Федеральной службы по интеллектуальной собственности, патентам и товарным знакам № 2005612939 от 14 ноября 2005 г.