Статические модели похожи на регрессионные; они выполняют расчет модельных значений, опираясь на исходные реальные выборочные данные. Меняется лишь процедура расчета модельных параметров (коэффициентов в уравнениях) – вместо метода наименьших квадратов используется итеративная процедура подгонки результатов счета под исходные значения. Вследствие этого расширяются возможности для аппроксимации любых зависимостей, возможности для описания наблюдаемых явлений с помощью уравнений самого разного вида и сложности, снимаются ограничения на пропуски в данных, а для случая криволинейных зависимостей результаты расчетов уточняются. Моделирование – это не только инструмент преобразования нагромождения фактов в емкую модельную формулу. Более интересна возможность анализировать сложное явление, представляя его как объединение более простых взаимодействующих компонентов. С помощью имитационной модели любая сложная кривая зависимости может быть представлена как сумма более простых кривых, параметры уравнений которых приобретают биологический смысл. Одна из часто встречающихся сложных кривых – параболическая зависимость. Многие явления в жизни природы подчинены цикличности, когда постепенное увеличение уровня изучаемого признака сменяется плавным его падением. При этом за восходящую ветку кривой, как правило, ответственны одни процессы, а за нисходящую – другие (смертность). Результирующая параболическая кривая оказывается следствием синтеза двух противоположных тенденций. Рассмотрим пример модельного исследования одного сложного процесса – изменения плодовитости рачка дафнии (Daphnia magna Straus) во все возрастающих концентрациях лигнина, основного компонента сточных вод целлюлозно-бумажных комбинатов (Калинкина, 1993). Опыт состоял в следующем. Дафний одного возраста (7 дней) помещали в растворы с разными концентрациями лигнина. Ежедневно в течение месяца собирали живую молодь. Графическое изображение результатов опыта представляет собой близкую к параболической зависимость плодовитости дафний (Е) от все возрастающих концентраций лигнина ([Lig]) (рис. 10.1).
Рис. 10.1. Зависимость плодовитости дафний (Е) от лигнина ([Lig])
Сначала решим простую задачу аппроксимации (приблизительного описания) исходных данных параболической кривой. Введем на лист Excel данные, названия переменных (включая модельную плодовитость), а также обозначения и предварительные значения параметров (a, b, c), коэффициентов уравнения. Следующая задача состоит в том, чтобы рассчитать теоретические значения плодовитости (Emod), соответствующие данным концентрациям лигнина по формуле параболы: E = a∙[Lig]² + b∙[Lig] + c.
Введем эту формулу в ячейку C3 для расчета первого модельного значения. На листе Excel она представляет собой набор ссылок, во-первых, на ячейки, содержащие значения аргументов (столбец A), во-вторых, на ячейки, содержащие значения параметров модели ($F$3, $F$4, $F$5). Ссылки на параметры должны быть абсолютными (содержать префиксы $), поскольку в расчетах разных значений модели используются одни и те же значения параметров.
Далее следует скопировать введенную формулу в остальные ячейки, например, с помощью операции "автозаполнение". Для этого нужно навести мышь на правый нижний угол выделенной ячейки с формулой, чтобы появился курсор в виде черного крестика,
и, нажав левую кнопку, "протянуть" выделение по нескольким ячейкам (C3:C7). Весь блок заполнится модельными формулами.
Правильность формул легко проверить, щелкнув мышкой на любой ячейке блока и нажав функциональную клавишу F2; так же выверяется правильность ссылок.
Рассчитанные значения плодовитости (от 1 до 40201) сильно отличаются от реальных; предварительно заданные параметры явно не подходят. Для "настройки" модели на действительность необходимо рассчитать обобщенное отличие между ними; этой цели служит сумма квадратов разности между всеми значениями. Вводим формулу определения различий: ф = (xmod – x)².
Автозаполнив ею ячейки блока D3:D7, рассчитаем суммарное отличие Ф, например, в ячейке F2 =СУММ(D3:D7).
Теперь можно провести настройку модели, изменяя ее параметры с помощью макроса оптимизации, который вызывается командой меню Сервис\ Поиск решения.
В появившемся окне нужно с помощью мыши: - Установить целевую ячейку (с суммой разности квадратов), - Равной значению 0, - Изменяя ячейки (со значениями параметров). После этого нажать кнопку Выполнить, и в появившемся окне Результаты поиска решения выбрать Сохранить результаты и рассмотреть их.
Итак, для описания эмпирической зависимости настройка предлагает следующие коэффициенты модели (рис. 10.2): Emod = –0.007∙[Lig]² + 1.1234∙[Lig] + 94.22. 7
Рис. 10.2. Модель зависимости плодовитости (Е) от лигнина ([Lig])
Корреляция между реальными и модельными значениями составила rE,Emod = 0.953. Полученная модель хорошо описывает правые точки (50-200 мг/л), но для небольших концентраций (5 мг/л) ее прогноз оказался заниженным (100 против 115 экз.). Такое же уравнение в среде Excel можно построить с помощью программы "Добавить линию тренда". Преимущество имитационных моделей перед описательными регрессионными состоит в том, что они с легкостью могут послужить средством анализа сложной зависимости, разложения ее на составные компоненты, т. е. для получения моделей более понятных и адекватных исходным данным. Продолжим исследование реакции дафний на лигнин с помощью имитационного моделирования с целью объяснить существо наблюдаемого процесса. Помимо регистрации живой молоди проводились и другие наблюдения. В частности, в высоких концентрациях на дне сосудов наблюдались скопления останков (карапаксов) погибшей молоди, не вошедшей в учет. Кроме того, к концу опытов даже невооруженным глазом было видно, что дафнии в контроле существенно мельче дафний из опытных сред. Эти наблюдения позволяют определить два возможных фактора, ответственных за изменение плодовитости. Во-первых, лигнин явно стимулировал рост животных и крупные особи стали давать больше молоди; для Cladocera это явление широко известно. Во-вторых, в высоких концентрациях лигнина возросла смертность новорожденных, что и снизило общую плодовитость; этот эффект также обычен для интоксицированных дафний. Параболическая кривая плодовитости, следовательно, образована обобщением двух простых монотонно возрастающих кривых: это рост потенциальной плодовитости с ростом размеров тела и рост смертности молоди в возрастающих концентрациях лигнина. Определение параметров этих уравнений и составляет очередную задачу моделирования. Решить ее можно даже в отсутствие данных по размерам тела, напрямую связав рост плодовитости рачков с увеличением концентрации лигнина (мг/л). Тогда модель должна быть представлена тремя уравнениями: – связь потенциальной плодовитости (экз./самку/30 дней) и размеров тела, зависящих от концентрации лигнина: Ep = a([Lig] b, – зависимость смертности от концентрации лигнина: Ed = c([Lig] d, – результирующая, наблюдаемая плодовитость: Emod = Ep – Ed, где a, b, c, d – модельные параметры. Здесь две модельные переменные, потенциальная плодовитость (Ep) и смертность (Ed), оказываются скрытыми (латентными), они используются для расчета одной явной переменной – результирующей плодовитости (Emod). При этом обе скрытые переменные определяются одной общей для них независимой переменной [Lig]. Имитационную систему на листе Excel следует дополнить этими уравнениями (табл. 10.1), которые в формате Excel примут такой вид (например, для ряда 4): C4 =$H$3*A4^$H$4, D4 =$H$5*A4^$H$6, E4 =C4-D4. Таблица 10.1
Для того чтобы модельные уравнения правильно отображали тенденции изменения соответствующих переменных, значения их параметров необходимо задать, хотя бы приблизительно, еще перед настройкой (метод биологического правдоподобия). Так, рост плодовитости может начаться только со значения 81 экз. (плодовитость в контроле); примем начальную величину первого параметра на уровне a = 80. Поскольку рост плодовитости идет не очень интенсивно, примем степенной параметр равным b = 0.1 (с этими параметрами первые значения потенциальной и реальной плодовитости почти совпадут). Смертность, в отличие от плодовитости, напротив, возрастает очень резко (примем d = 2), начавшись с низкого уровня (например, c = 0.01). Подставив эти примерные величины параметров в имитационную систему, получим приблизительное описание изменения плодовитости дафний в разных концентрациях раствора. Далее, используя макрос оптимизации ("Поиск решения"), удается получить хорошее решение, тесное совпадение модельных и реальных данных (табл. 10.2, рис. 10.3).
Таблица 10.2
Рис. 10.3. Рост потенциальной плодовитости и смертности молоди в возрастающих концентрациях лигнина.
Корреляция между реальными и модельными значениями составила rE,Emod = 0.996, стала немного выше, чем для первой модели. Новая модель в целом лучше описывает процесс, в частности, Emod ближе к E для низких концентраций. Объясняется это тем, что "ответственность" за восхождение и падение кривой общей плодовитости разделили между собой два уравнения, которые с помощью разных наборов параметров описывают частные механизмы изучаемого явления.
Ви переглядаєте статтю (реферат): «Задача аппроксимации данных (статические модели)» з дисципліни «Введення в кількісну біологію»