Последнее время на многочисленных ток-шоу на ТВ идут бурные обсуждения эпидемии коронавируса и строятся различные прогнозы о темпах её развития и последствиях. Однако, несмотря на то, что на ток-шоу приглашаются ведущие специалисты из различных областей, обсуждения ведутся, преимущественно, на эмоциональном уровне. Глядя на графики роста числа инфицированных, эти специалисты и телеведущие фантазируют о ходе «экспонент», так они часто называют любые кривые, и о времени приближения к заветному «плато». У меня возникает естественный вопрос, а где же наши учёные, знающие математику, и работающие в этой области? Где их теории, расчёты и научные прогнозы? Надеюсь, что всё это есть у нашего высшего начальства, принимающего ответственные решения, но, по каким-то причинам, это не доступно широкой публике.
В данной статье предлагается инженерный метод расчёта процесса развития эпидемии. Метод основан на аппроксимации подходящими формулами уже полученных экспериментальных данных. С помощью этих формул и выполняется прогноз дальнейшего развития эпидемии.
Начнём с очевидного уравнения:
Nинф = Nб + Nв + Nу ,
где
Nинф - общее число инфицированных на данный момент людей;
Nб – число болеющих на данный момент людей (дома и в больницах);
Nв – число выздоровевших людей;
Nу – число умерших.
Вначале поясним суть метода на простом примере. Пусть, например, из теоретических соображений, известно, что некий процесс развивается по параболической зависимости от времени и к данному моменту имеем несколько экспериментальных точек на начальном этапе процесса. И пусть нас интересует время, когда будет достигнут максимум (минимум) и чему будет равна функция в этой точке. Эта задача простая. В качестве аппроксимирующей функции выбираем квадратичную параболу с тремя неизвестными коэффициентами, которые легко находим, например, методом наименьших квадратов. Задача решена.
От чего, в общем случае, зависит точность такого решения. От двух вещей. От правильности выбора вида аппроксимирующей функции и от качества уже имеющихся экспериментальных данных. Эти данные должны быть достоверны и представительны.
Вернёмся к нашей задаче. Вначале, на качественном уровне, определим, какую форму имеют эти четыре функции. Все эти функции зависят от времени t.
Функция Nб – это кривая с максимумом. Действительно, число больных до начала эпидемии равно нулю, затем увеличивается и достигает максимума, затем уменьшается и к концу эпидемии равно нулю. Такую форму функций часто называют колоколообразной.
Три другие функции - Nинф, Nв и Nу имеют похожую между собой форму: до начала эпидемии функции равны нулю, затем медленный рост, ускорение роста до максимума, затем снижение скорости роста и выход на насыщение к концу эпидемии. Вид этих трёх функций принципиально отличается от первой функции.
Так как процесс заболевания во время эпидемии носит вероятностный характер, то в качестве аппроксимирующих функций выберем две хорошо известные в теории вероятности функции - функцию нормального распределения Гаусса и функцию интегрального нормального распределения. Таким образом имеем:
Nб = A* exp(-(t-m)2/2σ2) ,
Nинф = B* ( 1 + erf x) ,
x = (t – m)/20,5 σ ,
где
t – время (число дней, начиная с 1-го марта и, например, 1-е апреля t=32),
m – среднее значение, σ - дисперсия, erf x – функция ошибок,
А и В – коэффициенты.
Исходя из уже имеющихся фактических (экспериментальных) данных, все эти коэффициенты были определены различными методами, включая метод наименьших квадратов. Так для Nинф эти коэффициенты равны: В = 64036;
σ = 12, 07; m = 54, 82. Процедура вычисления следующая. Для конкретного t, вначале вычисляется x, затем вычисляется функция ошибок erf x (используя таблицы или онлайн калькулятор), после чего по формуле вычисляется Nинф.
Расчёты проведены для Nинф и ΔNинф в диапазоне изменения времени от 1 до 80
(1 ≤ t ≤ 31 это март; 32 ≤ t ≤61 это апрель; 62 ≤ t ≤92 это май) и представлены на двух графиках.
На первом графике видно, что, до конца мая число инфицированных будет постепенно увеличиваться и, при благоприятном развитии ситуации, к концу мая, число инфицированных в Москве составит порядка 70 000 человек.
На втором графике представлен ежесуточный прирост числа инфицированных ΔNинф . Эта зависимость имеет максимум при t= 55 ( 24-е апреля). В районе максимума ( с 20-го по 28-е апреля) ежедневные приросты числа инфицированных изменяются не сильно и, с учётом статистического разброса, эту область, с некоторой натяжкой, можно назвать ”плато“. Затем прирост будет плавно уменьшаться и к 20-му мая он составит примерно 250 человек в сутки.
В завершение отметим, что данные расчёты носят приближённый, характер. И если на массиве данных , на котором подбирались коэффициенты аппроксимирующей функции, отклонения фактических данных от расчётных небольшие и не превышают ±4%, то в дальнейшем ошибка может нарастать. Это может быть связано как с выбором вида функции, так и с некоторым изменением метода выявления числа инфицированных. Сейчас доля бессимптомных больных значительная и увеличивается число тестов. Это и может привести к некоторому дополнительному росту статистики инфицированных.
|
|