Article_top

Специално за Клуб Z проф. Николай Янев представи 5-дневна прогноза за развитието на епидемията у нас. Той е ръководител на авторски колектив от математици от БАН, СУ и НБУ, които създадоха математичен модел за анализ на епидемията от COVID-19, основаващ се на разклоняващи се стохастични процеси.

Моделът вече се ползва в цял свят от учените, които могат да прогнозират епидемията във всяка страна, където има статистика за броя на заразените, новозаразените, клинично проявените случаи и пр. Моделът и съответният софтуер са създадени за около месец по повод скоростното развитие на епидемията в Италия.

И още от проф. Янев:

Нашият модел ползва данни от официалната статистика на СЗО, които всеки ден се акумулират в него за всяка една страна. От математическа гледна точка той е сравнително прост, но има голямо

Проф. дмн. Николай Янев.

преимущество пред други, по-сложни модели, защото дава информация за най-важния епидемиологичен параметър m, а именно колко души средно може да зарази един индивид от първи тип. Така наричаме един „ненаблюдаем“ или неизвестен заразоносител, човек, който разнася заразата, без да подозира това. За тази цел се използват само официални данни за втория тип индивид, това е човек, вече идентифициран като заразоносител (позитивен). Така прогнозираме средния брой на „неосветените“ индивиди M, които играят основна роля в разпространението на вируса.

Например, за България се оказва, че един заразен, но „неосветен“ индивид, може да зарази средно на ден m=1.1093 души, а в Италия – m=1.1348. Разликата в двете числа на пръв поглед изглежда  несъществена, но на практика става въпрос за това, че в Италия един човек може да зарази много повече хора, като се има предвид, че броят на заразените нараства експоненциално. С този параметър m може да обясни защо епидемията в Италия се разви с такава смайваща скорост.

Тук трябва да отбележа, че тя започна преди доста време и там има данни за много по-дълъг период, тоест m би трябвало да е по-точно.  По принцип графиките, които правим, имат три оценки и според тях - има три вида сценария. Тези оценки определят каква ще бъде динамиката на епидемията – ще затихва, ще се развива или ще е константна. В Германия обявиха, че тъй като m e по-малък от 1, те решили да разхлабят мерките. И аз си помислих, че вероятно са ползвали нашия модел и един от нашите сценарии. Той е отворен за целия свят и всеки, който разбира от статистика, може да влезе и да го ползва. 

Статията „Стохастично моделиране на COVID-19“ излиза в априлския брой на Доклади на БАН. Тя ще може да бъде прочетена и съответно изтеглена от сайта на списанието.

Освен това те е депонирана в известната световна препринтна база Arxiv.org.

Повече информация можете да намерите и на сайта на екипа тук.

Тук пък можете да откриете най-важните получени в статията резултати във вид на графики за всички страни по света, съгласно данните на Европейския център за контрол на заразите (които са същите, като тези на СЗО).

Авторите обръщат внимание на това, че резултатите се обновяват всеки ден съобразно новите данни.

Има страни в  света, чиито показател m е по-нисък от този в България и в Италия, тоест, там един човек заразява по-малко хора, но трябва да се вземе предвид фактът, че една част от тях нямат или не съобщават верни данни за епидемията.

Искате да кажете, че колкото повече данни има, толкова по-вярна ще е прогнозата?

Да. Ние не работим с хипотези, а използваме преди всичко дадените статистики. Въпросът е доколко те са репрезентативни. Защото в някои страни има много повече наблюдения и статистиките са много адекватни, в други страни – те са по-малко и извадката не е толкова репрезентативна.

Ако данните не са репрезентативни, то и пресмятанията не са адекватни. В някои страни броят на индивидите от втори тип (т.е. официално регистрираните заразени) не е голям, тъй като бързи тестове не се правят или пък се правят много малко. Затова можем да кажем, че колкото повече данни има за разпространението на вируса сред популацията, толкова по-точна ще бъде прогнозата.

Като това трябва да е съотносително с популацията, която се изследва. Например за САЩ тази извадка трябва да бъде много голяма, защото те са 333 млн. души, а за България, която е 7 млн., извадката трябва да бъде около 47 пъти по-малко. Колко точно - не може да се каже без специално допълнително проучване. Да се вземат тестове от случайно избрани хора, от различни групи в обществото, от рискови групи. Тоест, да се направи малък обхват на цялата популация, дори не знам дали някъде въобще правят такова нещо в пълен обем. Но по принцип е добре да се почне от рисковите групи и колкото повече хора се обхванат, толкова по-добре. 

Вие осветявате сегмента на неизвестните заразоносители и това е първото знание, което дава вашият модел на всяка страна. Оттам нататък учените могат да използват тези оценки в своите прогнози за динамиката на епидемията – за колко дни напред? 

Ние можем да оценим колко новозаразени ще има след няколко дни, но не за по-дълъг период, защото фактически нещата се менят от ден на ден и нашият периметър е динамичен.

Каква е прогнозата за България за следващите 5 дни?

На графика 1 се вижда как намалява числото m за последните 20 дни – 29 март-17 април, вследствие на наложената карантина стига почти до 1. Но през последните 3 дни започва отново да се катери нагоре към 1.06.

: Изменение на оценката за репродукция на процеса за 20 дни (29 март - 17 април).

Въз основа на числото m може да се пресметне колко души M, за които никой няма идея, ще се заразят. Вижда се, че техният брой се увеличава плавно и от 116 души на 18 април, ще стигне 151 души на 23 април.

С други думи, ако Щабът каже, че са установени 20 новозаразени, той говори за откритите новозаразени, а с нашия модел ние прогнозираме колко са новозаразените, които са в сянка. Те са няколко пъти повече. Това е едно от достойнствата на модела.

Може ли да се изчисли съотношението между всички заразени и клинично доказаните болни?

То също се мени всеки ден, но към момента α = 0.3279, което означава, че една трета от заразените се регистрират с някакви оплаквания или са открити с тестове.

Трябва да се обърне внимание, че всички тези оценки са дадени с 95% доверителни интервали. Това означава, че в 95% от случаите ще познаем, че съответните стойности са именно в този интервал, но в 5% от случаите можем и да не познаем.

Това е така, защото изследваните явления имат стохастичен, т.е. случаен характер. И това е една от особеностите на този феномен. Всъщност с вероятност 0.95 е възможно да се наблюдава всяко едно от числата в този интервал. А посочените оценки са просто средите на тези интервали, но това не ги прави в никакъв случай по-вероятни от другите стойности в интервала. В нашия модел конструирането на тези доверителни интервали е сложна математичска задача. А въобще математическата статистика борави винаги с доверителни интервали и ако в някои статистически изследвания те липсват, то това поставя под съмнение всички изводи след това.

Какво е мнението ви за влиянието на имигрантската вълна, имам предвид българите, които се завърнаха по спешност от чужбина? Каква е нейната роля в епидемията у нас?

Не знаем официалните данни, но някои медии съобщиха, че са се върнали около 200 000 имигранти. Някои от тях се концентрират в условно да ги наречем, имиграционни депа. По отношение на нашия модел наличието на такава допълнителна имиграция коренно променя развитието на епидемията в нашата популация. И вече имаме два различни модела.

Освен това, в тези депа влизат постоянно нови имигранти, а много излизат от тях, тоест има последваща имиграционна вълна, и този процес може да не затихва, а да се развива вълнообразно.

Ето защо ние разширихме нашия първоначален модел и сега подготвяме втора публикация, където се отчита същественото влияние на имиграцията. При това се очертават четири възможни сценария, зависещи основно от параметъра на средно заразяване, който означихме по-горе с m.

Така, ако m>1, то имаме експоненциален ръст на популацията от заразени (независимо дали моделът е без или с имиграция). Ако m=1 (или варира близо до 1), то при модела без имиграция средният брой заразени е постоянен, докато при модела с имиграция средният брой заразени расте линейно. При m<1 процесът без имиграция затихва, т.е. инфекцията намалява и клони към нула, но при наличие на имиграционна компонента средният брой заразени  не намалява, а остава константен. В този последен случай може да се каже, че инфекцията, грубо казано, продължава да тлее.

Във връзка с това смятам, че у нас се вземат адекватни мерки, въпреки че някои ги оценяват като прекалено строги. Напротив, както се вижда от въпросните сценарии, тези мерки може би трябва да бъдат още по-рестриктивни.

Колко души ползват вашия модел?

Нямаме такава информация, но всеки ден получаваме мнения от колеги, които задават въпроси, интересуват се,  въобще тези неща се дискутират в един по-тесен професионален кръг, а също в професионалния сайт research gate. За сега сме получили само положителни оценки, и то от световно известни учени.

Оперативният щаб ползва вашия модел?

Нямам директни контакти с Щаба, но сигурно са осведомени. Както се вижда, статията в „Доклади на БАН” е представена от Директора на Института по Математика и Информатика акад. В. Дренски, а ръководството на БАН също е запознато със статията.

Какво мислите за дългосрочните прогнози?

Аз не вярвам в тях. Трудно могат да се направят, защото нямаме аналози на тази епидемия, много неща не се знаят, епидемиолозите непрекъснато се тюхкат, а те трябва да дадат тази информация на нас, математиците.

Нашият модел използва само това, което се наблюдава и колеги от други страни оцениха точно това, че с един сравнително по-прост модел може да се получи най-важната информация. Той, така да се каже, дава един бърз, но ефикасен тест за оценяване скоростта на заразяване.

Разбира се, има нужда от по-сложни епидемиологични модели. Но те изискват време и сериозна колаборация между епидемиолози, математици, медици, информатици, микробиолози, молекулярни биолози и други специалисти заедно с използване на натрупаната сериозна научна информация по този проблем.  

А кога да чакаме пикът на епидемията?

Само Господ знае!

Проф. Дмн Николай М. Янев е автор на 150 научни статии и 7 книги, защитени 8 аспиранта. Канен да преподава на студенти и аспиранти, а също за научно-изследователска дейност в престижни университети на САЩ, Канада, Франция и Испания. В момента консултант по научни проекти в САЩ. Бил е Директор на ИМИ (Институт по Математика и Информатика) към БАН и научен ръководител на секция «Вероятности и Статистика» в същия институт. Сега Професор Емеритус. Дългогодишен преподавател във ФМИ на СУ.

Проф. Янев е бил аспирант в МГУ (Московски държавен университет) в групата на акад. Андрей Н. Колмогоров, безспорен математик №1 на двадесети век, известен като „баща на съвременната Стохастика“ (Теория на вероятностите и Математическа статистика), и в частност създател на съвременната Теория на разклоняващите се стохастични процеси. Той развива българска школа в тази област, която се ползва с международен авторитет в резултат на многобройни публикации в реномирани международни научни списания. Едно признание за това е фактът, че в България през 1993 г. е организиран първия световен конгрес по разклоняващи се стохастични процеси, а след това се организират регулярни конференции и семинари. Създаденият модел е в резултат на съвместната му работа с двама негови бивши аспиранти, сега известни наши учени доцент д-р Весела Стоименова от Факултета по математика и информатика на СУ и доцент д-р Димитър Атанасов от НБУ.

 

Специално за Клуб Z проф. Николай Янев представи 5-дневна прогноза за развитието на епидемията у нас. Той е ръководител на авторски колектив от математици от БАН, СУ и НБУ, които създадоха математичен модел за анализ на епидемията от COVID-19, основаващ се на разклоняващи се стохастични процеси.

Моделът вече се ползва в цял свят от учените, които могат да прогнозират епидемията във всяка страна, където има статистика за броя на заразените, новозаразените, клинично проявените случаи и пр. Моделът и съответният софтуер са създадени за около месец по повод скоростното развитие на епидемията в Италия.

И още от проф. Янев:

Нашият модел ползва данни от официалната статистика на СЗО, които всеки ден се акумулират в него за всяка една страна. От математическа гледна точка той е сравнително прост, но има голямо

Проф. дмн. Николай Янев.

преимущество пред други, по-сложни модели, защото дава информация за най-важния епидемиологичен параметър m, а именно колко души средно може да зарази един индивид от първи тип. Така наричаме един „ненаблюдаем“ или неизвестен заразоносител, човек, който разнася заразата, без да подозира това. За тази цел се използват само официални данни за втория тип индивид, това е човек, вече идентифициран като заразоносител (позитивен). Така прогнозираме средния брой на „неосветените“ индивиди M, които играят основна роля в разпространението на вируса.

Например, за България се оказва, че един заразен, но „неосветен“ индивид, може да зарази средно на ден m=1.1093 души, а в Италия – m=1.1348. Разликата в двете числа на пръв поглед изглежда  несъществена, но на практика става въпрос за това, че в Италия един човек може да зарази много повече хора, като се има предвид, че броят на заразените нараства експоненциално. С този параметър m може да обясни защо епидемията в Италия се разви с такава смайваща скорост.

Тук трябва да отбележа, че тя започна преди доста време и там има данни за много по-дълъг период, тоест m би трябвало да е по-точно.  По принцип графиките, които правим, имат три оценки и според тях - има три вида сценария. Тези оценки определят каква ще бъде динамиката на епидемията – ще затихва, ще се развива или ще е константна. В Германия обявиха, че тъй като m e по-малък от 1, те решили да разхлабят мерките. И аз си помислих, че вероятно са ползвали нашия модел и един от нашите сценарии. Той е отворен за целия свят и всеки, който разбира от статистика, може да влезе и да го ползва. 

Статията „Стохастично моделиране на COVID-19“ излиза в априлския брой на Доклади на БАН. Тя ще може да бъде прочетена и съответно изтеглена от сайта на списанието.

Освен това те е депонирана в известната световна препринтна база Arxiv.org.

Повече информация можете да намерите и на сайта на екипа тук.

Тук пък можете да откриете най-важните получени в статията резултати във вид на графики за всички страни по света, съгласно данните на Европейския център за контрол на заразите (които са същите, като тези на СЗО).

Авторите обръщат внимание на това, че резултатите се обновяват всеки ден съобразно новите данни.

Има страни в  света, чиито показател m е по-нисък от този в България и в Италия, тоест, там един човек заразява по-малко хора, но трябва да се вземе предвид фактът, че една част от тях нямат или не съобщават верни данни за епидемията.

Искате да кажете, че колкото повече данни има, толкова по-вярна ще е прогнозата?

Да. Ние не работим с хипотези, а използваме преди всичко дадените статистики. Въпросът е доколко те са репрезентативни. Защото в някои страни има много повече наблюдения и статистиките са много адекватни, в други страни – те са по-малко и извадката не е толкова репрезентативна.

Ако данните не са репрезентативни, то и пресмятанията не са адекватни. В някои страни броят на индивидите от втори тип (т.е. официално регистрираните заразени) не е голям, тъй като бързи тестове не се правят или пък се правят много малко. Затова можем да кажем, че колкото повече данни има за разпространението на вируса сред популацията, толкова по-точна ще бъде прогнозата.

Като това трябва да е съотносително с популацията, която се изследва. Например за САЩ тази извадка трябва да бъде много голяма, защото те са 333 млн. души, а за България, която е 7 млн., извадката трябва да бъде около 47 пъти по-малко. Колко точно - не може да се каже без специално допълнително проучване. Да се вземат тестове от случайно избрани хора, от различни групи в обществото, от рискови групи. Тоест, да се направи малък обхват на цялата популация, дори не знам дали някъде въобще правят такова нещо в пълен обем. Но по принцип е добре да се почне от рисковите групи и колкото повече хора се обхванат, толкова по-добре. 

Вие осветявате сегмента на неизвестните заразоносители и това е първото знание, което дава вашият модел на всяка страна. Оттам нататък учените могат да използват тези оценки в своите прогнози за динамиката на епидемията – за колко дни напред? 

Ние можем да оценим колко новозаразени ще има след няколко дни, но не за по-дълъг период, защото фактически нещата се менят от ден на ден и нашият периметър е динамичен.

Каква е прогнозата за България за следващите 5 дни?

На графика 1 се вижда как намалява числото m за последните 20 дни – 29 март-17 април, вследствие на наложената карантина стига почти до 1. Но през последните 3 дни започва отново да се катери нагоре към 1.06.

: Изменение на оценката за репродукция на процеса за 20 дни (29 март - 17 април).

Въз основа на числото m може да се пресметне колко души M, за които никой няма идея, ще се заразят. Вижда се, че техният брой се увеличава плавно и от 116 души на 18 април, ще стигне 151 души на 23 април.

С други думи, ако Щабът каже, че са установени 20 новозаразени, той говори за откритите новозаразени, а с нашия модел ние прогнозираме колко са новозаразените, които са в сянка. Те са няколко пъти повече. Това е едно от достойнствата на модела.

Може ли да се изчисли съотношението между всички заразени и клинично доказаните болни?

То също се мени всеки ден, но към момента α = 0.3279, което означава, че една трета от заразените се регистрират с някакви оплаквания или са открити с тестове.

Трябва да се обърне внимание, че всички тези оценки са дадени с 95% доверителни интервали. Това означава, че в 95% от случаите ще познаем, че съответните стойности са именно в този интервал, но в 5% от случаите можем и да не познаем.

Това е така, защото изследваните явления имат стохастичен, т.е. случаен характер. И това е една от особеностите на този феномен. Всъщност с вероятност 0.95 е възможно да се наблюдава всяко едно от числата в този интервал. А посочените оценки са просто средите на тези интервали, но това не ги прави в никакъв случай по-вероятни от другите стойности в интервала. В нашия модел конструирането на тези доверителни интервали е сложна математичска задача. А въобще математическата статистика борави винаги с доверителни интервали и ако в някои статистически изследвания те липсват, то това поставя под съмнение всички изводи след това.

Какво е мнението ви за влиянието на имигрантската вълна, имам предвид българите, които се завърнаха по спешност от чужбина? Каква е нейната роля в епидемията у нас?

Не знаем официалните данни, но някои медии съобщиха, че са се върнали около 200 000 имигранти. Някои от тях се концентрират в условно да ги наречем, имиграционни депа. По отношение на нашия модел наличието на такава допълнителна имиграция коренно променя развитието на епидемията в нашата популация. И вече имаме два различни модела.

Освен това, в тези депа влизат постоянно нови имигранти, а много излизат от тях, тоест има последваща имиграционна вълна, и този процес може да не затихва, а да се развива вълнообразно.

Ето защо ние разширихме нашия първоначален модел и сега подготвяме втора публикация, където се отчита същественото влияние на имиграцията. При това се очертават четири възможни сценария, зависещи основно от параметъра на средно заразяване, който означихме по-горе с m.

Така, ако m>1, то имаме експоненциален ръст на популацията от заразени (независимо дали моделът е без или с имиграция). Ако m=1 (или варира близо до 1), то при модела без имиграция средният брой заразени е постоянен, докато при модела с имиграция средният брой заразени расте линейно. При m<1 процесът без имиграция затихва, т.е. инфекцията намалява и клони към нула, но при наличие на имиграционна компонента средният брой заразени  не намалява, а остава константен. В този последен случай може да се каже, че инфекцията, грубо казано, продължава да тлее.

Във връзка с това смятам, че у нас се вземат адекватни мерки, въпреки че някои ги оценяват като прекалено строги. Напротив, както се вижда от въпросните сценарии, тези мерки може би трябва да бъдат още по-рестриктивни.

Колко души ползват вашия модел?

Нямаме такава информация, но всеки ден получаваме мнения от колеги, които задават въпроси, интересуват се,  въобще тези неща се дискутират в един по-тесен професионален кръг, а също в професионалния сайт research gate. За сега сме получили само положителни оценки, и то от световно известни учени.

Оперативният щаб ползва вашия модел?

Нямам директни контакти с Щаба, но сигурно са осведомени. Както се вижда, статията в „Доклади на БАН” е представена от Директора на Института по Математика и Информатика акад. В. Дренски, а ръководството на БАН също е запознато със статията.

Какво мислите за дългосрочните прогнози?

Аз не вярвам в тях. Трудно могат да се направят, защото нямаме аналози на тази епидемия, много неща не се знаят, епидемиолозите непрекъснато се тюхкат, а те трябва да дадат тази информация на нас, математиците.

Нашият модел използва само това, което се наблюдава и колеги от други страни оцениха точно това, че с един сравнително по-прост модел може да се получи най-важната информация. Той, така да се каже, дава един бърз, но ефикасен тест за оценяване скоростта на заразяване.

Разбира се, има нужда от по-сложни епидемиологични модели. Но те изискват време и сериозна колаборация между епидемиолози, математици, медици, информатици, микробиолози, молекулярни биолози и други специалисти заедно с използване на натрупаната сериозна научна информация по този проблем.  

А кога да чакаме пикът на епидемията?

Само Господ знае!

Проф. Дмн Николай М. Янев е автор на 150 научни статии и 7 книги, защитени 8 аспиранта. Канен да преподава на студенти и аспиранти, а също за научно-изследователска дейност в престижни университети на САЩ, Канада, Франция и Испания. В момента консултант по научни проекти в САЩ. Бил е Директор на ИМИ (Институт по Математика и Информатика) към БАН и научен ръководител на секция «Вероятности и Статистика» в същия институт. Сега Професор Емеритус. Дългогодишен преподавател във ФМИ на СУ.

Проф. Янев е бил аспирант в МГУ (Московски държавен университет) в групата на акад. Андрей Н. Колмогоров, безспорен математик №1 на двадесети век, известен като „баща на съвременната Стохастика“ (Теория на вероятностите и Математическа статистика), и в частност създател на съвременната Теория на разклоняващите се стохастични процеси. Той развива българска школа в тази област, която се ползва с международен авторитет в резултат на многобройни публикации в реномирани международни научни списания. Едно признание за това е фактът, че в България през 1993 г. е организиран първия световен конгрес по разклоняващи се стохастични процеси, а след това се организират регулярни конференции и семинари. Създаденият модел е в резултат на съвместната му работа с двама негови бивши аспиранти, сега известни наши учени доцент д-р Весела Стоименова от Факултета по математика и информатика на СУ и доцент д-р Димитър Атанасов от НБУ.

Коментари

Най

Следвайте ни

 
 

Още по темата

Още от категорията

Анкета

Кои от икономическите мерки на правителството за справяне с кризата одобрявате?