Автор Тема: Анализ модельных данных  (Прочитано 650 раз)

Оффлайн Alter

  • Модератор
  • Ветеран
  • *****
  • Сообщений: 2800
  • Москва, ЮЗАО.
    • Просмотр профиля
Анализ модельных данных
« : 26 Ноябрь 2020, 03:58:15 »
Добрый день.
Открываю аналитическую тему в надежде на хотя бы некоторую активность в ней.

В связи с недостатком свободного времени не сильно продвинулся в изучении темы, о которой говорил Spasatel-ю, но, тем не менее, кое-что удалось сделать.

Получил данные ансамблевых прогнозов ЕЦСПП на 240 часов из открытого источника.
Таким же образом получил данные анализа ЕЦСПП.
Предмет оценки - сходимость ансамблевого прогноза параметра заблаговременностью 240 часов и данных модельного анализа того же параметра в масштабах различных географических областей и различных отрезков времени.
Первым(но не последним, надеюсь) параметром оценки явилась высота геопотенциала 500 гПа.
Для оценки сходимости прогноза и факта выбрана корреляция аномалий, т.к. обычная корреляция значений дает заведомо высокий результат, что является следствием предсказуемого заранее общего широтного и долготного градиентов параметра. Говоря проще, геопотенциал статистически будет понижаться при движении к северо-востоку и повышаться при обратном движении к северо-западу, если брать в качестве области оценки ЕТР.
Для ликвидации данного фактора и используются корреляции не значений, а аномалий.
Аномалии использованы к норме 1981-2010 по данным реанализа CFS.
Ранее я уже выкладывал график усредненного значения корреляций за последние 4 месяца по  преимущественно внетропической зоне северного полушария(широта свыше 40). Привожу его повторно.

Как видим, в середине ноября произошел резкий обвал средней корреляции, что, видимо, вызвано довольно резкими процессами, предшествующими дате обвала(напоминаю, что исследуем корреляции на дату прогноза).
Прогнозы на конец второй декады были даны в период нестабильных атмосферных процессов конца первой декады, что и повлекло сильную деградацию их качества.

Но, как Вы понимаете, очень сложно делать какие-то существенные выводы из "среднего по больнице".
Поэтому вторым направлением исследования я определил выявления средних корреляций по окрестности для определенной географической точки.
Итак. Определение.
Средняя окрестная корреляция 2 параметров по определенной точки в x-окрестности - это такая пространственная корреляция 2 параметров, при которой область ограничена сектором геоида в границах от координата точки - x градусов до координата точки + x градусов  по долготе и от координата точки - x градусов до координата точки + x градусов  по широте. Данная схема непродуктивно работает в высоких широтах, т.к. корреляционные области при приближении к полюсу очевидным образом стремятся по площади к 0, но в качестве исследования я взял средние широты, так что пока этим потенциально важным моментом пренебрегаем.

Итак, после определений перейдем к практическому решению задачи.
Я вычислил данный параметр для 5-градусных окрестностей и предлагаю Вашему вниманию результат усреднения по времени от 1 августа до 23 ноября с.г.

Как я уже говорил, островки стабильности наиболее выражены в Средней Азии, к западу от Ла-Манша, в Норвежском море и на ЕТ СНГ.
В принципе, рядом с зонами действия постоянных депрессий и антициклонов это так и должно быть. Поэтому особенный интерес вызывает зона с центром примерно в Белоруссии.
Для Москвы также корреляция неплохая - около 0,5.
По ноябрю картина интереснее. ЕТР - снова островок стабильности, уже больший, чем Средняя Азия. В Атлантике также потерялась стабильность прогноза.

Анализ этих данных будет произведен позже.
Также надо будет исследовать возможную связь значений корреляций с абсолютными фактическими и прогностическими значениями.

Оффлайн Max_F

  • Постоялец
  • ***
  • Сообщений: 205
    • Просмотр профиля
Re: Анализ модельных данных
« Ответ #1 : 26 Ноябрь 2020, 12:13:19 »
Еще раз, что с чем сравнивается? Отдельный прогноз с ансамблем? И почему выбрано именно это сравнение?
Так как здесь вы идете явно дальше, чем просто приведение интересных фактов, то хотелось бы, как в научной работе, видеть введение (что исследуется и для чего) и заключение (выводы)  :)
Второе, видимо, впереди, а вот введения не хватает.
« Последнее редактирование: 26 Ноябрь 2020, 12:21:42 от Max_F »

Оффлайн Alter

  • Модератор
  • Ветеран
  • *****
  • Сообщений: 2800
  • Москва, ЮЗАО.
    • Просмотр профиля
Re: Анализ модельных данных
« Ответ #2 : 26 Ноябрь 2020, 14:39:17 »
Max_F, спасибо за ответ.
Да, цели не указаны. Фактически заключение и будет выведено из поставленных целей по факту их достижения или недостижения.
Еще раз по предмету - исследую закономерности в стабильности работы ансамблевых прогнозов. Сравнение прогноза ансамбля идет строго с фактом.
Задача - исследовать возможные факторы, влияющие на стабильность прогнозов, определить условия, при которых данные прогнозы можно считать наиболее стабильными, и ситуации, при которых можно заранее диагностировать низкую степень корреляции прогноза и факта.

Оффлайн Andrew FM

  • Постоялец
  • ***
  • Сообщений: 118
  • г. Москва, САО
    • Просмотр профиля
Re: Анализ модельных данных
« Ответ #3 : 26 Ноябрь 2020, 14:48:55 »
Насколько я понял, наименьшие корреляции в районе основных центров действия атмосферы в зимнее время - в районе Гренландии, в районе Сибири. Т.е. модель плохо просчитывает поведение основных погодообразующих регионов, от которых зависит погода на очень значительных территориях, а следовательно, долгосрочным прогнозам (здесь я под такими понимаю дальние "хвосты", +240 часов), даже ансамблевым, цена не особо высока - особенно в ситуациях перестройки циркуляции.
Здесь правда следует оговориться, что Гренландия и Сибирь более важны для зимнего сезона, а на первой карте все может смазываться августом с сентябрем. Но все равно плохая корреляция по Сибири для периода, почти половину которого составляют октябрь - ноябрь, когда Сибирская депрессия начинает более ощутимо влиять на погоду и на ход осенне-зимних процессов, обращает на себя внимание.
Неплохо бы визуализировать карту в разрезе всего Северного полушария (по аналогии, как это делается при предоставлении модельных прогнозов, так картинка не совсем удобная для восприятия получается).
В принципе, насколько я понимаю, отмеченный выше факт можно частично объяснить тем, что в тех местах, где, скажем так, работает основная "кухня" погоды в Северном полушарии в осенне-зимний период - в Гренландии и в Сибири, меньшее покрытие сетью наблюдений и регистраций, на основе данных которых собственно в том числе и рассчитываются параметры в модельных расчетах, что, вероятно, и начинает "вылезать" при увеличении сроков прогнозирования.

То, что в ноябре диапазон территорий с более высокой корреляцией сужается, наверное объяснимо и ожидаемо, идет перестройка циркуляции с летне-осенней на зимнюю, да еще и сокращается временной диапазон наблюдений, в таких случаях косяки, наверное, и должны начинать лезть активнее, если они есть (а они есть), тем более в ноябре. Видимо, с этим может быть связан обвал средней корреляции, а также, как вы заметили, с резкими процессами (а это, наверное, и нормально в условиях перестройки глобальной циркуляции).

Хорошие результаты по ЕТР - возможно, следствие особенностей климатической зоны и большей инерционности метеопроцессов, там, видимо, влияние плохого просчета поведения основных центров действий атмосферы не так критично и складывается некая иллюзия благополучия, плюс, возможно, роль играет анализируемый период времени, который в случае с первой картой захватывает еще и летний сезон. Тем более, этой осенью были активны блокирующие процессы и моделям было достаточно просто пролонгировать текущие тенденции на дальнейшие сроки, что они и "любят" делать. В условиях повышенной активности АЦ и, соответственно, более стабильных метеопроцессов это создавало иллюзию большей оправдываемости долгосрочных прогнозов. Но по более нестабильному ЧПК со своими климатическими и рельефными особенностями мы уже видим в целом более худшую картину. Что ожидаемо, я заметил, что по ЧПК граница сравнительно достоверных прогнозов заканчивается гораздо раньше, чем на ЕТР.
« Последнее редактирование: 27 Ноябрь 2020, 01:04:32 от Andrew FM »

Оффлайн Spasatel

  • Ветеран
  • *****
  • Сообщений: 1365
  • Профи
    • Просмотр профиля
Re: Анализ модельных данных
« Ответ #4 : 26 Ноябрь 2020, 15:37:05 »
Alter Прогнозы на конец второй декады были даны в период нестабильных атмосферных процессов конца первой декады, что и повлекло сильную деградацию их качества.

Это совпадает с выводами, которые были представлены на предзащите на ВМК МГУ.

Оффлайн Alter

  • Модератор
  • Ветеран
  • *****
  • Сообщений: 2800
  • Москва, ЮЗАО.
    • Просмотр профиля
Re: Анализ модельных данных
« Ответ #5 : 26 Ноябрь 2020, 17:11:01 »
Вообще, скорее всего, исследование будет иметь долгий характер. Впереди зима с, я надеюсь, различными вариациями син. процессов и весна. На основе накопленного за полугодие и больший срок материала можно будет делать более детальные выводы.
Andrew FM, да, безусловно, сезонные центры погоды обладают статистической стабильностью, их поведение можно предсказать и без ансамбля. Поэтому упор должен делаться именно на такие точки, как ЕТР. Основной вопрос - является ли данная стабильность следствием однородности некоторых процессов. Например, стабильно повышенное давление может ли играть роль? Это и предстоит узнать.
Для этого нужно составить график зависимости корреляций от приведенного давления и либо выявить наличие зависимости, либо ее опровергнуть.

Оффлайн Andrew FM

  • Постоялец
  • ***
  • Сообщений: 118
  • г. Москва, САО
    • Просмотр профиля
Re: Анализ модельных данных
« Ответ #6 : 26 Ноябрь 2020, 23:25:56 »
да, безусловно, сезонные центры погоды обладают статистической стабильностью, их поведение можно предсказать и без ансамбля.
В отношении каких-то можно, но в отношении, к примеру, поведения Арктического/Гренландского АЦ не так просто.
Будет ли, к примеру, Гренландский АЦ силен через +240 ч.? Или наоборот, он будет слаб, но сильна будет Исландская депрессия? Вот, в частности, вопросы, которые стоят перед ансамблями, от ответа на них зависит многое в осенне-зимнее время.
И мне не нравятся синяки на картах именно в районе Гренландии и в Сибири (мы же помним про Сибирскую депрессию, от ее поведения ведь тоже многое зависит в осенне-зимнее время).
Ноябрь - период, когда Арктический/Гренландский АЦ уже играет серьезную роль в глобальной циркуляции, а по Гренландии там, если я правильно понял, корреляция между прогнозами и фактом низкая получается, исходя из второй карты.
Если же сделать вывод, что модель (ансамбль) действительно плохо считает ту же Гренландию на +240 ч. в ноябре, то серьезных надежд на ее прогнозы на такие сроки возлагать не стоит, по крайней мере, в зимний сезон.
« Последнее редактирование: 27 Ноябрь 2020, 00:03:00 от Andrew FM »

Оффлайн Alter

  • Модератор
  • Ветеран
  • *****
  • Сообщений: 2800
  • Москва, ЮЗАО.
    • Просмотр профиля
Re: Анализ модельных данных
« Ответ #7 : 28 Ноябрь 2020, 20:16:21 »
Сделал анализ приведённого давления по той же схеме. Результат любопытный. Вкратце - тут у ансамбля все заметно хуже. Подробности скоро.