Метод прогнозирования выработки электроэнергии на солнечных электростанциях при отсутствии данных

Аккумулятор FIAMM 12FGL42
Китайские учёные разработали новый метод прогнозирования энергопотребления с учётом пропущенных данных, который использует декомпозицию сигналов, многомасштабное взаимодействие ковариат и многодоменное совместное трансферное обучение. Сообщается, что этот подход повышает среднюю точность прогнозирования на 15,3%.

Блок-схема предлагаемой структуры
Исследовательская группа под руководством Хунаньского университета в Китае разработала новый метод прогнозирования выработки фотоэлектрической энергии с учётом пропущенных данных, предназначенный для работы с отсутствующими и неполными данными.
Методология многодоменного совместного трансферного обучения — многомасштабного ковариационного взаимодействия (MDCTL-MCI) сочетает в себе декомпозицию сигнала, многомасштабное ковариационное взаимодействие и многодоменное совместное трансферное обучение.
«В этом исследовании рассматривается вопрос о том, как можно эффективно использовать ковариационную информацию для повышения точности прогнозирования, а также о том, можно ли использовать присущую алгоритмам глубокого обучения способность к обобщению и надёжность для непосредственного прогнозирования солнечной радиации при наличии значительного количества пропущенных входных данных без дополнительного вменения, а также для проведения тщательного анализа различных факторов влияния и механизмов прогнозирования», — заявили авторы исследования.
Для этого метод сначала применяет многомерный сингулярный спектральный анализ (MSSA) для снижения уровня шума и улучшения представления данных. Затем с помощью упрощённого подхода MCI моделируются взаимосвязи между переменными и выявляются глубинные временные закономерности. На третьем этапе стратегия MDCTL повышает надёжность модели в условиях низкого качества данных за счёт интеграции данных с нескольких фотоэлектрических площадок. Наконец, метод аддитивного объяснения Шепли (SHAP) определяет ключевые факторы, влияющие на точность прогнозирования.
Набор данных, использованный в исследовании, включает в себя непрерывные данные за один год с четырёх солнечных электростанций в северном, центральном и северо-западном Китае, которые записывались с интервалом в 30 минут. Номинальная мощность этих станций составляет от 30 до 130 МВт. По словам исследователей, в наборе данных «наблюдаются значительные проблемы с качеством данных». В то время как данные о выработке электроэнергии относительно полные, такие ковариаты, как интенсивность солнечного излучения и погодные условия, отсутствуют в диапазоне от 0% до 80% на разных станциях. Данные были разделены на обучающую, проверочную и тестовую выборки в соотношении 6:1:1.
«Учитывая решающую роль типов ковариат в определении точности модели, для шести переменных был проведён корреляционный анализ Пирсона (для линейных зависимостей) и корреляционный анализ Спирмена (для нелинейных зависимостей)», — пояснила команда. «Глобальная горизонтальная освещённость (GHI), прямая нормальная освещённость (DNI) и общая солнечная освещённость (TSI), которые демонстрируют наиболее сильную корреляцию с выходной мощностью фотоэлектрических систем, были выбраны в качестве входных переменных для последующих экспериментов. Чтобы лучше понять распределение данных, были построены предельные гистограммы, отображающие взаимосвязь между каждой выбранной переменной и выходной мощностью фотоэлектрических систем».
Модель MDCTL-MCI использует в качестве входных данных 48 исторических временных отрезков и выполняет многоэтапное прогнозирование на следующие 48 временных отрезков за один прямой проход. Её эффективность сравнивалась с несколькими современными методами прогнозирования временных рядов, включая Pyraformer, Transformer, Informer, TimeXer, iTransformer и PatchTST, а также с моделями на основе многослойного перцептрона, такими как LightTS, TSMixer и MCI.
«Обширные эксперименты на четырёх китайских фотоэлектрических установках показали, что по сравнению с базовыми методами предложенный метод повышает среднюю точность на 10,5 % при наличии полных данных и на 15,3 % при различных сценариях отсутствия данных», — говорится в результатах. «Таким образом, метод MDCTL-MCI, предложенный в этом исследовании, эффективно устраняет ограничения, связанные с недостаточным использованием ковариат, а также с нестабильностью и неточностью прогнозов при низком качестве данных, которые часто встречаются в существующих исследованиях. Предложенная модель закладывает прочную основу для внедрения фотоэлектрических систем в сложных условиях и вносит значительный вклад в развитие фотоэлектрических технологий.