чистых данных о скорости ветра в сжатой форме. Добавим к этому
данные о температуре, давлении и относительной влажности и по-
лучим
∼
12
,
5
МБ чистой сжатой информации. Автоматизированные
системы УВД необходимы не только для актуальной информации о
текущей метеообстановке, а также для прогноза на срок от 6 ч до
10 суток.
При шаге прогноза в 6 ч для прогноза на 10 суток получим 10
×
×
24/6 = 40 порций данных каждые 6 ч. Таким образом, АС УВД долж-
на получить и обработать 500МБ информации за 6 ч или 2 ГБ в день.
Если уменьшить шаг прогноза до часа, что даст значительно более точ-
ные данные для планирования, объем данных, получаемых системой,
станет 3 ГБ, а получать их система станет каждый час. В день системе
придется обработать 72 ГБ. Однако в РФ существует 133 метеоцентра
и для получения наиболее точного прогноза следует получать инфор-
мацию из максимального числа источников, а далее аппроксимировать
полученную информацию для дальнейшего использования при расче-
те 4D-траектории ВС [6–9].
Уровень сложности системы определяется большим числом сино-
птических эффектов; обилием взаимных связей между этими эффек-
тами; одновременным протеканием и взаимосвязями между разными
явлениями физико-химической природы в локальных объемах; нели-
нейными зависимостями между переменными параметрами и т.д.
Реализация перечисленных особенностей по улучшению качества
планирования требует значительных вычислительных мощностей.
В настоящей работе предложен новый подход к обработке метео-
данных, основанный на технологии “Big Data” (большие данные),
который позволяет эффективно обрабатывать значительные объемы
структурированных и неструктурированных данных.
1. Использование технологии Big Data при анализе метеооб-
становки.
Введение термина “большие данные” приписывают Клиф-
форду Линчу, редактору журнала Nature, подготовившему к 3 сен-
тября 2008 года специальный номер журнала с темой
“Как могут
повлиять на будущее науки технологии, открывающие возможности
работы с большими объемами данных?”
, в котором были собраны ма-
териалы о феномене взрывного роста объемов данных, многообразии
обрабатываемых данных и технологических перспективах в парадигме
вероятного скачка “от количества к качеству”, термин был предложен
по аналогии с расхожими в деловой англоязычной среде метафорами
“большая нефть”
,
“большая руда”
[10–12].
Большие данные (Big Data) — в информационных технологиях —
это серия подходов, инструментов и методов обработки структуриро-
ванных и неструктурированных данных огромных объемов [10].
ISSN 0236-3933. Вестник МГТУ им. Н.Э. Баумана. Сер. “Приборостроение”. 2015. № 6 49