Прогнозы движения денежных средств частных клиентов

В сложившейся ситуации важно прогнозировать движение денежных средств текущих счетов частных клиентов. Прогнозы будут делаться при помощи алгоритмов прогнозирования и основываться на статистических данных об операциях, которые хранятся в банке. Прогноз генерируется без участия пользователя и является частью профиля клиента в системе онлайн-банкинга. Планируется, что прогнозы будут предоставляться в качестве «программного обеспечения как услуги» и внедряться как white-label решение [продукт или услуга, производимые одной компанией (производителем) и продающиеся другой компанией под другим брендом (специалистами по маркетингу)].

Группировка операций находится в самом ядре таких прогнозов. Каждая группа может моделироваться по-разному, а все модели групп вместе могут быть объединены, чтобы агрегировать оценки. Группы формируются на основании различных параметров, например:

• контрагент;

• признак (доход или расход);

• категория (зарплата, квартплата, еда, образование, досуг и т. д.);

• тип (точка продаж, кредитная карта, распоряжение о постоянных платежах и т. д.);

• геолокация.

Динамическая группировка (см. рис. 1) также может основываться на неоднородности показателей[137], но данные об операциях обычно имеют достаточно характерную структуру, чтобы удовлетворять указанным параметрам.

Стандартная модель генерирует серединное значение и значения, соответствующие 0,05/0,25/0,75/0,95.

Как правило, группы, используемые в качестве выборки, слишком малы, чтобы предоставлять точную статистику, поэтому принимается непрерывная выборка и используется квантильная интерполяция. Наша модель основывается на средних значениях вместо серединных значений и/или рассчитывает взвешенную оценку, где основной акцент делается на базе новой информации.

Существует множество различных техник, применимых к динамическим рядам, например:

• симуляция списания средств ATM по скрытой модели Маркова;

• иерархические динамические ряды (например, вложенные категории операций, формирующие иерархию);

• копула (связка) для симуляции влияния события на многочисленные группы и межгрупповые зависимости.

В 2010 г. компания SAP выпустила свой продукт HANA, который является высокопроизводительной системой управления реляционной базой данных, загруженной в оперативную память. Платформа HANA поставляется с инструментами прогнозирования, включающими многочисленные алгоритмы и R-интеграцию. Она может быть интересной альтернативой разработке системы с нуля[138]. Oracle предлагает похожие платформы и решения, например колоночные прогнозы и концепции автоматизированного анализа данных[139].