ML прогнозы спроса на полгода вперед - деньги на ветер? На примере индустрии моды
Насколько далеко в будущее можно прогнозировать спрос методами машинного обучения? Если не вдаваться в детали, то на 6 месяцев вперед. За пределами 6 месяцев невозможно оценить точность и опираться на прогнозы уже опасно.
Торговая сеть FashionIsMyProfession прочитала о преимуществах ML при прогнозировании спроса. Генеральный директор Василий понял - вот она, серебряная пуля. Будем прогнозить спрос на годы вперед, как раз цикл производства и доставки из Китая полтора года.
План был хорош и быстро приведен в исполнение. Потратили N-ное количество миллионов, внедрили ML, запрогнозили спрос на два года вперед. В соответствии с ML, разместили заказ на заводе, привезли в Россию.
А вот результаты получились скромными. Финансисты не зафиксировали увеличения прибыли, а логисты вообще посмеялись над нововведением. Одним словом - никаких выигрышей, одни расходы на внедрение. Василий был озадачен и раздосадован.
В чем же причина фактически провала применения машинного обучения в FashionIsMyProfession? А причина в некорректной проблеме, которую попытались решить с ML. Спрогнозить спрос на полтора года вперед для оптимизации производства и доставки - плохая идея.
Если бы мир был компьютерной игрой с заранее установленными правилами - все бы получилось. Но в реальном мире непрерывно меняются тенденции, изменяются факторы спроса, даже сами потребители и их привычки.
План был хорош и быстро приведен в исполнение. Потратили N-ное количество миллионов, внедрили ML, запрогнозили спрос на два года вперед. В соответствии с ML, разместили заказ на заводе, привезли в Россию.
А вот результаты получились скромными. Финансисты не зафиксировали увеличения прибыли, а логисты вообще посмеялись над нововведением. Одним словом - никаких выигрышей, одни расходы на внедрение. Василий был озадачен и раздосадован.
В чем же причина фактически провала применения машинного обучения в FashionIsMyProfession? А причина в некорректной проблеме, которую попытались решить с ML. Спрогнозить спрос на полтора года вперед для оптимизации производства и доставки - плохая идея.
Если бы мир был компьютерной игрой с заранее установленными правилами - все бы получилось. Но в реальном мире непрерывно меняются тенденции, изменяются факторы спроса, даже сами потребители и их привычки.
А мнение математики на сей счет?
Максимально наглядно похожий эффект можно описать на примере экстраполяции* данных при моделировании.
Скажем Любовь - конструктор квадрокоптеров . Она моделирует, какую нагрузку сможет взять квадрокоптер в зависимости от его размера. Эксперимент показал, что если квадрокоптер в длину 20 см, то взять он сможет 600 г груза. Если 10 см - то около 300 г груза.
Приходит запрос от отдела продаж - нам срочно нужен квадрокоптер, который сможет взять 900 г, покупатель готов заплатить любую сумму.
Казалось бы - ну квадрокоптер размером 10 см берет 300 г, а 20 см - 600 г., ну какие эксперименты, давайте сразу заказ в производство запустим на партию в 100500 экземпляров размером 30 см. Так? Математика говорит веско - нет.
На графике описан простой факт - доверительный интервал нарастает катастрофически быстро как только мы выходим за пределы измеренных значений. Математически строго “погрешность вычисляемой величины быстро растет с удалением аргумента от среднего значения измеренных значений ”.
И, отправив в партию 100500 квадрокоптеров, мы легко получим 100500 никому не нужных квадрокоптеров.
Подобный эффект и при прогнозировании спроса: как только мы сильно удаляемся от фактических данных по продажам - ошибка прогноза начинает нарастать. И прогнозировать вперед лучше не далее, чем на 6 месяцев. В таком случае мы еще сможем оценить точность прогноза, дальше - уже нет.
Максимально наглядно похожий эффект можно описать на примере экстраполяции* данных при моделировании.
Скажем Любовь - конструктор квадрокоптеров . Она моделирует, какую нагрузку сможет взять квадрокоптер в зависимости от его размера. Эксперимент показал, что если квадрокоптер в длину 20 см, то взять он сможет 600 г груза. Если 10 см - то около 300 г груза.
Приходит запрос от отдела продаж - нам срочно нужен квадрокоптер, который сможет взять 900 г, покупатель готов заплатить любую сумму.
Казалось бы - ну квадрокоптер размером 10 см берет 300 г, а 20 см - 600 г., ну какие эксперименты, давайте сразу заказ в производство запустим на партию в 100500 экземпляров размером 30 см. Так? Математика говорит веско - нет.
На графике описан простой факт - доверительный интервал нарастает катастрофически быстро как только мы выходим за пределы измеренных значений. Математически строго “погрешность вычисляемой величины быстро растет с удалением аргумента от среднего значения измеренных значений ”.
И, отправив в партию 100500 квадрокоптеров, мы легко получим 100500 никому не нужных квадрокоптеров.
Подобный эффект и при прогнозировании спроса: как только мы сильно удаляемся от фактических данных по продажам - ошибка прогноза начинает нарастать. И прогнозировать вперед лучше не далее, чем на 6 месяцев. В таком случае мы еще сможем оценить точность прогноза, дальше - уже нет.
Какие задачи ML решит
Василию и FashionIsMyProfession надо было начать внедрение ML с решения иной задачи. Задачи прогнозирования спроса на 6 месяцев вперед. И с помощью 6-месячного прогноза распределять товары со склада по регионам и точкам продаж. В этом случае и прогноз спроса можно оценить, и оптимизировать промо активности компании. При этом в горизонт прогнозирования в 6 месяцев задача ложится идеально.
Кроме того, прогнозирование спроса стало бы лишь первым этапом. Далее с его помощью можно решить задачи оценки прибыль/риск по SKU и оптимизации ассортиментной матрицы. К примеру, продукт BAI Gem БАИ Прогноз "из коробки" прогнозит на 6 месяцев вперед, а плагины как раз решают задачи оптимизации ассортиментной матрицы.
Как итог - FashionIsMyProfession увеличили бы прибыль на 1-3 % и заработали от внедрения ML.
Василию и FashionIsMyProfession надо было начать внедрение ML с решения иной задачи. Задачи прогнозирования спроса на 6 месяцев вперед. И с помощью 6-месячного прогноза распределять товары со склада по регионам и точкам продаж. В этом случае и прогноз спроса можно оценить, и оптимизировать промо активности компании. При этом в горизонт прогнозирования в 6 месяцев задача ложится идеально.
Кроме того, прогнозирование спроса стало бы лишь первым этапом. Далее с его помощью можно решить задачи оценки прибыль/риск по SKU и оптимизации ассортиментной матрицы. К примеру, продукт BAI Gem БАИ Прогноз "из коробки" прогнозит на 6 месяцев вперед, а плагины как раз решают задачи оптимизации ассортиментной матрицы.
Как итог - FashionIsMyProfession увеличили бы прибыль на 1-3 % и заработали от внедрения ML.
Вместо вывода
Если вы решили внедрить ML - начните с прогнозирования краткосрочного спроса. И не надейтесь на точность прогнозирования дальше 6 месяцев вперед.
Основные задачи ML - оптимизация промо и ассортиментной матрицы. Начните с них. После этого можно внедрить другие приложения машинного обучения.
И работайте с данными. Чем качественнее временные ряды и атрибуты товаров - тем точнее прогнозирования. И легче автоматизировать прогнозирование спроса при отсутствии постоянной ассортиментной матрицы.
*Экстраполяция - это перенос выводов, сделанных относительно какой-либо части объектов или явлений, на всю совокупность данных объектов или явлений.
Если вы решили внедрить ML - начните с прогнозирования краткосрочного спроса. И не надейтесь на точность прогнозирования дальше 6 месяцев вперед.
Основные задачи ML - оптимизация промо и ассортиментной матрицы. Начните с них. После этого можно внедрить другие приложения машинного обучения.
И работайте с данными. Чем качественнее временные ряды и атрибуты товаров - тем точнее прогнозирования. И легче автоматизировать прогнозирование спроса при отсутствии постоянной ассортиментной матрицы.
*Экстраполяция - это перенос выводов, сделанных относительно какой-либо части объектов или явлений, на всю совокупность данных объектов или явлений.