Начнем с очевидного, чтобы посчитать валовый доход за определенный период нам нужно взять сделки, и умножить на цену. Тут нас ждут сразу 2 проблемы: сделки, как параметр, мы не можем распределить по товарам, т.е. мы знаем, что в период с 24.12.2022 по 24.02.2023 магазин провел 16 958 сделок, но в каких пропорциях они распределены - нет. тут нам на помощь пришли отзывы, ведь они позволяют сегментировать массив на кластеры, в которых нам уже будут известны пропорции. На графиках ниже показана динамика сделок и отзывов, заметные всплески на графике связаны с тем, что мы не всегда ежедневно собираем данные, и поэтому несобранные своевременно значения плюсуются к следующей дате сбора. В целом. на расчеты это никак не влияет, лишь на визуальную составляющую. Главные итоговые цифры у нас есть.

Здесь есть один нюанс, далеко не каждый покупатель оставляет отзыв, но мы можем узнать пропорцию - для этого мы делим количество сделок (16 958) на количество отзывов (6 688), и таким образом получаем, что на 1 отзыв приходится 2,54 сделки. Эту цифру можно сделать еще точнее, если. например считать этот коэффициент для каждой недели. дня, или даже часа, но для наших целей достаточно и ее. Вот на этом моменте мы остановились в феврале, но в конце того месяца мы обратили внимание на еще один показатель - "оценки", их оказалось существенно больше - суммарное количество всех оценок от 1 до 5 за указанный промежуток времени составило 15 214, т.е. по аналогии с предыдущим коэффициентом, сделки/оценки составил 1,11, а так как оценки привязаны к товару - это дает нам возможность с минимальной погрешностью сказать сколько каких товаров было продано.
Вторая проблема - цена. Мы нашли теоретическое решение, но для этого нам придется после внесения изменений в парсеры, ждать еще какое-то время, чтобы набрать достаточно данных. Поэтому пока, как некий костыль, мы ввели "среднюю цену за одну единицу товара". Мы знаем что купил покупатель, но не знаtм фасовку этого товара, поэтому мы берем все позиции этого товара за каждый день периода исследования, суммируем и делим на количество этих позиций. Например, для "Гашиш ICE BELVEDERE",средняя цена за единицу товара составила 2 441 рубль. По сути, мы приводим все фасовки к общему знаменателю и теперь можем узнать валовые продажи по товарам.
Следующие 2 графика не имеют прямого отношения к расчетам, просто было любопытно визуализировать пропорции продаваемых товаров, и как видите, мефедрон в количественном выражении просто в космос уходит


На графиках ниже изображены 2 способа подсчета валовой прибыли - через отзывы и через оценки. С помощью оценок точнее, но, как видите, цифры не сильно разнятся.

Итак, принимая во внимание наше допущение о цене товара, получаем цифру за 2 месяца - 75 963 113 рублей, из которых 42 656 523 руб. - продажи мефедрона, на втором месте по деньгам - "Кокаин Аргентина".
Много это или мало - решайте сами. Надеемся вам было интересно и до новых встреч!