Закономерность случайного события

Георгий Александров
В одном из крупных торговых центров в течение десяти лет производился электронный учет продаж мужских костюмов. И вот что оказалось.
Были куплены костюмы размером от 40 до 64. Размеры, как известно, - числа четные. Для этих тринадцати значений компьютер показал следующие количества продаж: 1,1650,73668,811421,2899970,2695621,907419,180282,26617,3191, 324,28,2. Была построена так называемая гистограмма продаж, показанная над заголовком
(смотрите также по ссылке https://b.radikal.ru/b05/1907/5c/132616ee1805.jpg ).
На данном рисунке S - это размер костюма. Но по горизонтали дана более удобная для дальнейших расчетов шкала, в которой  x=(S-39)/10
Например, (40-39)/10=0.1, или (64-39)/10=2.5. С этим, думаю, все ясно.
Гистограмма, как видим, довольно красивая с точки зрения закономерности. Нигде нет провалов или чрезмерных "выскочек". Это произошло благодаря очень большой статистике - более семи миллионов продаж! Если уж совсем точно, то за десять лет продано было 7600194 костюмов.
Чтобы найти закон распределения данных случайных событий, необходимо, во-первых, пронормировать частоты и, во-вторых, представить данные в интегральном виде. То есть аппроксимировать точки обеспеченности F(x). Расчеты были произведены и получились точки такие:
 x       F(x)
0.2 1.31576e-07
0.4 0.000217231
0.6 0.00991014
0.8 0.116673
1 0.498239
1.2 0.852916
1.4 0.972311
1.6 0.996031
1.8 0.999533
2 0.999953
2.2 0.999996
2.4 1
2.6 1

Теперь задача одновременно и простая, и сложная. Простая, потому что нужно осуществить аппроксимацию, а это очень хорошо разработанная область математики. Сложная, потому что аппроксимировать важно не только заданные точки, но и учесть два важных граничных условия: F(0)=0 и при возрастании x до бесконечности функция асимптотически приближается к единице. Поэтому, например, аппроксимация полиномом здесь бессмысленна.
Широко известные законы распределения (Гаусса, Вейбулла, Релея, Пирсона, Максвелла, Стьюдента, хи-квадрат, Гумбеля и др.) имеют от одного до трех независимых параметров. Такое малое их число ограничивает набор возможных кривых и потому часто получаются довольно большие несоответствия между опытными точками.  Так произошло и с нашим примером. Никакое из известных законов распределения не вписалось в гистограмму продаж костюмов.
Я более двадцати лет занимаюсь проблемой аппроксимации. В том числе и вероятностных кривых. Перебрав огромное количество различных формул, остановился на четырех наиболее перспективных. Функции обеспеченности такие:
F1=(1-exp(-(x/a)^b))^c
F2=1-(((x/a)^b+1)^(-(x/c)))^d
F3=(1-((x/a)^b+1)^(-c))^d
F4=1-exp(-a*arctg((x/b)^c)^d)
Первая формула трехпараметрическая, остальные - четырехпараметрические. У всех, тем не менее, соблюдены упомянутые выше граничные условия.
Оптимизировать параметры оказалось проще всего методом Монте Карло. Для этого пришлось написать программу на языке Yabasic. Результаты расчета можно увидеть по ссылке
https://c.radikal.ru/c42/1908/8a/a8c8d602d142t.jpg
Как и ожидалось, трехпараметрический закон распределения значительно уступает по точности аппроксимации четырехпараметрическим, причем на порядки! Это можно видеть по значениям среднеквадратичных отклонений.
С законом распределения мы разобрались. Это теперь позволит произвести аппроксимацию исходной гистограммы. Обозначим размер костюма через S,их число будем измерять в тыс. шт и обозначим буквой N. Опять же методом Монте Карло получим очень точную формулу (она есть произведение коэффициента пропорциональности r на производную F2):

 N
где
x=0.1S-3.9
r=1520:a=0.988:b=7.45:c=3.37:d=3.12

Расчетные значения гистограммы:

S  N(тыс.шт)
40 0.0005
42 1.650
44 73.669
46 811.427
48 2899.979
50 2695.620
52 907.413
54 180.279
56 26.617
58 3.191
60 0.323
62 0.028
64 0.002

PS. Параметры 0.1 и 3.9  также были найдены методом Монте Карло. То есть формула для N - семипараметрическая.