1) у исходного распределения эксцесс в Excel равен 12.
файлик тут
[
drive.google.com].
Выкидывая значения из хвостов Вы, естественно, уменьшаете четвертый момент.
Я выкинул 8 значений, чтобы проверить, получил что-то около 5,5 в Excel. Ок.
2) Далее, функция KURT() в Excel устроенна таким образом, что у нормального распределении KURT()=0, а не 3 (фича такая у них). Вы считали в Excel (сорри, что спрашиваю, но, все же уточню, так как Вашего файла не вижу)?
Так что, у меня даже при удалении 8 экстремальных событий из хвоста операции над данными, куртосис выше нормального в 3 раза.
3) Левый и правый хвост распределения, конечно, важно рассматривать отдельно, так как в положительном хвосте Парето под вопросом.
[
drive.google.com]
(Если Вы посмотрите мой файл - в нем логлог для негативного хвоста, может быть я не делал акцент на этом в достаточной мере)
4) На лог-лог плот прямая строится не по 7 точкам из 7100. Эти 7 точек лежат на той же прямой на Zipf, что и остальные 200 точек негативного хвоста.
5) Но это все незначительно. Но, вот, оценивая куртосис, действовать надо аут оф сампл, не заглядывая в будущее. Ниже MS plot ("maximum to sum", вклад максимального наблюдения к сумме) для эксцесса , т.е. поведение ЗБЧ для эксцесса (4 момента на картинке) с ростом n:
[
drive.google.com]
Картинки подписанны и говорят за себя.
(15000 наблюдений, но он не включил сюда события марта 2020)
Тут "пахнет" не просто Парето, а бесконечностью куртосиса и несходимостью скошенности.
Нельзя "выкидывать" 7 точек из хвоста, особенно, зная, что за 1500 наблюдений до начала нашей выборки произошло совершенно экстремальное по масштабу событие. Которое только подтверждает, что эти 7 точек - часть распределения.
[
drive.google.com]
Мы говорим про риски.
Нельзя выкидывать точки в распределении с такими статистиками.
Посмотрите, все же, в 10 главе этой книги остальные статистики которые он приводит.
[
arxiv.org]