Лингвистический анализ

Иосиф Ольшаницкий
31.10.16.

Вот что я только что обнаружил в интернете.

Это очень лестно, хоть и мало понятно мне, - неспециалисту по такому анализу.

Этот анализ послужит мне хорошим материалом, как пример статистических данных для разработки моей бесконечно значимой темы - о перспективах нового практического применения пока супер-компьютеров:

 РЕГУЛИРУЕМОЕ, - в принципе, хоть ежеминутно, да хоть и в каждой строке текста, - СЖАТИЕ АЛФАВИТА (вплоть до всего-то двух знаков:
в виде верхних точек и нижних точек,- как в двоеточии - по одной, и лишь иногда по две на каждую букву текста),

                или, называя это иначе,
 
1. НОВЫЕ ПРИНЦИПЫ скоростного ("стенографического") НАБОРА ТЕКСТОВ в МАШИНОПИСИ и

2.  СВЕРХ-СКОРОСТНОГО (и много более осмысленного) ЧТЕНИЯ этих текстов в таком виде (полагаю, возможно уже в ближайшем будущем, - прежде всего, в русской письменности).
                -И.О.

ЛИНГВИСТИЧЕСКИЙ АНАЛИЗ: Загадки русского Заполярья (Иосиф Ольшаницкий)



 - Загадки русского Заполярья 412K  (читать)  (скачать fb2) - Иосиф Ольшаницкий
Общая статистика
Длинна текста 228698 знаков
Длинна диалогов 569 знаков
Слов в произведении (СВП) 32821 слов
Приблизительно страниц 128 стр.
Средняя длина слова 5.50 знаков
Предложений в произведении (ПВП) 2632 предл.
Средняя длина предложения (СДП) 83.93 знаков
Доля диалогов в тексте 0.25 %
Доля авторского текста 99.75 %
СДП диалогов 189.00 знаков
СДП авторского текста 78.28 знаков
Использование диалогов по тексту книги № 65845: Загадки русского заполярья (Иосиф Ольшаницкий)
Максимальный фрагмент авторского текста - 38844 знаков (в страницах - примерно 22, начинается где-то с 1 страницы)

Активный словарный запас
Использовано уникальных слов 9661
Активный словарный запас (АСЗ) 8576
Активный не словарный запас (АНСЗ) 1085
Удельный АСЗ на 3000 слов текста 1555.15 29269 место в рейтинге УАСЗ-3000
Удельный АСЗ на 10000 слов текста 3998.52 30849 место в рейтинге УАСЗ-10000
Удельный АСЗ на 100000 слов текста 0.00
Удельный АСЗ-3000 книги № 65845: Загадки русского заполярья (Иосиф Ольшаницкий)
Максимальный УАСЗ-3000 (1651) наблюдается примерно на 23 странице
Минимальный УАСЗ-3000 (1444) наблюдается примерно на 39 странице
Рост АСЗ книги № 65845: Загадки русского заполярья (Иосиф Ольшаницкий)

Буквы и знаки препинания
Всего букв 179193 букв
Всего знаков препинания 8086 знаков

Знак Количество (шт.) Среднее количество на 1000 слов (шт.)
, запятая 3890 118.52
. точка 2909 88.63
- тире 177 5.39
? вопросительный знак 76 2.32
! восклицательный знак 64 1.95
... многоточие 0 0.00
!.. восклицательный знак с многоточием 1 0.03
?.. вопросительный знак с многоточием 0 0.00
!!! тройной восклицательный знак 0 0.00
?! вопросительный знак с восклицанием 10 0.30
" кавычка 0 0.00
() скобки 612 18.65
: двоеточие 257 7.83
; точка с запятой 90 2.74
Буква Количество (шт.) Частота использования (в %)
А 13481 7.52
Б 2448 1.37
В 9515 5.31
Г 3287 1.83
Д 4485 2.50
Е-Ё 15093 8.42
Ж 3287 1.83
З 3538 1.97
И-Й 16584 9.25
К 7326 4.09
Л 6926 3.87
М 5775 3.22
Н 11533 6.44
О 20018 11.17
П 4212 2.35
Р 9103 5.08
С 10934 6.10
Т 9632 5.38
У 3934 2.20
Ф 591 0.33
Х 2436 1.36
Ц 705 0.39
Ч 2515 1.40
Ш 1133 0.63
Щ 582 0.32
Ь-Ъ 2695 1.50
Ы 3444 1.92
Э 905 0.51
Ю 922 0.51
Я 3750 2.09
Диаграмма использования букв книги № 65845: Загадки русского Заполярья (Иосиф Ольшаницкий)

Части речи
Определенных частей речи (ОЧР) 32230 слов
Не определенных частей речи (НОЧР) 591 слов

Часть речи Количество (шт.) % в тексте (принимая ОЧР за 100%)
Существительное 11823 36.683
Глагол 1423 10.723
Местоимение-существительное 1423 4.415
Предлог 4049 12.150
Союз 2426 8
Прилагательное 4049 12.563
Наречие 1606 4.983
Местоимение-прилагательное 1442 4.474
Частица 1389 4.310
Местоименное наречие 450 1.396
Числительное 110 0.341
Числительное-прилагательное 87 0.270
Междометие 25 0.078
Часть композита - сложного слова 28 0.087

Биграммы частей речи
В таблице показаны частоты словопар типа «глагол+существительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

Существительное Глагол Местоимение-существительное Предлог Союз Прилагательное Наречие Местоимение-прилагательное Частица Местоименное наречие Числительное Числительное-прилагательное Междометие Часть композита - сложного слова
Существительное 129.13 42.63 12.44 55.20 36.61 42.07 15.64 13.74 11.23 5.58 0.68 0.99 0.59 0.25
Глагол 24.08 11.70 5.34 23.77 8.78 12.35 7.14 5.74 5.24 2.26 0.53 0.22 0.03 0.06
Местоимение-существительное 11.57 7.82 1.68 2.79 4.65 4.62 3.88 1.18 4.96 0.68 0.12 0.16 0.00 0.03
Предлог 57.96 2.82 10.92 2.64 2.45 26.34 2.45 12.91 0.50 0.31 1.09 0.84 0.00 0.28
Союз 19.27 9.00 4.62 11.14 4.56 8.41 5.65 3.85 6.64 1.80 0.22 0.09 0.00 0.03
Прилагательное 85.79 4.41 1.64 9.71 7.11 11.20 2.17 1.15 1.40 0.71 0.09 0.12 0.09 0.03
Наречие 5.80 12.60 1.77 6.45 3.97 6.83 5.86 1.68 4.25 0.50 0.06 0.00 0.03 0.03
Местоимение-прилагательное 19.55 2.95 3.07 2.58 2.42 6.30 1.95 1.64 3.16 0.62 0.19 0.22 0.00 0.09
Частица 7.85 10.64 1.30 5.74 2.26 4.96 3.38 2.36 3.04 1.18 0.28 0.03 0.00 0.06
Местоименное наречие 1.43 2.36 1.30 0.96 2.08 1.05 1.52 0.28 2.61 0.28 0.06 0.03 0.00 0.00
Числительное 2.26 0.06 0.03 0.06 0.19 0.47 0.09 0.19 0.00 0.03 0.03 0.00 0.00 0.00
Числительное-прилагательное 1.46 0.12 0.00 0.34 0.16 0.40 0.09 0.03 0.03 0.00 0.06 0.00 0.00 0.00
Междометие 0.37 0.06 0.03 0.09 0.03 0.12 0.00 0.00 0.03 0.00 0.00 0.00 0.03 0.00
Часть композита - сложного слова 0.28 0.06 0.00 0.03 0.00 0.50 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00

Части речи на позициях в предложении
Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предложения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»

Номер слова в предложении
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Существительное 30.47 37.91 36.03 34.94 34.85 36.25 33.67 35.12 33.57 34.76 35.13 37.77 34.53 32.69 32.13 36.14 34.26 39.55 36.19 34.17
Глагол 8.37 10.49 13.52 13.19 12.08 11.87 13.31 12.89 12.54 11.39 10.49 10.18 10.42 11.54 10.17 9.91 8.93 11.25 11.23 9.85
Местоимение-существительное 5.22 7.21 4.81 4.25 3.34 4.15 3.60 4.27 4.05 5.19 3.56 4.21 2.53 4.69 3.85 4.15 4.39 5.63 3.21 4.83
Предлог 18.14 9.19 12.78 12.51 11.96 12.64 11.74 11.80 13.40 12.81 12.32 12.13 13.68 12.80 16.13 11.91 12.15 12.06 11.23 15.44
Союз 8.46 6.00 6.02 6.40 6.62 7.98 8.35 8.04 9.58 7.12 8.03 8.51 7.47 8.69 6.45 8.43 8.49 6.91 8.38 7.92
Прилагательное 11.03 11.17 11.83 13.14 13.30 12.64 13.24 12.60 12.69 12.48 15.15 12.04 13.58 13.03 14.02 13.12 14.35 11.25 13.01 10.81
Наречие 5.76 5.71 3.96 4.98 6.07 4.15 5.09 5.00 3.66 4.94 5.20 5.28 5.16 5.03 5.46 4.82 4.25 4.18 5.17 5.41
Местоимение-прилагательное 4.50 4.55 4.07 4.19 4.49 3.77 3.94 4.63 3.97 5.19 4.11 3.62 4.95 5.26 5.09 5.76 5.86 5.14 4.81 5.21
Частица 3.60 5.46 4.65 4.08 4.61 4.66 5.02 3.84 4.83 4.02 3.65 4.99 4.21 5.03 4.47 3.88 4.98 2.73 5.35 4.25
Местоименное наречие 3.56 1.45 1.69 1.47 1.76 1.34 1.29 0.87 0.78 1.17 1.37 0.59 2.21 0.91 1.61 0.67 1.61 0.80 0.89 0.97
Числительное 0.27 0.44 0.26 0.40 0.36 0.32 0.34 0.36 0.47 0.50 0.55 0.59 0.53 0.23 0.25 0.54 0.29 0.16 0.00 0.39
Числительное-прилагательное 0.41 0.39 0.11 0.34 0.18 0.19 0.20 0.29 0.16 0.25 0.36 0.10 0.74 0.00 0.25 0.54 0.15 0.32 0.53 0.19
Междометие 0.14 0.05 0.11 0.06 0.18 0.06 0.07 0.07 0.08 0.08 0.00 0.00 0.00 0.00 0.12 0.00 0.00 0.00 0.00 0.19
Часть композита - сложного слова 0.09 0.00 0.16 0.06 0.18 0.00 0.14 0.22 0.23 0.08 0.09 0.00 0.00 0.11 0.00 0.13 0.29 0.00 0.00 0.39