УДК 519.22 

О ПАРАМЕТРИЧЕСКОЙ МОДЕЛИ РАСПРЕДЕЛЕНИЯ ДЛИНЫ СЛОВ 

НА ПРИМЕРЕ ЛИТЕРАТУРНЫХ ТЕКСТОВ 
НА ИСПАНСКОМ, ИТАЛЬЯНСКОМ И ШВЕДСКОМ ЯЗЫКАХ

©Палий И. А., Сибирский государственный автомобильно-дорожный университет

Россия, г. Омск, paliy_ia@mail.ru

Аннотация. Исследуются закономерности, которым подчиняются относительные частоты длин слов, если разбить весь ряд относительных частот на несколько отрезков.В случае испанского языка отрезков четыре: длины 1-2 (линейная функция y=a_0+a_1 n с положительным наклоном); длины 3-5 (полином второго порядка y=a_0+a_1 n+a_2 n^2 с ветвями, направленными вверх); длины 6-11 (линейная функция с отрицательным наклоном); длины 12 и более (геометрическая прогрессия y=aq^n со знаменателем меньше 1). Здесь n – длина слова (число букв в нем).В случае итальянского языка отрезков тоже четыре: длины 1-3 и 4-6 (полиномы второго порядка с ветвями, направленными вниз); длины 7-11 (геометрическая прогрессия со знаменателем меньше 1); длины 12 и более (геометрическая прогрессия со знаменателем меньше 1). В случае шведского языка отрезков три: длины 1-3 (полином второго порядка с ветвями, направленными вверх); длины 4-6 (полином второго порядка с ветвями, направленными вниз); длины 7 и более (геометрическая прогрессия со знаменателем меньше 1). Коэффициенты уравнений – это параметры, которые можно оценить для данного текста на основании его статистических характеристик. Рассматривались пять текстов на испанском и шведском языках и шесть текстов на итальянском языке. Затем все тексты на данном языке объединялись в один текст и рассматривалось распределение относительных частот длин слов в таком объединенном тексте.

Ключевые слова: текст на испанском языке, текст на итальянском языке, текст на шведском языке, длины слов, параметрическая модель распределения длины слов.

Ссылка для цитирования:

Палий И. А. О параметрической модели распределения длины слов на примере литературных текстов на испанском, итальянском и шведском языках // Бюллетень науки и практики. Электрон. журн. 2017. №8 (21). С. 10-21. Режим доступа: http://www.bulletennauki.com/palii (дата обращения 15.08.2017). DOI: 10.5281/zenodo.842975.

ON THE PARAMETRIC MODEL OF LENGTH DISTRIBUTION

OF THE WORDS ON THE LITERARY TEXTS EXAMPLE IN SPANISH, ITALIAN AND SWEDISH LANGUAGES

©Palii I., Siberian State Automobile and Highway University, 

Russia, Omsk, paliy_ia@mail.ru

 

Abstract. We study regularities, to which the relative frequencies of the word lengths are subject, if the entire series of relative frequencies is divided into several segments.
In the case of the Spanish language, there are four segments: lengths 1-2 (linear function y=a_0+a_1 n with positive slope); Lengths 3-5 (a polynomial of the second order y=a_0+a_1 n+a_2 n^2 with branches directed upwards); Lengths 6-11 (linear function with negative slope); Length 12 and more (geometric progression y=aq^n with a denominator less than 1). Here n is the length of the word (the number of letters in it).
In the case of the Italian language, there are also four lengths: lengths 1-3 and 4-6 (polynomials of the second order with branches directed downwards); Length 7-11 (geometric progression with denominator less than 1); Length 12 and more (geometric progression with a denominator less than 1).
In the case of the Swedish language, there are three segments: lengths 1-3 (a second-order polynomial with branches pointing upwards); Length 4-6 (second-order polynomial with branches directed downwards); Length 7 and more (geometric progression with a denominator less than 1).
Coefficients of equations are parameters that can be estimated for a given text on the basis of its statistical characteristics.
Five texts in Spanish and Swedish and six texts in Italian were considered. Then all the texts in the given language were combined into one text and distribution was considered.

 

Keywords: text in Spanish, text in Italian, text in Swedish, word length, parametric model of word-length distribution.
 

Cite as (APA):

Palii, I. (2017). On the parametric model of length distribution of the words on the literary texts example in spanish italian and swedish languages. Bulletin of Science and Practice, (8), 10-21. doi:10.5281/zenodo.842975​

© 2015–20 Издательский центр НАУКА И ПРАКТИКА. Сайт создан на Wix.com