Задачка. Набросок

Feb 21, 2018 17:30

Для простоты используем русский алфавит. Сгруппируем согласные и гласные по группам:

1.
а.) Б, П, В, Ф;
б.) Г, K, Х, Ж
в.) Ц, Ч, Ш, Щ
г.) З, С
д.) Д, Т
е.) Л
ж.) М
з.) Н
и.) Р

2.
а) А, Я, Е, Ё, Э, О, И, Ы, Й
б) У, Ю

Пусть условно мы получили 9 согласных и 2 гласных звука. А теперь в корнях слов рассмотрим открытые слога CV. Всего 18 смежных классов.

Возьмем ДВА языка. Пусть словарь каждого языка состоит всего из 180 слов, тогда для простоты положим, что в каждом классе оказывается по 10 слов.

Какова вероятность совпадения слов по звучанию-форме (открытым слогам) и значению?

В нашем случае мы имеем дело с гипергеометрическим распределением.

Hypergeometric distribution for parameters N = 180, D = 10, n = 10:
0 0.556078781908773
1 0.345390547769424
2 0.086347636942356
3 0.011301122217404
4 0.000844138702215
5 0.000036835143369
6 0.000000924576892
7 0.000000012654602
8 0.000000000084741
9 0.000000000000223
10 0.000000000000000

Какова вероятность такого события для 6 слов? 0.000000924576892 ~ одна миллионная.

В жизни, конечно, все сложнее.

А если у нас словари из 1080 слов? Тогда ~ одна миллионная при 14 совпадениях:

Hypergeometric distribution for parameters N = 1080, D = 60, n = 60:
0 0.029313196650337
1 0.109810101915933
2 0.198674098112974
3 0.231339448270005
4 0.194922683461942
5 0.126689644629357
6 0.066120803140753
7 0.028484009744192
8 0.010332074298997
9 0.003203523552860
10 0.000859006676391
11 0.000201059516054
12 0.000041387508406
13 0.000007538684431
14 0.000001221249187
15 0.000000176694925
16 0.000000022912860
17 0.000000002670799
18 0.000000000280522
19 0.000000000026603
20 0.000000000002282
21 0.000000000000177
22 0.000000000000012
23 0.000000000000001

А если считать не только для открытых слогов CV, а для, например, CVC? Число классов резко увеличится и сомнительно, что можно найти хотя бы 3 случайных совпадения.

Даже в нашем случае c 9-ю согласными и 4-мя гласными  уже при 4 совпадениях вероятность составит ~ одну миллионную. При пяти ~ одну миллиардную.

Hypergeometric distribution for parameters N = 180, D = 5, n = 5:
0 0.867214408312659
1 0.126785732209453
2 0.005897010800440
3 0.000102260302898
4 0.000000587702890
5 0.000000000671660

Для словаря из 1080 слов вероятность ~ одна миллионная возникнет уже при 8 совпадениях.

Hypergeometric distribution for parameters N = 1080, D = 30, n = 30:
0 0.424496587113459
1 0.374188960237133
2 0.153959352034946
3 0.039330117952231
4 0.006999916012494
5 0.000923305995014
6 0.000093740455959
7 0.000007510711174
8 0.000000483118460
9 0.000000025248821
10 0.000000001081042
11 0.000000000038129
12 0.000000000001111
13 0.000000000000027
14 0.000000000000001
15 0.000000000000000

======================================

Один известный специалист по Теории Вероятностей и Комбинаторике сказал:

«Случайное совпадение внешних оболочек двух слов может соединиться со случайным совпадением их значений. В самом деле, случайных созвучий в языках так много, что по элементарным законам теории вероятностей в какой-то их доле непременно окажутся близкими также и значения созвучных слов. Таких примеров немного, но всё же они существуют.»
Previous post Next post
Up