Главная > Математика > Наука и теория информации
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

4. Некоторые эксперименты

Для получения более подробных данных предложена игра: берется предложение и участнику, не знающему предварительно предложения, предлагается угадывать буквы (включая интервалы), начиная с первой. После каждой попытки дается ответ «да» или «нет», и игра продолжается. Число попыток для каждой буквы записывается, суммируется и делится на общее число букв в предложении. Это дает число двоичных единиц на букву, так как каждое угадывание с ответом «да» или «нет» представляет как раз одну двоичную единицу информации.

Некоторые примеры такого рода были опубликованы Шенноном. В одном предложении из 102 букв общее число попыток, потребовавшееся для восстановления предложения, составило 198. Это соответствует 1,94 дв. ед. на букву.

В другом примере правила игры были иные. После каждого угадывания давался ответ «да», если буква была угадана правильно, в противном случае сообщалась действительная буква. В предложении из 129 букв 89 были угаданы правильно, а 40 были сообщены. Пользуясь информацией , равной 4 дв. ед. на букву (как указано ранее), можно получить общее число двоичных единиц

или 1,93 дв. ед. на букву.

Третий пример дает около 1,9 дв. ед. на букву. Число 1,9 должно рассматриваться как завышенное значение, так как во многих случаях угадываемые буквы были очевидны, и правильное угадывание, сопровождаемое утвердительным

ответом, едьа ли могло считаться за реальную единицу информации.

На рис. 3.2 представлен данный Шенноном график, на котором число дв. ед. на букву отложено как функция числа букв, вплоть до 15 букв, с экстраполяцией до 100 букв.

Рис. 3.2. Число двоичных единиц на букву, построенное как функция числа букв до 15 букв с экстраполяцией до 100 букв.

Принимая экстраполированное значение 1,4 дв. ед. на букву и сравнивая его с на букву, мы видим, что английский язык имеет значительную избыточность.

По-видимому, возможно сокращение раза в три, которое могло бы сделать язык более точным. Нужно, однако, учитывать и другие соображения, как, например, разборчивость и возможность понимания речи при наличии шума.

<< Предыдущий параграф Следующий параграф >>
Оглавление