Главная > Математика > Наука и теория информации
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

5. Алфавитное кодирование слов

Другой способ кодирования слов основан на применении букв. Если мы кодируем слова двумя буквами: , то всего может быть закодировано слов, что дает на слово, так как алфавит из 26 букв дает 4,7 дв. ед. на букву. Это соответствует словарю Basic English. Для большей гибкости языка мы можем применить трехбуквенные кодовые слова, что дает слов, т. е. очень большой словарь без избыточности, дающий на слово. Оба примера показывают, какова избыточность при обычном начертании слов, требующем в среднем по 5,5 буквы на слово вместо двух или трех букв, как в этих новых кодах. Конечно, кодированные слова обычно невозможно произнести.

Менее эффективный код, содержащий примерно 10 000 слов, был составлен Луном (P. Luhn) из Корпорации IBM. Этот код применяет произносимые трех- и четырехбуквенные слова, оканчивающиеся таким образом, что разделительного знака между словами не требуется. Получается практичный код, дающий примерно 3,8 буквы на слово, вместо 5,5, требуемых в английском языке.

<< Предыдущий параграф Следующий параграф >>
Оглавление