Читаем Одна формула и весь мир полностью

Пример V. Чтобы определить энтропию фраз № 3 и № 4, необ­ходимо учитывать не только вероятности отдельных букв, но и веро­ятности их сочетаний. Для реальных текстов эта задача становится настолько сложной, что приходится применять приближенные методы расчета, описанные подробно и доступно в книге А. М. Яглома и И. М. Яглома «Вероятность и информация» (глава 4). Приближенное значение энтропии реальных текстов составляет около 1 бита на букву.


Уменьшение энтропии реальных текстов по сравнению с фразой № 1 обусловлено тем, что в структуре реального текста содержится информация всех грамматических и фонетических правил русского языка. Разность между энтропией реального текста Нр = 1 бит на букву и максимальной энтропией фразы № 1, Hmax= 5 бит на букву — это и есть количество информации Iп, содержащейся в грамматических и фонетических правилах, которым подчиняются реальные тексты. Таким образом:

                                                         = 4 бита на букву.

Этого количества информации оказывается достаточно для того, чтобы представленную фразой № 1 абракадабру превратить в осмысленный текст.

Специалисты по телефонной, телеграфной и радиосвязи называют информацию грамматических и фонетических правил избыточной информацией. Почему? Это не так уж сложно понять.

Дело в том, что специалистов, проектирующих системы связи, письменные тексты интересуют только с одной точки зрения: как с помощью этих текстов передать по каналу связи при минимальной затрате энергии и в максимально короткий срок наибольшее количество новостей?

Мы только что выяснили, что в структуре реальных текстов содержится информация грамматических и фонетических правил.

Является ли эта информация для получателя новой? Нет, разумеется. Надо думать, что правила грамматики он усвоил еще на школьной скамье. А раз так, решили специалисты по связи, значит, информация эта избыточна и лучше по мере возможности не загружать ею канал. Приняв точку зрения специалистов по теории информации и технике связи, взглянем еще раз на фразы нашей таблицы.

Фраза № 1 и проделанный для нее расчет энтропии показывают, что наибольшая неопределенность появления буквы составляет 5 бит на букву. Расчеты, проделанные для фразы № 4 и других реальных текстов, показали, что неопределенность (непредсказуемость, неожиданность) появления каждой буквы в реальных текстах уменьшается до 1 бита за счет упорядоченности, обусловленной правилами, по которым строится всякий реальный текст.

Другими словами, неожиданность сообщений для знакомого с правилами грамматики и фонетики адресата уменьшается на 80 процентов, так как 80 процентов содержащейся в тексте информации не является для него неожиданной, новой. Так стоит ли загружать такой информацией дорогостоящий телеграфный или телефонный канал?

Специалисты решили: не стоит. И стали искать способы, позволяющие уменьшить этот «избыточный груз».

Например, получив сообщение ТЬС, можно безошибочно предугадать, что дальше последует буква Я. Почти с полной уверенностью можно предсказывать, что вслед за сочетанием КИ появится либо Й, либо М, либо X, либо Е. А если учесть еще связь между передаваемым словом и предыдущим, то можно сказать уже без всяких сомнений, какая буква последует после сочетания СКИ. Если до этого было слово ЯЩИК, а потом пришло сочетание ГРОМОЗДСКИ, то вполне очевидно, что следом появится Й. А если раньше было получено слово ВЕЩЕЙ, то после СКИ появится X и т. п.

Исходя из того, то многие буквы передаваемых текстов можно предсказывать до их получения, создатели теории информации задались вполне законным вопросом: может быть, для экономии времени и энергии эти буквы можно совсем не передавать?

Методами теории вероятностей и статистики были исследованы разнообразные сообщения: тексты, телеграфные коды, радио- и телесигналы и т. д. Оказалось, что все они обладают значительной долей избыточной информации, то есть той информации, которую можно предсказывать еще до ее получения или вообще не передавать по каналам связи, сохранив при этом возможность восстановить на приемном, конце полный текст.

Но тут мы должны отвлечься от задач техники связи и передачи сообщений, чтобы обратить внимание на одно очень важное обстоятельство: та информация, которая оказывается избыточной для техники связи, вовсе не будет излишней для самого языка.

В самом деле: лишите-ка вы текст той избыточной информации правил (Iп = 4 бита на букву), благодаря которой буквы следуют друг за другом в определенном порядке. Что тогда станет с текстом? Вполне очевидно: он тут же рассыплется, перемешает между собой все свои буквы, превратится в абракадабру, подобную фразе № 1.

Перейти на страницу:

Похожие книги

Гиперпространство
Гиперпространство

Инстинкт говорит нам, что наш мир трехмерный. Исходя из этого представления, веками строились и научные гипотезы. По мнению выдающегося физика Мичио Каку, это такой же предрассудок, каким было убеждение древних египтян в том, что Земля плоская. Книга посвящена теории гиперпространства. Идея многомерности пространства вызывала скепсис, высмеивалась, но теперь признается многими авторитетными учеными. Значение этой теории заключается в том, что она способна объединять все известные физические феномены в простую конструкцию и привести ученых к так называемой теории всего. Однако серьезной и доступной литературы для неспециалистов почти нет. Этот пробел и восполняет Мичио Каку, объясняя с научной точки зрения и происхождение Земли, и существование параллельных вселенных, и путешествия во времени, и многие другие кажущиеся фантастическими явления.

Мичио Каку

Физика / Образование и наука
Беседы
Беседы

Представляем читателям книги бесед специалиста по глобальной экологии, математической геологии и быстропротекающим геофизическим явлениям, доктора геолого-минералогических наук, кандидата физико-математических наук, главного научного сотрудника Объединенного института геологии, геофизики и минералогии СО РАН А. Н. ДМИТРИЕВА и журналиста А. В. РУСАНОВА.В сборник вошли беседы: «Неизбежность необычного» (1991), «Сумерки людей» (1995), «Про возвестия, про рочества, про гнозы» (1997), «Космические танцы перемен» (1998) и «Пришествие эпохи огня» (2004)

Александр Иванович Агеев , Эпиктет , Алексей Николаевич Дмитриев , Анатолий Вениаминович Русанов , святитель Василий Великий , А. В. Русанов

Экономика / Физика / Прочее / Эзотерика, эзотерическая литература / Античная литература / Биология / Эзотерика / Образование и наука / Финансы и бизнес
Физика для всех. Движение. Теплота
Физика для всех. Движение. Теплота

Авторы этой книги – лауреат Ленинской и Нобелевской премий академик Л.Д. Ландау и профессор А.И. Китайгородский – в доступной форме излагают начала общего курса физики. Примечательно, что вопросы атомного строения вещества, теория лунных приливов, теория ударных волн, теория жидкого гелия и другие подобные вопросы изложены вместе с классическими разделами механики и теплоты. Подобная тесная связь актуальных проблем физики с ее классическими понятиями, их взаимная обусловленность и неизбежные противоречия, выводящие за рамки классических понятий, – все это составляет сущность современного подхода к изучению физики. Новое, свежее изложение делает книгу полезной для самого широкого круга читателей.

Александр Исаакович Китайгородский , Лев Давидович Ландау

Научная литература / Физика / Технические науки / Учебники / Образование и наука
Битва в ионосфере
Битва в ионосфере

После Второй мировой войны знаменитый англичанин Уинстон Черчилль сказал, что радиолокация стала одним из величайших достижений человечества XX века. Открытие советским ученым Николаем Кабановым эффекта рассеяния земной поверхностью отражённых ионосферой коротких радиоволн, сделанное в 1947 году, позволило существенно расширить границы применения радиолокации. Он первым в мире показал потенциальную возможность ведения загоризонтной радиолокации, позволяющей обнаруживать цели на дальностях до нескольких тысяч километров. Однако долгие годы реализация научного открытия Кабанова оставалась неразрешимой технической задачей. Первыми дерзнули ее решить в начале 60-х годов минувшего столетия советские ученые Ефим Штырен, Василий Шамшин, Эфир Шустов и другие конструкторы. Создать же реальную боевую систему загоризонтной радиолокации, которая была способна обнаруживать старты баллистических ракет с ядерным оружием с территории США, удалось только в 70-х годах XX века коллективу учёных под руководством главного конструктора Франца Александровича Кузьминского. Однако из-за интриг в Минрадиопроме он незаслуженно был отстранён от работы. Ему не удалось доработать боевую систему ЗГРЛС. В начале 90-х годов разработчики и заказчики из Минобороны СССР-РФ подверглись необоснованным нападкам в советской, а затем в российской прессе. Они были обвинены в волюнтаризме и разбазаривании огромных бюджетных средств. Военный журналист подполковник Александр Бабакин еще в 1991 году в одной из публикаций опроверг эти обвинения. «Ветеран боевых действий», Лауреат премии союза журналистов Москвы, полковник запаса Александр Бабакин 18 лет вел расследование трагедии и триумфа отечественной загоризонтной локации. В документальной книге-расследовании даются ответы на многие вопросы противостояния между СССР-РФ и США в области создания систем предупреждения о ракетном нападении.

Александр Бабакин

История / Физика / Технические науки / Образование и наука