Задача РАСПОЗНАВАНИЯ ЗАВИСИМЫХ И НЕЗАВИСИМЫХ ТЕКСТОВ встречается в разных областях знания: в прикладной статистике, лингвистике, физике, генетике, историческом источниковедении и т.д. Например, применительно к источниковедению значительный интерес представляет выявление ЗАВИСИМЫХ хроник, летописей, то есть восходящих к ОБЩЕМУ ПЕРВОИСТОЧНИКУ, опирающихся на общий оригинал, быть может, не дошедший до нашего времени. С другой стороны, полезно знать - какие летописи НЕЗАВИСИМЫ, то есть опираются на существенно разные первоисточники, архивные данные.

Само понятие ТЕКСТА можно трактовать достаточно широко. Текстом может быть последовательность символов, сигналов, кодов какой-либо природы. Например, - последовательность ген-кодов в цепочках ДНК. Общая задача поиска ЗАВИСИМЫХ ТЕКСТОВ формулируется так. Нужно обнаружить в данной длинной последовательности сигналов "похожие куски", то есть фрагменты текста, повторяющие, дублирующие друг друга.

Сегодня известно много методов выявления зависимостей. Мы предлагаем некоторые новые эмпирико-статистические методы, которые могут оказаться полезными как при анализе исторических текстов, - хроник, летописей, архивных данных, - так и для поиска так называемых гомологичных фрагментов в текстах более общей природы.

Для удобства читателя мы разобьем книгу на несколько частей или тем. Это поможет надежно отделить четко установленные нами статистические факты от гипотез. В то же время такое разбиение книги на темы условно, так как в действительности они тесно переплетены.

ПЕРВАЯ ТЕМА.

а) Решается задача статистического выявления зависимых и независимых исторических текстов. Формулируются новые статистические модели, гипотезы. Они проверяются на большом экспериментальном материале конкретных исторических хроник. Оказывается, предложенные нами модели подтверждаются. Другими словами, удалось обнаружить интересные статистические закономерности, управляющие эволюцией письменной информации во времени, то есть - что происходит с летописными сведениями при их переписке, дублировании и т.д.



27 из 700