Часть2. Глава6.

Выше мы установили формальную возможность построения абстрактных конструкций, реализующих невычислимые в обычном смысле структуры. Как следствие, мы имеем возможность представления контекстно-зависимого проблемно-ориентированного языка механизмом исчисления предикатов на основе алгебры изменяющихся отношений (с некоторым уровнем потерь и искажений, как это и следует из возможностей частотного подхода).

Нам вполне достаточно самого факта этой возможности, ибо для нас этот момент преходящий. Мы идем далее к другим архитектурам машин, а сказанное – только иллюстрация предельных возможностей имеющейся. Но для корректности изложения материала мы обязаны указать и на архитектуры, расширяющие фон Неймановский подход в интересующую нас сторону. Совсем не исключено, что такого рода построения окажутся полезными на текущем этапе развития информатики.

Для “аппаратной поддержки” возможностей предикатного подхода мы можем предложить некоторый механизм, ориентированный на практическую задачу восприятия семантики информации как управления с учетом всех необходимых условий контекстного анализа и реструктуризации связей при работе со знанием.

Такой механизм обеспечения управления для системно-сложных объектов в теории ИСУ естественно назвать машиной баз знания (МБЗ), которую не надо путать с давно известными машинами баз данных (МБД).

Как известно, МБД появились достаточно давно и рассматривались как основа вычислительных систем 5-го поколения. Основанием для этого служил известный факт несоответствия фон Неймановской структуры компьютера требованиям СУБД. В частности, реализация поиска, обновление, защита данных, обработка транзакций только программным способом неэффективны как по производительности, так и по стоимости [15].

Кроме того, МБД изначально были ориентированы на реляционные модели данных, что нас не может устроить уже хотя бы потому, что реляционные и постреляционные базы не рассчитаны на обеспечение постоянного процесса реструктуризации своих связей. Соответственно, перед этими машинами не ставилась и не может быть поставлена задача работы с контекстно-зависимыми языками.

Рассмотрим некоторые возможности реализации необходимых нам машин баз знания, если угодно – машин 6-го поколения.

Из полученного при рассмотрении проблем реализуемости баз знания вывода, следует принципиальная возможность, но не процедура практического осуществления реализации работы с контекстно-зависимыми описаниями, даже и сведенными к указанному выше варианту исчисления предикатов с контекстно - изменяющимися отношениями. Поэтому мы вынуждены вернуться к материалу раздела 5.5 и строить МБЗ на основе высказанных там положений.

Однако для этого нам надо иметь достаточно гибкую структуру, на которой можно эффективно и безболезненно вести эту самую реструктуризацию, обеспечивающую реализацию поведения (принятия решения), не сводимого к конечной модели.

Исходя из сказанного, рассмотрим следующую архитектуру МБЗ (рис. 6.1):

ARB₁	Пра-	ARB₁₁	ARB₁₂	ARB₁₃	ARB₁₄	ARB₁₅	ARB₁₆	…ARB₁₇.....
ARB₂	вила	ARB₂₁	ARB₂₂	ARB₂₃	ARB₂₄	ARB₂₅	ARB₂₆
ARB₃	пре-	ARB₃₁	ARB₃₂	ARB₃₃	ARB₃₄	ARB₃₅	ARB₃₆	ARB₃₇
ARB₄	обра-	ARB₄₁	ARB₄₂	ARB₄₃	ARB₄₄
ARB₅	зова-	ARB₅₁	ARB₅₂	ARB₅₃	ARB₅₄	ARB₅₅	ARB₅₆	ARB₅₇
…	ния	…
ARB_n		ARB_n1	ARB_n2	ARB_n3	ARB_n4	ARB_n5	…

Машина состоит из необходимого числа n отдельных модулей, на вход каждого из которых после преобразования входной текстовой посылки в язык предикатов поступает тройка вида (ARB)_i , iI 1…n для ее последующего непосредственного раскрытия по законам, приведенным в примере раздела 3.7.

В связи с тем, что число законов преобразования невелико, здесь эффективно использование динамически образующейся матрицы вида, приведенного на рис.6.1. Строки этой матрицы соответствуют не только порядку преобразования входных предикатов, но и составляют таблицу всех формально-логических отношений, использованных в текущей информационной посылке. К каждой следующей операции приема входной информации машина переходит в состояние готовности принять входные сигналы на отдельные входы, для чего в процессе поступления сигнала формируется очередная матрица.

Выходным сообщением каждого модуля является набор расширяющих входной текст предикатов вида ARB_i,l, iI 1…n, lI 1…k. , содержащий в себе все возможные логические преобразования исходного предиката. В связи с тем что этот процесс существенно параллелен, возможна организация каждого отдельного модуля как параллельной машины. В некотором смысле такой модуль является не только конечным автоматом, но и нейроном, имеющим несколько входов и множество выходов, соответствующее числу новых предикатов, полученных из входной посылки.

Несколько входов полезно предусматривать и для получения выводов “второго порядка” – выводов следующих из совокупной оценки нескольких различных входных предикатов. Ясно, что тем самым модули получают полную универсальность и могут по мере окончания своей работы на первом уровне преобразования использоваться на втором, а если надо – то и последующих уровнях.

6.2. Параллельные вычисления с управлением от потока данных

Сравним возможности машины фон Неймановской архитектуры и МБЗ применительно к предикатному варианту механизма обработки контекстно-зависимого языка.

В первой мы имеем классический вариант архитектуры составных частей, ориентированный на программно-алгоритмическую организацию процесса работы с данными. Это существенно последовательная машина с известными проблемами отладки и конечной вычислимости процесса. Последнее связано с тем, что проблемы оценки его рекуррентности или рекурсивности вносят существенные ограничения на применимость такой машины для рассматриваемых задач управления.

В МБЗ входная информация является и управлением и, одновременно, командой для организации действий по ее обработке. Это достаточно естественно, ибо речь идет о входном языке контекстно-зависимого уровня. При желании говорить в терминологии алгоритмов здесь можно сказать, что алгоритм работы явно задан в обрабатываемой контекстно-зависимой записи.

Однако будем помнить: входная информация может существенно изменить структуру конечного автомата и потребовать всех действий, необходимость которых показана при рассмотрении проблемы устойчивости. Тем не менее, здесь возможно введение логического критерия останова (например, по глубине преобразования предикатов) и поэтому процедура обработки записи конечна. МБЗ существенно параллельная машина со всеми вытекающими из этого полезными возможностями для обработки данных и связей между ними.

Отметим, что МБЗ внешне представляющаяся конечным автоматом, в каждый конкретный момент времени изменяет свою структуру под воздействием входного потока информации, реализуя тем самым указанный выше случай моделирования в частотном смысле нерекурсивных объектов при ситуации “несводимости к конечной модели, но конечной моделируемости в частотном смысле”.

Этот достаточно простой по звучанию тезис заключает в себе на самом деле целый спектр фундаментальных положений. По существу это неявно высказанное положение о существовании “инженерного” или “механистического” интеллекта, некоторого “псевдоразума”, способного не только обучаться, но и “обучаться обучению”. На самом деле пока именно это мы и хотим, ставя задачу создания МБЗ, а остальные свойства интеллекта, например, свободу воли считаем “излишними” для такой системы.

Действительно, как-то неуютно оказаться в зависимости от некоторой машины, которая сильно “облегчает нам жизнь”, но в обмен на это мы будем вынуждены считаться с тем, что она имеет “свою собственную трактовку” полученных ей данных, “свое понимание предмета”. Иначе говоря, создавая МБЗ мы желаем создать нечто, способное к пониманию, но хотим априори избавить себя от обязанности взаимопонимания.

Рассмотрим чисто инженерные аспекты такого подхода, сформулируем в явном виде, что же мы хотим от “инженерного” интеллекта в целом и от его компонентов. В первую очередь нужно обратить внимание на неявные формулировки очень сильных требований, по существу определяющих саму возможность постановки задачи создания МБЗ.

Формулировка “управление от потока данных” на самом деле предусматривает, что “поток данных” как раз и содержит в себе некоторые структуры, “вылавливание” и правильное использование которых позволит получить от МБЗ способность к “самоструктурированию”, самоорганизации.

Т.е. предполагается фундаментальное отличие феномена, называемого “поток данных”, от потока в классическом понимании потоковых систем. В последних поток предполагается по умолчанию некоторой бесструктурной сущностью, структуры же возникают из взаимодействия потока с границами, поверхностями раздела различных сред. Так, например, поток в задачах теплопроводности – нечто априори, по определению бесструктурное, “поток данных” – напротив, подразумевает наличие некоторых скрытых структур, но априори неизвестных, которые и надлежит идентифицировать и использовать.

Нельзя обойти вниманием и сугубую произвольность термина “самоструктурирование”, все чаще употребляемому в работах, связанных с проектированием информационных баз, т.е., в конечном счете, и с МБЗ. Резонно возникает вопрос “самоструктурирование к чему”? К какой модели или структуре? Некоторым исследователям достает мужества признать объективность существования некоторой “естественной структуры проблемной области”, однако это пока не более, чем благое пожелание нахождения таковой. Правда, следует отметить, пожелание далеко не беспочвенное.

Действительно, например, массовые химические формулы частично объективно отображают свойства химических соединений, структурные формулы адекватны топологии (но не геометрии) расположения атомов в молекулах, структура механики Ньютона частично адекватна всей структуре современной физики и другое. Есть достаточные основания предполагать существование общих законов взаимодействия структур, охватывающих не только физические (энергетические), но и информационные явления и вообще все сущности, “имеющие быть во Вселенной”. Впрочем эта группа вопросов рассматривается в последующих частях книги.

Наконец, остается группа проблем, которую можно обозначить как задачу поиска и проектирования адекватных моделей данных и реализации этих моделей в некоторых физических структурах МБЗ.

Попробуем сформулировать требования к модели данных и ее реализации как инженерные, в конкретной форме, но при этом не снижая уровня обобщения, так, чтобы не уничтожить сущность задачи. Для этого достаточно последовательно перебрать все требования и к самой “обобщенной модели данных”, и к реализуемости этой модели в некоторых физических структурах, т.е. требования к возможности отображения некоторой абстрактной структуры МБЗ на физическую реализацию, архитектуру конкретной физической машины.

Здесь, как уже отмечалось выше, нас интересуют случаи “конечно-моделируемые, но с невычислимым априори числом шагов”, поскольку условие существования соответствующего преобразователя предикатов записывается в виде набора послеусловий (постусловий). В смысле реализации это автоматически означает, что “абстрактная модель данных” может быть представлена, в общем случае, как виртуальная структура, по принципу своего устройства не связанная с физическими (числовыми) параметрами реализации. Тем более, вся структура МБЗ не может быть иначе как виртуальной.

Но реализация любой конкретной прикладной задачи все равно потребует отображения на физическое адресное пространство. Отсюда вытекает требование: структуры “собственно данных”, т.е. способы (возможно и один, но универсальный способ) адресации должны быть инвариантны к отображаемой абстрактной модели данных. С учетом физической реализуемости это означает, что затраты на реализацию способа адресации должны “почти всегда (кроме “множества нулевой меры” случаев) не возрастать быстрее, чем объем отображаемых данных”{96. На самом деле потеря эффективности адресации единственная до сих пор известная причина саморазрушения информационных систем. Дешевле становится построить новую систему, чем поддерживать неэффективный механизм. Этот аспект отождествляют с проблемой “уборки мусора”, идентификации и уничтожения неэффективных структур. Однако это не в точности то же самое, неэффективные структуры должны появляться в любой системе такого рода, коль скоро мы признали за ними “право на ошибку”.}.

Необходимо выделить и следующий аспект, даже не столько как прямое “требование”, сколько как “подсказку” для дальнейшего анализа проблемы. Условия частотной реализации преобразователя предикатов, т.е. МБЗ, которая, скажем пока так – “может больше, чем традиционная СУБД” имеют вид некоторых перечислений предикатов второго порядка, но существенно, “не в целом”, а на каждом конечном отрезке времени.

Это означает, что таблица на рис. 6.1 представляет только состояние МБЗ на некотором “элементарном такте” ее существования, для представления ее на конечном отрезке времени потребуется уже как минимум иерархия из 3-х уровней таблиц предикатов. То есть, помимо таблицы на рис. 6.1 необходимо еще два уровня “описания условий применения”. Впрочем это факт в известной степени очевидный.

МБЗ “в целом” представляет собой целостную иерархическую систему динамических процессов. Отсюда напрямую следует вывод – к таким системам не допустимо применение механического принципа декомпозиции, во всяком случае его использование, так, как это принято в классической теории управления. Здесь необходимо найти представление, охватывающее всю совокупность динамических процессов “вложенных друг в друга”{97. Напомним еще раз, что в условия конечной частотной вычислимости входят только перечисления теории второго порядка, но не теория третьего порядка.}.

Завершим этот экскурс в вопросы реализуемости МБЗ следующим. Из соображений чисто вычислительных архитектуры адресных, т.е. по существу фон Неймановских машин будут доминировать на рынке, возможно, еще не одно десятилетие. Это означает, что вопрос отображения структуры МБЗ на адресную архитектуру будет оставаться актуальным, но, учитывая нетривиальность проблемы, его исследование – отдельная инженерная задача. Иначе говоря, пока существуют адресные машины, вопросы разработки моделей данных будут представлять собой проблему, дополняющую задачу поиска адекватных структур МБЗ, но никак ей не эквивалентную.

Из сказанного получается, что текущей задачей разработки архитектур вычислительной техники на достаточно длительный отрезок времени является ориентация на МБЗ. Поэтому ниже, в гл. 8, мы рассмотрим некоторые особенности реализации проектов информационных систем, оказавшиеся де-факто “достаточно хорошими приближениями к МБЗ”.

Обратим внимание на следующий момент. Конечно, сегодняшние реальные “саморазвивающиеся” информационные системы (технологии, модели данных) называются так, скорее, в порядке аванса на их будущее совершенствование. На самом деле, о способности к саморазвитию пока речи не идет, этим обозначается лишь достаточная гибкость моделей данных и наличие инструментария для управления развитием этих моделей. Но отсюда следует сразу и реальная постановка задачи саморазвития, и постановка задачи создания архитектуры машин уже следующего поколения.

В постановке задачи о создании “следующей по архитектуре машины, после МБЗ” мы хотим уже большего, способности некоторой машины действительно самостоятельно конструировать структуры данных и свою общую структуру. Можно сказать, что мы хотим перехода к “живым” системам, обладающим если не “свободой воли”, то, по крайней мере, “стремлением выжить”. Такого рода “следующую новую архитектуру” мы рассмотрим в части IV под названием “Вертикальная машина”.