Сайт Информационных Технологий

СТРУКТУРНО-ГРАФИЧЕСКИЙ АНАЛИЗ КАК МЕТОД ИЗУЧЕНИЯ СТРУКТУР МНОГОМЕРНЫХ ДАННЫХ.

С.В.Романов

Санкт-Петербургский Государственный электротехнический университет “ЛЭТИ” им. В.И.Ульянова (Ленина)

e-mail:svromanov@eltech.ru

AbstractIn the present work the approach to analysis of multidimensional data structures are described. The main idea of this approach is based on interactive analysis of the graphic images of two-dimensional data structures patterns. Using the methods of nonlinear mapping one can make the decisions about the multidimensional data structures.

В практике медицинских и биологических исследований использование в полной мере достоинств автоматизации сбора, обработки и интерпретации информации связано с необходимостью установления достоверности исходных априорных представлений, принимаемых исследователем и используемых им в информационно-эвристических моделях, на которых строятся алгоритмы обработки. Активное вмешательство человека в вычислительный процесс позволяет сделать его более гибким, адаптирующимся к решаемой задаче, и дает возможность эффективнее использовать творческие способности человека. Постановка проблемы согласования характеристик биологических и технических звеньев, включенных в единую систему, является главной в теории синтеза биотехнических систем, в основу которой положены бионические исследования свойств биологических объектов различной сложности с целью их адекватного сопряжения с техническими устройствами в единые комплексы (1).

Интерактивный подход к анализу экспериментальной информации становится желательным всякий раз, когда исследователь сталкивается с большим объемом экспериментальных данных, аналитические и статистические свойства которых должны быть изучены в реальном масштабе времени. Особенно это касается анализа структуры данных в многомерном пространстве параметров (признаков), а также анализа совокупности изучаемых событий и ситуаций, по которой необходимо принимать определенные решения. В таких задачах человеку следует предоставить руководящую роль в интерпретации экспериментальных данных, в суждении, прогнозе, выработке управляющих команд, а вычислительной машине можно поручить выполнение рутинных вычислений, накопление данных, преобразование их в различные формы и представление исследователю обобщенных параметров и т.д. При этом мощность вычислительной техники расходуется как на выполнение отдельных этапов обработки, так и на представление информации исследователю на этапах ее изучения, выработки решений по дальнейшей обработки и интерпретации результатов.

Задача представления экспериментальных данных в виде изображений на различных этапах интерактивного режима анализа числовых таблиц является одной из важнейших. Такие изображения часто являются единственной информационной моделью изучаемого явления или объекта. От полноты и ясности их содержания зависят верность суждений, прогностическая ценность выводов, скорость и надежность принятия решений. Изображение на экране дисплея должно быть синтезировано по некоторому информационному описанию (например, по таблице образов данных ), не являющемуся исходно изображением, что позволяет рассматривать синтезируемое изображение как информационный образ этого описания.

Само изображение в вычислительной системе обработки информации может выполнять различные функции. В соответствии с назначением изображения строится последовательность информационных преобразований для его формирования.

Как показывают психологические исследования, человеку трудно правильно представить себе даже трехмерный образ без какой-либо подсказки.

Хорошо известно, что способность зрительного анализатора по переработке и распознаванию изображений наиболее полно раскрывается при графических методах кодирования информации. В этих случаях глаз человека уверенно обнаруживает пространственные и временные изменения данных, которые трудно выявляются математическими методами. Адекватной формой представления данных в виде изображения являются скопления точек, семейства графиков, контурные рисунки, сюжетные картины. Человек имеет несомненные преимущества перед автоматическими устройствами и ЭВМ при распознавании некоторых видов структур, особенно типа точечных “скоплений” (кластеров).

Интерактивное распознавание многомерных эмпирических данных по их графическому образу, прежде всего, предполагает их упорядочение и группировку, что позволяет уже на первом этапе анализа высказать гипотезы о наличии и характере некоторых закономерностей в исследуемых множествах данных. Критерии для такого упорядочения часто заранее не заданы или формируются в самом общем виде как наличие определенной схожести в свойствах изучаемых объектов и событий, одинаковости их проявлений и т.п. Результат упорядочения – выделение классов наблюдений, для каждого из которых характерно некоторое общее свойство или группа свойств, по которым эти наблюдения (объекты, состояния, явления, параметры и т.п.) однородны. Состав классов, отношения между ними, а также между элементами, их образующими, и определяют структуру исходных данных.

Таким образом, основным постулатом структурно-графического анализа является гипотеза о возможности вынесения исследователем суждений о структурах многомерных данных по визуальному анализу точечных структур из образов. Структурно-графический анализ – это совокупность последовательности действий человека и ЭВМ, сводящихся к следующему:

- формированию на исходной таблице многомерных структур данных с целью установления связей между элементами таблицы (объектами ; параметрами ) и описаниями множества исходных структур данных , ( и – частные структуры “объектов” и “параметров”, и – локальные структуры “объекты - параметр” и “параметры - объект”, – обобщенная структура “объекты - параметры);

- отображению всего множества, либо отдельных подмножеств, структур многомерных данных , , , или обобщенной структуры в одно-, двух- или трехмерное пространства решений, адекватные восприятию человека, т.е. к построению описаний , , , , (q=1,2,3) образов структур в виде вторичных таблиц данных (2);

- построению семейств графических точечных образов анализируемого множества структур в зависимости от размерности пространства решений R и выбранных алгоритмов Q отображения ;

- выработке суждений и принято решений о структурах исходных данных на основе концептуально-эвристических представлений человека о возможных связях в изучаемых явлениях, процессах и т.п.;

- построения алгоритма решения задачи.

Если три первых действия реализуются ЭВМ под контролем и при участии исследователя, то два последних относятся полностью к прерогативам человека. Они отражают, с одной стороны, его понимание предмета исследования, с другой – осознание целей, задач обработки и распознавания данных, а также выбранную последовательность действий (своих и ЭВМ) при построении алгоритма решения задачи анализа.

Алгоритмы преобразования структур (“mapping”-алгоритмы) в зависимости от методов описания структур исходных данных , моделей , лежащих в основе их построения и графических способов представления структур образов , могут быть разбиты на несколько групп (2, 3). Выбор алгоритмов визуализации структуры многомерных данных должен осуществляться также с учетом моделей , лежащих в основе синтеза самих алгоритмов.

При геометрических моделях данных таблица представляется двояко:

- либо как совокупность векторов - объектов в пространстве параметров (признаков) ;

- либо как совокупность векторов – параметров в объектном пространстве .

Для визуализации представления числовой таблицы требуется найти такое описание образов ее элементов в виде таблицы , для которого взаимное расположение точек-образов в пространстве решения размерности (геометрическая структура данных) незначительно отличается от структуры ее элементов в исходном описании таблицы . Это условие формализуется соотношением

,

где - функционал, определяющий рассогласование структур данных в исходном пространстве описаний и в пространстве решений ; - структура исходных многомерных данных; - структура образов в пространстве визуализации ; - совокупность критериев и условий, при которых минимизируется функционал .

В качестве геометрических образов предлагается использовать точечные конфигурации. Структурные связи отображаются в пространстве решения . взаимным расположением “точек” и расстояниями между ними. Координаты точек - образов и в пространстве решений задаются числовой таблицей . Таким образом, построение геометрического образа структуры фактически сводится к преобразованию таблицы в таблицу при различных ограничениях на модели и .

Литература

1. Биотехнические системы – Теория и проектирование./ Под редакцией проф. В. М. Ахутина, ЛГУ, 1981.

2. Романов С. В. Визуализация структур многомерных данных в человеко-машинных распознающих системах. Сборник докладов международной конференции по мягким вычислениям и измерениям SCM-98, T 1, с., 143-147.

3. Романов С. В., Рабовский Ю. А. Об одном подходе к построению алгоритмов визуализации нечетких структур многомерных данных. Сборник докладов международной конференции по мягким вычислениям и измерениям SCM-98, T 1, с., 148-151.


Site of Information Technologies
Designed by  inftech@webservis.ru.