На правах рукописи

УДК 621.317.35; 681.5.015; 62.501.72; 519.24

ВОРОБЬЁВ Сергей Александрович

МОДЕЛИРОВАНИЕ И СТРУКТУРНЫЙ АНАЛИЗ СИГНАЛОВ С ПОВТОРЯЮЩИМИСЯ ПРИЗНАКАМИ ФОРМЫ В МЕДИКО-БИОЛОГИЧЕСКОМ ЭКСПЕРИМЕНТЕ

Специальность 05.13.09 "Управление в биологических и медицинских системах (включая применение вычислительной техники)"

Автореферат
диссертации на соискание ученой степени
доктора технических наук

Общая характеристика работы

Актуальность темы диссертации. В последнее десятилетие наблюдается ощутимый подъем биомедицинской науки. Происходит качественный скачок как результат накопленных в различных отраслях науки знаний о природе, функциях и назначении живого на Земле. Интегрируются знания, накопленные в биологии, генетике, физиологии, экологии и многих других, иногда весьма далеких друг от друга областях знаний на фоне возрастающего использования математики и других точных наук. Широкое распространение и доступность вычислительной техники с одновременным ростом ее возможностей и развитием сетевых технологий дало возможность накапливания существенно больших массивов данных об исследуемых процессах, что позволяет получать на основании их обработки качественно новые результаты.

Начиная с работ А.Л. Чижевского доказана периодичность био- и нейрофизиологических колебаний, также как и тот факт, что архитектоника биоритмов является уникальной характеристикой индивида. Известно, что отклонения от периодичности являются достаточно четкими признаками нарушений нормального функционирования (школа акад. П.К. Анохина).

Проблемная ситуация заключается в том, что доступные в настоящее время массивы информации позволяют на более высоком уровне ставить задачу оценки совместного влияния на исследуемый объект очень многих периодических процессов, различающихся как природой, так и временными диапазонами, с одновременным оцениванием иерархической структуры взаимодействия исследуемых факторов. Анализ многочисленных отечественных и зарубежных исследований, особенно на протяжении последних 10 лет, показал, что значительной информационной ценностью обладают скрытые составляющие электрофизиологических процессов, которые в современном биотехнических и медицинских системах практически не выделяются и не обрабатываются, что значительно снижает потенциальные возможности перспективных диагностических систем (Н.Д. Девятов, С.П. Ситько, А.А. Яшин и др.).

Разрешение противоречия между потребностями биологии и медицины, высокими требованиями, предъявляемыми к современным методам и средствам анализа биомедицинских данных, и существующим аналитическим аппаратом обработки подобных данных возможно на путях создания качественно новых моделей и алгоритмов, основанных на повышении полноты отображения и получении качественно новых признаков биологических объектов.

Все перечисленное приводит к необходимости решения проблемы разработки соответствующих моделей для описания и методов обработки данных. Большое количество работ, посвященных данной тематике, свидетельствует, с одной стороны, о практической необходимости таких методов, а с другой - об отсутствии в настоящее время достаточно общих и универсальных методов обработки больших массивов биомедицинских данных (Н.А. Агаджанян, J.C. Aschoff, Л. Гласс, Л.Я. Дорфман, В.П. Казначеев, Н.А. Кореневский, М. Мэки, И.Б. Мучник, А.А. Путилов, А.Д. Слоним, К.В. Судаков, А.А. Яшин и др.). Ранее известные методы, разработанные и успешно применявшиеся для решения технических задач, часто совершенно непригодны для задач управления в медицине и биологии в силу существенно большей сложности исследуемого объекта и граничных условий либо требуют слишком больших затрат вычислительных ресурсов, не соответствующих получаемому результату.

Цель исследования заключается в повышении оперативности, достоверности и полноты анализа структурных биомедицинских сигналов на основе создания комплекса моделей и методов структурного анализа сигналов с повторяющимися признаками формы.

Проведённый анализ показал, что одной из проблем исследования периодических процессов применительно к биологии и медицине является явление, получившее название десинхроноз (дизритмия), некоторыми исследователями используются также термин "квазипериодические сигналы" и другие, сходные по смыслу, и получение на основе этих процессов ряда новых признаков, характеризующих состояние биологических объектов. Данное явление редко проявляется в полном отсутствии ритмической составляющей в процессах, обычно являющихся периодическими - чаще оно заключается в варьировании длительностей следующих друг за другом повторяющихся участков. Как показано в известных работах, эти явления создают существенные трудности для известных методов обработки таких сигналов, вызывают появление в спектре сигнала набора высокочастотных составляющих. К сходным искажениям спектра приводят и искажения форм повторяющихся участков. Кроме того, для задач диагностики в биологии и медицине дополнительные трудности связаны с принятием решения практически всегда по косвенным данным, искаженным различного рода помехами, и при возможной неполноте данных (В.И. Баринов, Т.И Субботина и др.).

Проведённые исследования показали, что предпосылки для преодоления указанных недостатков известных методов могут быть созданы в рамках качественно нового комплекса моделей и методов структурного анализа сигналов с повторяющимися признаками формы в медико-биологическом эксперименте.

Математические модели и алгоритмы, используемые при анализе структурных сигналов, разнообразны и подчас весьма непросты, что обусловлено разнообразием их источников и обширными объемами данных, получаемых в эксперименте. Более того, сам термин "структурные сигналы" различными научными школами понимается по-разному. Наиболее распространены методы анализа сигнала путем выделения локальных признаков отдельных его участков. Менее распространен подход, связывающий понятие "структуры" в первую очередь с разделением описания исследуемого объекта на источник сигнала ("ненаблюдаемый" процесс, поток событий, объект и т.п.) и собственно наблюдаемый сигнал (случайный процесс). Здесь одним из важных признаков являются закономерности взаимодействия выделяемых участков сигнала между собой и вариации длительностей этих участков. В ряде работ вводится термин "структурные случайные процессы" и "двухуровневые случайные процессы" (И.Б. Мучник). Использование структурных методов обработки определяется в первую очередь задачами исследования. Их основное преимущество - возможность получения информации о структуре исследуемого объекта, которую невозможно получить другими методами.

В связи со всем вышеизложенным актуальной проблемой является разработка отсутствующих в современной практике моделей и алгоритмов выбора статистических моделей структурных сигналов и оценивания их параметров. Выбор модели включает задачи концептуального выбора общего класса моделей и оценивания целочисленных параметров, характеризующих структуру модели в пределах выбранного класса. Эти параметры будем называть первичными, в отличие от вторичных, окончательно определяющих конкретную модель.

В настоящей работе предлагаются методы структурного анализа для обработки экспериментальных сигналов, отдельные участки которых характеризуются повторяющимися на них признаками формы. Рассматриваются задачи разбиения реализации на однородные участки, задачи оценивания вторичных (численных) и первичных (структурных) параметров модели и задача выбора класса модели и ее конкретного вида. Особенность всех используемых в настоящей работе моделей сигналов - то, что они порождающие, то есть дающие возможность интерполяции и экстраполяции, что необходимо при обработке биомедицинских данных, которые, как правило, имеют ограничения по выборке и пропуски.

Цель диссертации: Разработка теоретических основ и моделей для описания биологических и медицинских объектов и процессов со сложной структурой поведения и для принятия диагностических решений по косвенным данным посредством анализа признаков повторяющейся формы и закономерностей их появления на реализации регистрируемого сигнала.

Для достижения поставленной цели и решения поставленной проблемы в работе сформулированы и решены следующие задачи

Объект исследования: Медико-биологические процессы, являющиеся источником сигнала, характер поведения которого на различных участках изменяется и отражает изменения состояния исходного процесса, для которых ставится задача восстановления последовательности таких изменений по косвенным признакам.

Используемые методы: применяется аппарат теории вероятности, математической статистики и случайных процессов, а также используются некоторые аналоги с известными методами распознавания образов. За основу принят структурный подход, описывающий наблюдаемый сигнал как реализацию двухуровневого случайного процесса. В предлагаемой работе подобные методы используются для обработки структурных сигналов с различными признаками повторяющейся формы, что вызывает необходимость существенных изменений этих методов и применения ряда оригинальных подходов. Задача выбора шага дискретизации обрабатываемых сигналов в настоящей работе не рассматривается, поскольку должна решаться для каждого конкретного случая (теорема отсчётов Котельникова).

Научная новизна. В диссертации предложена концепция математического описания процессов, являющихся источниками структурных сигналов с повторяющимися признаками формы, включающая:

1. способ задания наблюдаемого биомедицинского сигнала как реализации двухуровневого случайного процесса, отличающийся раздельными механизмами чередования типов однородных участков и вариации их длительности;

2. способ описания исследуемого объекта, являющегося источником сигнала, с помощью иерархической модели многоуровневого случайного процесса, отражающей внутреннюю структуру объекта;

3. три принципиально разных способа задания признаков формы и возможность описания сигналов "смешанного" типа, содержащих как участки повторяющейся формы, так и описываемые другими моделями;

4. предложен комплекс методов:

4.1. идентификации ненаблюдаемых состояний источника сигнала при различной организации процесса поступления информации и известных параметрах модели (для всех предложенных в работе моделей), включающий принципиально новый класс методов, сочетающих свойства вероятностного и детерминированного подхода;

4.2. оценивания неизвестных параметров для всех предложенных моделей при различной организации процесса поступления информации и известных структурных параметрах;

4.3. выбора вида модели сигнала из множества всех предложенных в настоящей работе моделей и, кроме того, моделей сигналов, описываемых случайным процессом авторегрессии со скачкообразно изменяющимися параметрами модели, и методов оценивания неизвестных структурных параметров этих моделей;

5. обеспечена совместимость разработанных методов с рядом известных методов обработки структурных сигналов.

Практическая ценность работы заключается в предложенных методах обработки экспериментальных сигналов, позволяющих в медико-биологической практике повысить качество и эффективность диагностики по косвенным признакам, повысить достоверность принятия диагностических решений.

Реализация и внедрение результатов работы. Предложенные методы применены при разработке программного обеспечения сканирующих микрокалориметров и при разработке программного обеспечения приборов для исследования гемодинамики в СКБ Биологического приборостроения АН СССР (г. Пущино). Предложенные методы структурной обработки данных были использованы при анализе клеточного состава крови у крыс при низкоинтенсивном крайневысокочастотном электромагнитном облучении на Медицинском факультете Тульского государственного университета, для обработки экспериментов по выявлению эффектов взаимодействия электромагнитного поля с живым веществом, проводимых в НИИ новых медицинских технологий. Описано использование предложенных методов для разработки метода контроля температуры процесса по косвенным признакам в установке для плавки сульфидных руд в "жидкой ванне" (ПЖВ)- работа выполнена совместно с Московским институтом стали и сплавов. Разработанные методы структурного анализа были использованы в рамках комплексной инновационной научно-технической программы 13.22 "Создание комплексов обработки изображений и средств отображения информации", Тульский Государственный университет, хоздоговорных работ "Разработка алгоритмического обеспечения для системы контроля качества непрерывно-литых заготовок" и "Разработка программно-технических средств для системы ввода-вывода бинарной информации на микрофильм", выполненных на кафедре ЭВМ ТулГУ. Основные теоретические результаты работы включены в конспект лекций по курсам "Основы искусственного интеллекта" и "Основы теории управления". Предложенные методы используются для обработки биомедицинской информации сотрудниками НИИ новых медицинских технологий и медицинского факультета ТулГУ.

Достоверность полученных результатов подтверждается данными имитационного моделирования и использования разработанных алгоритмов для решения ряда практических задач.

Основные положения, выносимые на защиту диссертации

  1. Концепция моделирования экспериментальных сигналов в виде реализации одной из компонент двухуровневых структурных случайных процессов с раздельными механизмами чередования типов событий и вариаций их длительностей;
  2. Концепция моделирования поведения исследуемого объекта - источника экспериментальных сигналов в виде иерархической многоуровневой модели структурного случайного процесса;
  3. Три различных способа задания признака повторяющейся формы сигнала для событий данного класса: посредством одной, нескольких эталонных форм или их линейной комбинацией;
  4. Методы идентификации ненаблюдаемых состояний объекта для различных режимов регистрации сигнала, включая: методы оптимальной поточечной классификации; методы динамического программирования, в том числе пригодные для работы в реальном масштабе времени с автоматически определяемой задержкой; ускоренные методы, сочетающие свойства детерминированных и вероятностных методов распознавания;
  5. Методы восстановления неизвестных параметров моделей, включая: методы оценивания параметров для полностью зарегистрированной реализации; методы пересчёта параметров в ходе регистрации сигнала; точные и ускоренные методы "с обратной связью", а также оценивания параметров "с учителем";
  6. Методы оценивания неизвестной структуры моделей с использованием метода сравнения статистических гипотез и информационного критерия Акаике;
  7. Методы выбора типа модели из множества предложенных и модели авторегрессии со скачкообразно изменяющимися параметрами, учитывающие возможность построения "гибридных" моделей.

Апробация работы. Результаты работы были представлены на: XIX Всесоюзной НТК "Студент и научно-технический прогресс" (Новосибирск, 1981); II Всесоюзной конференции по стохастическому и дискретному анализу нечисловой информации и экспертным оценкам (Москва-Таллин, 1984); Конференциях молодых ученых Института проблем управления (Москва, 1984, 1985, 1986); II симпозиуме IFAC по стохастическому управлению (Вильнюс, 1986); Всесоюзной НТК "Разработка энергосберегающих и малоотходных технологий в металлургии цветных металлов" (Москва, 1986); Всесоюзном семинаре по обнаружению изменения свойств случайных процессов (Воронеж, 1990); Всесоюзных конференциях "Распознавание образов и анализ изображений: новые информационные технологии" РОАИ-2-95 (Ульяновск, 1995) и РОАИ-3-97 (Нижний Новгород, 1997); Всероссийских НТК "Микроэлектроника и информатика-97 и 98" (Звенигород, 1997 и 1998); Международной НТК "Нечеткая логика, интеллектуальные системы и технологии" (Владимир, 1997); и Всероссийских НТК "Методы и средства измерений физических величин" (Нижний Новгород, 1997 и 1998); 3-ей международной конференции "Теория и техника передачи, приема и обработки информации". (Харьков, 1997); Международной НТК "Управление в технических системах" (Ковров, 1998); Международном симпозиуме "Биофизика полей и излучений и биоинформатика" (Тула, 1998); и II Всероссийских НТК "Компьютерные технологии в науке, проектировании и производстве" (Нижний Новгород, 1999 и 2000); Международной конференции "Перспективные технологии автоматизации" ПТА-99 (Вологда, 1999); VII Международной НТК "Электродинамика и техника СВЧ и КВЧ" (Самара, 1999); Международной НТК "Автоматизация и информатизация в машиностроении" (Тула, 2000); Межвузовской НТК "Управляющие и вычислительные системы. Новые технологии" (Вологда, 2000); Всероссийской НПК " Системы управления электротехническими объектами" (Тула, 2000); Всероссийской научной конференции "Современные проблемы математики, механики, информатики" (Тула, 2000) и на ежегодных научно-технических конференциях в Тульском Государственном университете, а также на научных семинарах, проводимых в 1995-2000 гг. в НИИ новых медицинских технологий.

Публикации. Основные результаты исследований по теме диссертации опубликованы в 65 печатных работах, из них 1 монография.

Структура и объем работы. Диссертация состоит из введения, семи глав, заключения, списка литературы (385 наименований) и приложений. Объём основного текста диссертации - 250 машинописных страниц, 22 страницы рисунков, приложение включает акты о внедрении в производство и о практическом использовании результатов и выводов диссертации.

Содержание работы

Во введении обосновывается актуальность работы, определяются цели и задачи исследования, научная новизна, практическая ценность, достоверность и обоснованность научных положений, апробация и другие необходимые сведения, приводится краткое содержание глав диссертации.

В первой главе диссертационной работы проведен анализ состояния проблемы разработки теоретических основ и моделей для описания биологических и медицинских объектов со сложной структурой поведения и методов принятия диагностических решений по косвенным данным посредством анализа признаков повторяющейся формы и закономерностей их появления на реализации генерируемого объектом сигнала.

Приводится обзор известных моделей для описания и методов обработки экспериментальных сигналов, источником которых являются процессы с изменяющимися свойствами. Рассматриваются практические задачи, приводящие к необходимости такой обработки данных - экспериментальных сигналов из области медицинских и биологических исследований. Основное внимание уделяется методам структурной обработки сигналов и методам описания признаков повторяющейся формы.

Из нескольких известных в настоящее время различных пониманий термина "структурные сигналы" подробно рассматривается подход, связывающий понятие структуры с наличием двух уровней модели исследуемого объекта - источника сигнала, называемого разными авторами также ненаблюдаемым процессом или потоком событий, и модели формирования наблюдаемого сигнала. Данный подход к анализу сигналов состоит в параллельной реализации: 1) задачи сегментации, то есть выделения однородных фрагментов на реализации сигнала; 2) задачи описания однородных фрагментов, соответствующих элементарным событиям; 3) задачи анализа порядка чередования разных типов фрагментов.

При структурном анализе удобно описывать сигнал как наблюдаемую реализацию некоторого случайного процесса, поэтому структурный подход к их анализу тесно связан с проблемой обнаружения моментов изменения свойств случайных процессов. Задача сегментации, то есть нахождения границ между однородными фрагментами, может быть понята как задача обнаружения одного или нескольких моментов изменения (разладок) случайного процесса.

Существующие методы обработки структурных сигналов разбиты на три основных группы. К первой относятся алгоритмы, не использующие математической модели сигнала, а основанные лишь на предположении, что он состоит из однородных фрагментов с примерно постоянными значениями некоторых признаков формы и значения признаков на соседних фрагментах различаются. Описания фрагментов и механизма их чередования не предлагается, необходим лишь выбор определённого набора признаков формы сигнала, а также некоторый критерий однородности его поведения на фрагменте. Это полностью эвристические алгоритмы, использующие для сегментации различные функции сложности, характеризующие степень изменчивости поведения процесса на данном участке. Они направлены на расчленение реализации на отдельные фрагменты так, что признаки формы относительно постоянны внутри фрагментов и сильно изменяются на их границах. Сюда же относим алгоритмы сегментации по заданному критерию, алгоритмы кусочной и частичной аппроксимации с помощью многочленов и по некоторой системе базисных функций.

Ко второй группе относятся алгоритмы, использующие математическую модель случайного процесса, реализацией которого является сигнал на участках однородности. Модель включает описание однородных фрагментов с помощью семейства функций плотности распределения вероятности, но не предлагает описания механизма изменения состояния, то есть не задаёт механизм чередования элементарных событий. Обычно каждый однородный фрагмент кривой описывается вектором параметров, который и является признаком формы на участках данного типа.

К третьей группе относятся методы, основанные на построении математической модели, включающей и описание однородных фрагментов и модель механизма чередования элементарных событий (обычно в виде некоторого потока случайных событий). Они позволяют учесть и использовать для обработки информацию о закономерностях чередования фрагментов, когда таковая имеется. Подробно рассматривается подход к структурной обработке сигналов, использующий в качестве модели механизма чередования элементарных событий конечную Марковскую цепь переключений. Этот подход разрабатывался в Институте проблем управления РАН под руководством И.Б. Мучника группой, в которую входил и соискатель ( См., например, обобщающую монографию Моттль В.В., Мучник И.Б. Скрытые марковские модели в структурном анализе сигналов. – М. Физматлит, 1999. – 352 с.). В главе подробно описаны эти методы для различных постановок задачи обработки сигналов. Выделены основные недостатки такой модели: длительность однородных участков распределена на интервале [1,...,+¥ ] и определяется диагональным элементом qii марковской матрицы Q, что дает единственно возможное распределение вида P(l i=L)=(qii)L-1´ (1-qii), L=1,...,+¥ , 0£ qii£ 1, где l i - длина участка. Эти особенности неудобны для описания сигналов с фрагментами повторяющейся формы.

Рассмотрен ряд методов оценивания размерности моделей сигнала, основанных на информационном критерии Акаике ИКА (AIC) - модификации метода максимального правдоподобия для случая неизвестной размерности модели, а также ряд других информационных критериев (IC). Проанализированы существующие методы описания признаков формы сигнала. Сделан вывод о необходимости разработки моделей и методов структурной обработки для случайных процессов с повторяющимися признаками формы.

Во второй главе приводится модель для описания процесса формирования сигнала как многоуровневого случайного процесса. Она состоит из модели ненаблюдаемого процесса (смены состояний объекта, являющегося источником регистрируемого сигнала) и модели наблюдаемого процесса. Ненаблюдаемым процесс назван с долей условности: в ряде прикладных задач он доступен для наблюдения, но стоимость и техническая сложность такого наблюдения слишком высоки для решения задачи управления и возникает необходимость в получении оценки состояния объекта по косвенным признакам с использованием легко наблюдаемой и регистрируемой кривой. В ряде практических ситуаций такое измерение осуществимо, но связано с задержкой, величина которой не позволяет использовать эти данные системой управления. Особенно затруднено непосредственное наблюдение при исследованиях, проводимых в биологии и медицине.

Процесс смены состояний источника рассматривается как последовательность событий, каждое из которых может быть отнесено к одному из конечного числа классов. Общее число классов событий m относительно невелико - много меньше общего числа смены состояний источника за время наблюдения. Основной механизм для описания смены состояний - марковская цепь переключений. Каждое событие объективно принадлежит одному из m классов. В каждый конкретный момент дискретного времени t может происходить только одно событие. Предложен ряд основных моделей ненаблюдаемого процесса.

Общая черта всех предложенных моделей - последовательность номеров классов событий представляет собой марковскую цепь переключений с матрицей условных вероятностей переходов Q={qij}. Однако эта цепь управляет только чередованием классов последовательности событий, но не их длительностями. Диагональный элемент матрицы теперь определяет только возможность последовательного появления двух участков одного типа, что не имело смысла для авторегрессионной модели, но существенно для участков повторяющейся формы. Длительностью однородных участков управляют различные модели, не связанные с марковской цепью переключений:

Модель сигнала с участками фиксированной длины связывает с каждым классом i некоторую длительность Ti событий данного класса. Если s-ое событие произошло в момент ts и принадлежало i-ому классу, то следующее s+1-ое событие произойдет обязательно в момент ts+Ti и класс этого события будет зависеть лишь от класса предыдущего события.

Для каждого момента времени t введены [3-5] понятия класса ht и фазы t t. Пусть ts - момент начала последнего по отношению к моменту t события, ts£ t, а i - класс этого события. Тогда ht=i, t t=t-ts+1. Пара (ht,t t) - принадлежность момента t. Марковская цепь переключений определена не на всей оси t дискретного времени, а в моменты ts. В рамках данной модели qij=P(ht=j/ht-1=i,t t-1=Ti). Первый уровень модели представляет собой двухкомпонентный целочисленный случайный процесс. Реализацию этого процесса конечной длины для t=1,...,N обозначаем H1N={h1,t 1,...,hN,t N}. Процесс полностью характеризуется матрицей Q={qij} и вектором длин фрагментов T={Ti}. Для описания небольших вариаций длительности используем "события - паузы" единичной длины.

Рассмотренная в первой главе модель марковского ненаблюдаемого процесса является частным случаем рассмотренной при выборе Tiº 1, что используется при разработке методов выбора типа модели. В свою очередь все предлагаемые модели можно преобразовать к марковской, если рассматривать каждую пару "класс-фаза" как отдельное состояние марковской цепи. Такое преобразование имеет лишь теоретическое значение, поскольку полученная модель для реальных сигналов будет иметь порядка 106 и более элементов матрицы Q.

Модель с участками случайной длины используется для описания с шумоподобных участков и "стыковки" с методами обработки таких сигналов. Марковская цепь по-прежнему управляет лишь чередованием классов событий. Для получения распределения длин, аналогичного рассмотренному в первой главе, вводится параметр m i, определяющий вероятность сохранения текущего состояния. Такая модификация упрощает оценивание параметров.

Модель с обрывающимися участками предполагает, что событие каждого типа может иметь некоторую случайную длительность в пределах максимального для данного класса i значения Ti. Считаем, что событие обязательно продлиться время, достаточное для появления на реализации наблюдаемого сигнала участка характерной формы, но новое событие может наступить до завершения участка длительности Ti и либо затереть "хвост" данного участка, либо соответствующие эталонные формы суммируются в зависимости от выбранной модели наблюдаемого процесса. Здесь длительность события класса i является случайной величиной, распределенной на интервале [1,Ti]. Её распределение зависит только от класса события и характеризуется набором условных вероятностей прерывания фрагмента wil, где wil - вероятность того, что l-ый отсчёт события класса i является последним отсчётом этого события при условии, что он принадлежит данному событию. Их получаем из распределений длин отрезков P(J i=k), где J i - длительность события класса i по формуле

(1)
. Чередованием номеров классов событий по прежнему управляет марковская цепь Q={qij}. Дополнительный параметр - матрица условных вероятностей прерывания фрагмента W={wil}. Матрицы Q и W близки по свойствам и практическому использованию и, очевидно, могут быть заменены единой матрицей условных вероятностей. Однако такое объединение увеличит общее число используемых параметров и уменьшит скорость работы алгоритмов. Это будет заметно уже для процедуры сегментации, но особенно скажется при оценивании неизвестных параметров модели.

Модель с двусторонне обрывающимися участками используется для описания сигналов, фрагменты которых могут быть "затерты" реакциями соседних событий как в начале, так и в конце фрагмента, так что иногда будет наблюдаться только средняя часть эталонной формы.

Введены две матрицы условных вероятностей - начала фрагмента V={vik} и обрыва фрагмента W={wik} - она в точности соответствует матрице W предыдущей модели. Матрица V={vik} содержит условные вероятности того, что фрагмент, начавшийся в данный момент времени, начинается с k-ого отсчёта эталона, при условии, что в этот момент времени начинается фрагмент класса i: vik=P(t t=k/ht=i, ht-1¹ i или t t-1¹ k-1). Можно рассмотреть модификацию модели, когда фрагменты начинаются с любого отсчёта эталона, а кончаются всегда последним (Ti-ым). В этом случае используется матрица V.

Важной особенностью предложенных моделей является возможность задания любых законов распределения длин однородных фрагментов (событий), включая полимодальные, на интервале произвольной длины, а не обязательно [1,...,+¥ ]. При этом процесс, описываемый этими моделями, а также их сочетаниями, в целом остается марковским, хотя некоторые входящие в его состав модели не обязательно обладают такими свойствами. Все рассмотренные модели можно комбинировать, используя для разных классов событий различные способы управления их длительностью в рамках описания одного процесса функционирования источника наблюдаемого сигнала.

Модели формирования наблюдаемого процесса рассматривают его как смесь полезного сигнала и шума - последний считаем нормальным, хотя большая часть выводов справедлива и для иных законов его распределения. Предлагаются следующие способы задания признака формы:

Модели с повторением средней формы фрагментов используют самый простой признак - математическое ожидание формы на участках реализации сигнала, соответствующих событиям данного класса. Модель наблюдаемой компоненты xt двухкомпонентного случайного процесса при этом примет следующий вид: с каждым классом событий i связывается эталонная форма j ( i,t ) =j it фрагмента длительностью Ti. Случайный процесс

xt=j ( ht,t t) +b(ht)x (t), (2)
представляет собой сумму этих эталонов и нормального белого шума x (t) с нулевым средним и единичной дисперсией; b(ht)=bi - уровень шума, зависящий от номера класса i=ht. Отрезок реализации процесса xt обозначим X1N={x1,...,xN}. Процесс полностью характеризуется формулой (2), матрицей Q ={j ik} эталонных форм и вектором уровней шума B={bi}. С рассмотренной моделью наблюдаемого процесса могут использоваться все модели ненаблюдаемого процесса. Модель достаточно универсальна для описания сигналов, являющихся продуктом технических или технологических процессов, но для обработки биомедицинских данных обычно требуются более сложные модели.

Модели с наложением соседних фрагментов используются в случаях, когда после наступления очередного события сигнал сохраняет следы предыдущего, достаточно значительные для того, чтобы их нельзя было адекватно описать аддитивным шумом x (t). Модель наблюдаемого процесса на случай перекрывания двух соседних фрагментов

xt=j (i,t-us-1+1)+j (j,t-us+1)+bjx t. (3)
Аналогичным образом можно расширить модель для случая трех или более перекрывающихся фрагментов. С этой моделью наблюдаемого процесса удобнее всего использовать модели ненаблюдаемого процесса с обрывающимися участками или с участками случайной длины.

Модели с многоэталонным заданием формы фрагментов используются для сигналов с большим разнообразием форм на однотипных участках - как правило биологического происхождения. Для описания его поведения на участке класса i используем набор ni эталонных форм sj ik. Каждый момент времени t характеризуется кроме класса ht и фазы t t также вариантом используемого эталона vt=1,...,ni. На протяжении одного фрагмента значение vt не меняется. Процесс xt формируется как

xt=sj ik + bi x t, где i=ht, k=t t, s=vt. (4)
модель предполагает либо возможность появления на каждом конкретном участке данного класса любого из ni вариантов формы с равными вероятностями 1/ni, либо возможность появления на всём протяжении данной реализации только одного варианта формы для участков данного класса. Эта модель сочетается с любой моделью ненаблюдаемого процесса. Она характеризуется еще одним параметром - вектором размерностей наборов эталонов m (m)={n1,...,nm}.

Модель с заданием формы фрагментов линейной комбинацией эталонных форм использует в качестве признака формы сигнала на участках i-го типа разложение по базису эталонов. Каждому типу i от 1 до m по-прежнему ставим в соответствие ni базисных эталонов rj ik, где i=ht, k=t t, r=1,...,ni. Обычно достаточно 2¸ 3 элементов базиса для эффективной работы алгоритма. Наблюдаемый процесс xt образуется как

, где i=ht, k=t t, (5)
причем и 0£ a r£ 1 для всех r=1,...,ni. (6)
Набор коэффициентов a r остается неизменным на протяжении данного фрагмента. Данная модель может использоваться с любой моделью ненаблюдаемого процесса. Параметр m (m)={n1,...,nm} является здесь размерностью базисного набора эталонных форм для каждого класса. В отличие от предыдущих, данный способ задает не точку в пространстве признаков, а объем - выпуклую линейную оболочку, что позволяет достаточно простым способом описывать значительные вариации формы наблюдаемого сигнала.

Иерархические модели процессов используются при длительных наблюдениях, когда регистрируется большое число событий и вероятностные характеристики ненаблюдаемого процесса в ходе наблюдения меняются, причем неоднократно, и эти изменения отражают некоторые изменения объекта. Для описания таких сигналов предлагается [8,11] модель трехуровневого процесса. Процесс первого уровня управляет источником, генерирующим процесс второго уровня, тот в свою очередь управляет источником, генерирующим процесс третьего уровня. Наблюдаем только процесс третьего (нижнего) уровня, остальные - ненаблюдаемые. Обозначим процесс первого уровня gt. Он определен на конечном сравнительно небольшом множестве значений gt=1,...,m0. Будем описывать его посредством дискретной цепи Маркова с матрицей условных вероятностей переходов

R={rij} где rij=P(gt=j/gt-1=i) i,j=1,...,m0. (7)
Реализацию этого процесса для t=1,...,N обозначим G1N={g1,...,gN}. Очевидно, что диагональные элементы матрицы rii>>rij. В качестве процесса второго уровня можно использовать любую модель ненаблюдаемого процесса. Параметры процесса ( ht,t t) зависят от текущего состояния gt=i процесса первого уровня. При этом меняются либо все вероятностные свойства процесса, либо только некоторые из них. Так, вместо одной матрицы Q условных вероятностей переходов будем иметь m0 матриц iQ, i=1,...,m0, причем в каждый момент времени t используется только одна из них. Поскольку диагональные элементы матрицы R много больше остальных, время непрерывного использования одной и той же матрицы iQ достаточно велико. Кроме того, возможно изменение длин однородных фрагментов - вместо вектора T длин эталонов в этом случае имеем m0 векторов iT, i=1,...,m0. Могут изменяться и остальные параметры. В ряде прикладных задач ограничиваем количество изменяемых параметров процессов второго уровня. Как правило, это либо матрица Q условных вероятностей, либо матрица условных вероятностей прерывания фрагмента W, остальные параметры процесса неизменны.

Наблюдаемый процесс третьего уровня при этом может быть любым из предложенных выше. Поскольку он зависит только от текущего состояния процесса второго уровня, никакого изменения в связи с увеличением числа уровней в этих моделях не произойдет. Аналогично строятся модели, имеющие четыре и более иерархических уровней.

Сочетания моделей наблюдаемого и ненаблюдаемого процессов позволяет получить большое число комбинаций, особенно при использовании различных моделей для разных классов событий. Подробно рассматриваются следующие из них:

  1. Модель с фрагментами фиксированной длины и повторением средней формы фрагментов;
  2. Модель с фрагментами переменной длины и повторением средней формы фрагментов;
  3. Модель с фрагментами переменной длины и наложением соседних фрагментов;
  4. Модель с фрагментами фиксированной длины и многоэталонным заданием формы фрагментов;
  5. Модель с фрагментами переменной длины и многоэталонным заданием формы фрагментов;
  6. Модель с фрагментами фиксированной длины и заданием формы фрагментов линейной комбинацией эталонов;
  7. Модель с фрагментами переменной длины и заданием формы фрагментов линейной комбинацией эталонов.

Предложенные методы обработки пригодны и для любых других сочетаний рассматриваемых моделей, причем для описания одного сигнала может использоваться "гибридная" модель как комбинация нескольких рассмотренных.

Задачи обработки сигналов: аналогично классической постановке задач распознавания образов выделяем две основные задачи - задачу обучения распознаванию образов, понимаемую в рамках приведенных моделей как задачу получения оценок параметров этих моделей, и задачу собственно распознавания - получения по предъявленной реализации случайного процесса xt оценок реализации ненаблюдаемого процесса (ht,t t). Задачу обучения распознаванию разбиваем на задачи обучения с учителем и самообучения. Первая может быть реализована в ситуации, когда "ненаблюдаемый" процесс первого уровня на самом деле может быть измерен, пусть достаточно трудоемким способом. В некоторых практических задачах он измеряется легко, но с задержкой, не позволяющей использовать эти измерения для управления объектом или процессом. В таком случае можно получить отрезок реализации двухуровневого процесса xt, (ht,t t) (обучающая совокупность), по которому затем восстановить параметры моделей наблюдаемого и ненаблюдаемого процессов. В противном случае решается счёту xt его принадлежности - класса ht и фазы t t (классификация отсчётов по их принадлежности). Для рассматриваемых моделей гипотезы о принадлежности отсчётов не являются независимыми. Априорная вероятность для каждой гипотезы о принадлежности очередного отсчёта связана с принятой гипотезой о его принадлежности. Решение о принадлежности этого отсчёта должно приниматься в зависимости не только от его значения xt, но и от значений всех отсчётов реализации сигнала или некоторой достаточно большой её части.

Качество любого правила сегментации оценивается величиной её среднего риска - математического ожидания функции потерь в результате несовпадения сегментации , полученной при обработке реализации X1N с помощью какого-либо правила сегментации, с истинной сегментацией H1N этого сигнала.

Ставится задача построения оптимального правила сегментации, то есть правила, для которого критерий среднего риска сегментации принимал бы минимальное значение [2]. При этом структура оптимального решающего правила очевидно зависит от вида выбранной функции потерь. Рассматриваются четыре основных вида функций потерь и соответствующие им решающие правила. Во-первых, функции потерь делятся на глобальные и аддитивные. Кроме того, в зависимости от того, учитывает ли функция потерь несовпадение по сегментаций фазе либо только по классу, вводим их деление на фазочувствительные и фазонечувствительные. Глобальная функция потерь связывает одинаковое значение штрафа, равное единице, с любым несовпадением истинной сегментации и её оценки безотносительно к величине этого несовпадения:

(8)
Она не учитывает степень отличия восстановленной алгоритмом сегментации от истинной, для неё одинаково плохи и сегментация, в которой неверно определена принадлежность одного отсчёта, и сегментация, в которой для половины отсчётов принадлежность определена неверно.

Аддитивная функция потерь учитывает потери от несовпадения истинной принадлежности (ht,t t) каждого отсчёта и её оценки , независимые от правильности аналогичных оценок соседних отсчётов. Эти потери суммируются для всех отсчётов реализации:

(9)
Функцию потерь такого вида будем называть аддитивной фазочувствительной функцией потерь [3-4]. Фазонечувствительная функция [5] учитывает потери лишь от неверного определения класса очередного отсчёта и игнорируют ошибки в определении его фазы.

Оптимальное решающее правило для случая глобальной функции потерь примет вид

(10)
то есть сводится к выбору сегментации, апостериорная вероятность которой по отношению к обрабатываемой реализации сигнала максимальна. Минимум среднего риска для аддитивных функций потерь обеспечивается байесовским решающим правилом

(11)
Для функции потерь l специального вида (антидиагональной)

оптимальное решающее правило значительно упрощается:

(12)
Решающее правило для фазонечувствительной функции потерь оценивает только класс текущего отсчёта и использует вероятности вида P(ht=i/X1N), получаемые из входящих в (11) суммированием по всем значениям фазы. Оптимальными алгоритмами являются для глобальных функций потерь - алгоритм сегментации, построенный по схеме динамического программирования, а для аддитивных - алгоритм поточечной классификации отсчётов на основании апостериорных вероятностей их принадлежности.

Задачи идентификации параметров моделей делятся две группы. К первой отнесем оценивание размерности - параметров, определяющих структуру модели: число классов m, вектор длин фрагментов T, порядок авторегрессии n для шумоподобных участков сигнала, количество уровней - два или три - структурного случайного процесса и размерность m0 первого уровня трехуровневой модели. В широком смысле к "структуре" относятся также типы используемых моделей наблюдаемого и ненаблюдаемого процессов.

К группе оценивания собственно параметров относим оценивание матриц условных вероятностей Q, W и V, эталонных форм Q и вектора уровней шума B. Методы оценивания параметров при известной размерности проще и быстродействие их выше, чем в случае одновременного оценивания параметров и размерности. Оценивание этих двух групп выделяем в отдельные задачи, рассматриваемые в различных главах.

Требуется по конкретной реализации X1N оценить значение набора параметров модели наблюдаемого и ненаблюдаемого процесса. Методы оценивания делятся на две группы по доступности данных для обработки. Последовательные используются в случаях, когда отсчёты xt поступают последовательно во времени и реализация сигнала X1N не хранится в памяти. Параллельные применяются, когда вся реализация X1N зарегистрирована и любой её отсчёт xt доступен для обработки в любой момент времени работы алгоритма.

В каждой из этих групп имеются методы восстановления параметров в режиме "с учителем" - по размеченной реализации, и "без учителя" (самообучение). Последние делятся на точные методы и методы обратной связи. Известно, что методами обратной связи можно получить только смещённые оценки параметров, однако такая точность оказывается пригодной для многих практических задач, а быстродействие этих методов существенно выше. Для последовательного оценивания параметров в качестве точного метода предложен метод стохастической аппроксимации, а для параллельного - метод максимального правдоподобия. Все методы самообучения оценивают параметры модели с точностью до перенумерации классов событий.

В третьей главе приводятся методы оптимальной сегментации структурных сигналов. Для аддитивных функций потерь они основаны на байесовских решающих правилах (11)¸ (12), для реализации которых достаточно указать способ вычисления входящих в решающие правила апостериорных вероятностей. Предложен способ, состоящий в последовательном применении двух рекуррентных процедур [2]. Сначала процедура прямого хода вычисляет вероятности P(ht=i,t t=k/X1t) на основании предшествующего данному отсчёту xt участка реализации X1t, затем процедура обратного хода пересчитывает эти значения в P(ht=i,t t=k/X1N) с учётом информации, содержащейся в следующем за xt участке Xt+1N. Для самой простой первой модели процедуры имеют вид:

Прямой ход: Пусть к моменту обработки очередного отсчёта xt уже известны вычисленные для предыдущего отсчёта xt-1 вероятности
P(ht-1=i,t t-1=k/X1t-1). Эти вероятности с учетом значения отсчёта xt пересчитываются в искомые вероятности P(ht=i,t t=k/X1t): сначала вычисляются априорные по отношению к xt вероятности

, (13)
i=1,...,n. После этого для каждой из гипотез [ht=i,t t=k] вычисляется условная плотность распределения отсчёта xt. Для нормального распределения шума

. (14)
Искомые вероятности P(ht=i,t t=k/X1t) вычисляются по формуле Байеса

(15)
после чего переходим к обработке следующего отсчёта xt+1.

Последовательно применяя формулы (13)¸ (15) для t=1,...,N, получим искомые апостериорные вероятности P(ht=i,t t=k/X1t) для всех отсчётов. Для t=N полученные P(hN=i,t N=k/X1N) совпадают с искомыми, входящими в (11)¸ (12). Теперь процедура обратного хода для t=N-1,...,1, двигаясь назад, пересчитает вероятности P(ht=i,t t=k/X1t) в P(ht=i,t t=k/X1N). Пусть имеются найденные процедурой прямого хода вероятности P(ht=i,t t=k/X1t) и полученные на предыдущем шаге процедуры обратного хода вероятности P(ht+1=j,t t+1=l/X1N) для отсчёта xt+1. Искомые вероятности находим как

 (16)
Недостатком решающих правил типа (11) является невозможность работы в режиме реального времени. Предлагается следующие способы выхода:

Последовательная сегментация не использует процедуры обратного хода. В решающие правила входят вероятности P(ht=i,t t=k/X1t), а содержащаяся в следующем за данным отсчётом участке Xt+1N информация не используется - что снижает точность данного метода.

Сегментация с задержкой использует информацию, содержащуюся в следующем за данным отсчётом небольшом участке Xt+1t+D t длительности D t - вероятности P(ht=i,t t=k/X1t+D t). С ростом D t точность увеличивается, но уменьшается быстродействие - на один шаг прямого хода приходится D t шагов обратного хода. На рисунке показана зависимость качества работы алгоритма R от отношения шум/сигнал b для задержек (снизу вверх) 1/10 Tmax, 1/5 Tmax, 1/3 Tmax, по сравнению с качеством работы параллельного (сплошная линия) алгоритма сегментации. Компромиссом является модифицированная сегментация, использующая информацию, содержащуюся в следующем за данным отсчётом участке текущего фрагмента и не выходящая за его пределы. При э цедура вычисления коэффициентов a r разложения формы текущего участка реализации по базису ni эталонов данного класса i. Она заключается в решении системы ni линейных уравнений

(17)
Коэффициенты Aik в первых ni-1 строках матрицы коэффициентов имеют вид

(18)
для k=1,...,ni-1, l=1,...,ni.

В последней строке матрицы Akl=1 для k=ni, l=1,...,ni, Ck=1. (19)
Данная система может быть решена любым известным методом, что при её небольшой размерности ni не представляет вычислительных сложностей. Особенность этой системы уравнений - значения коэффициентов Akl для заданного набора эталонных форм остаются неизменными и, следовательно, вопрос о линейной независимости и разрешимости системы уравнений не может возникнуть в процессе обработки конкретного сигнала, а полностью решается на этапе задания базисных форм данного класса. От конкретного вида реализации сигнала на обрабатываемом участке зависят лишь величины свободных членов Ck (18). На основании полученных коэффициентов a r условная плотность распределения очередного отсчёта находится как

.

Для глобальной функции потерь оптимальное решающее правило (9) сводится к выбору такой сегментации, апостериорная вероятность которой по отношению к обрабатываемой реализации максимальна. Для построения реализующего его алгоритма представим апостериорную вероятность P(H1N/X1N) в виде произведения

(20)
и возьмем от обеих частей (20) логарифм со знаком минус - получим критерий J(H1N)= - ln P(H1N/X1N), минимум которого совпадает с максимумом P(H1N/X1N).

(21)
где b t(ht,t t,ht-1,t t-1) = - ln P(ht,t t/ht-1,t t-1) - ln f(xt /ht,t t).

Для случая нормального белого шума

(22)
Вероятности же P(ht,t t/ht-1,t t-1) на основании первой модели

(23)
В случае нижней альтернативы (23) значение (21) равно -¥ , то есть такие сочетания принадлежностей (ht,t t,ht-1,t t-1) недопустимы.

Алгоритм, минимизирующий критерий J(H1N), построен по принципу динамического программирования. Строим последовательность функций двух дискретных аргументов ht и t t

(24)
Величина w t(ht,t t) показывает, какое минимальное значение критерия (21) можно получить за счёт выбора тем или иным способом принадлежность отсчётов xs, s=0,...,t-1 при фиксированной принадлежности отсчёта xt. При t=N минимальный элемент из w N(hN,t N), hN =1,...,m, t N=1,...,Ti совпадает с минимальным значением критерия (21) для всей реализации. Рекуррентно вычисляем значения w t(i,k) для i=1,...,m, k=1,...,Ti, начиная с w 0(i,k) = - lnP(h0=i,t 0=k)


При этом сохраняем пары целочисленных величин


для всех i=1,...,m, k=1,...,Ti, t=1,...,N.

После вычисления очередных значений w t(i,k) вычисленные на предыдущем шаге w t-1(j,l) больше не требуются. Дойдя до t=N, найдём

(25)
Двигаясь вдоль полученной таблицы в обратном направлении t=N-1,...,1, найдем оптимальную сегментацию как

Геометрическая интерпретация: таблица W t(i,k) описывает ориентированный иерархический граф, в котором t групп по вершин в каждой. Из каждой вершины графа выходит одна и только одна дуга, а входить могут несколько, одна или ни одной. На рис. 2 а изображены все возможные положения ребер графа для m=3, T1=1, T2=3, T3=3, а на рис. 2 б - один из возможных вариантов графа.

а б

После выбора гипотезы о принадлежности последнего отсчёта (25) задача сегментации сводится к поиску путей по графу от вершины из N-ой группы вершин до какой-либо вершины из первой группы. Задача решается всегда однозначно. На рис. 2 б жирными линиями выделен путь, который будет выбран при N =7 в случае выбора (hN,t N)=(3,3).

Полученный алгоритм обладает присущим методам динамического программирования недостатком - его можно применять только для сегментации реализаций сигнала фиксированной длины, поскольку решения о принадлежности отсчётов принимаются в обратном порядке после обработки всей реализации. Требуется хранить массив W t(i,k) из 2´ N´ (T1+...+Tm) целых чисел, то есть объем памяти пропорционален длине реализации. Построена модификация алгоритма динамического программирования, позволяющая сегментировать последовательно участки реализации, не дожидаясь её полной обработки.

Если в вершину (i,k) из t-ой группы не входит ни одна дуга из t+1-ой группы, то очевидно, что путь по графу через эту вершину и выходящую из неё дугу не пройдёт. Такие ветви графа названы вырожденными (на рис. 2б показаны пунктиром) и алгоритм дополнен процедурой стирания таких ветвей [6]. Если после обработки отсчёта xt и удаления вырожденных ветвей в ts-ой группе вершин (ts<t) осталась только одна невырожденная, такой момент ts назван особой точкой. Участок влево от неё очевидно сегментируется однозначно независимо от результатов обработки остальной реализации сигнала. Найдя особую точку, принимается решение о сегментации участка (ts-1+1,...,ts), оставшегося несегментированной после обработки предыдущей особой точки ts-1. В результате получен алгоритм сегментации с переменной задержкой, величина которой автоматически определяется алгоритмом. Требуемый для его реализации объём памяти не зависит от длины реализации - в момент t требуется помнить значения W J (i,k), i=1,...,m, k=1,...,Ti для J =ts,...,t, то есть для не сегментированного к моменту t участка реализации. Задержка q сегментации случайна, её распределение определяется матрицей Q условных вероятностей переходов марковской цепи и видом наблюдаемого процесса и имеет вид

Видно, что для предложенных моделей особые точки возникают достаточно регулярно, хотя получить статистические оценки для этого процесса удалось только экспериментально.

Для других моделей формирования сигнала предложены аналогичные методы обработки. Вид исходного графа определяется моделью ненаблюдаемого процесса. На рис. 4 представлен граф для модели с обрывающимися фрагментами, при этом новые по сравнению с предыдущей моделью ветви выделены жирным пунктиром. Модель наблюдаемого процесса определяет способ вычисления входящего в (21) логарифма условной плотности распределения (22).

Все приведённые в третьей главе методы получают для обрабатываемой реализации сегментацию, наилучшую из всех возможных при данной модели сигнала и заданной функции потерь. К их недостаткам относится достаточно большое время работы, что нежелательно при обработке в режиме реального времени. Кроме того, время обработки одного отсчёта xt реализации сигнала для каждого алгоритма постоянно и не зависит от "сложности" стоящей перед алгоритмом задачи - одинаково долго обрабатываются участки и с высоким уровнем шума, и с низким - на которых форма легко различима "невооруженным глазом" и для сегментации которых можно было бы обойтись более простыми и быстродействующими методами.

В четвертой главе приводится ряд эвристических модификаций алгоритмов сегментации, направленных на упрощение и ускорение обработки малозашумленных участков реализации сигнала. В их основу положены детерминированные алгоритмы распознавания, принцип работы которых -разбиение пространства признаков на n непересекающихся областей, соответствующих классам событий. Границы областей описываются уравнениями гиперплоскости, поверхностями второго порядка и другими дискриминантными функционалами. Классификация очередного события проводится по факту попадания образа (набора признаков) очередного события в область данного класса.

Особенность обработки для предлагаемых моделей структурных сигналов заключается в последовательном расположении отсчётов на оси времени. Каждый отсчёт xt последовательно "проходит" по всём измерениям пространства признаков от Ti-ого до 1-ого. Для предложенных моделей при таком движении статистические свойства различных измерений пространства признаков различны и само это пространство имеет переменную размерность, величина которой Ti является еще одним, причем достаточно важным, признаком классификации. Произвольно выбранный участок реализации "подходящей" длины Ti вовсе не обязательно является образом события какого-либо класса, а может содержать части образов нескольких (чаще всего двух) классов. Вариантов таких "псевдообразов" на несколько порядков больше, чем истинных образов события, в связи с чем задача их исключения существенно сложнее, чем задача разделения истинных образов событий.

Перечисленные особенности не позволяют использовать детерминированные методы распознавания в чистом виде. Известные в настоящее время попытки построения таких методов для обработки кривых ограничиваются моделями, названными в ряде работ "безфазовыми" - для которых распределение всех отсчётов на протяжении участка одного класса статистически однородно. Все рассмотренные выше методы с точки зрения классической теории распознавания образов относятся к вероятностным методам. Преимущество детерминированных методов распознавания - быстродействие - делает их привлекательными для практического использования. В настоящей работе построены алгоритмы, частично обладающие такими свойствами.

Смешанные методы сегментации сочетают свойства вероятностных и детерминированных методов. Для события каждого класса в пространстве признаков выделена область точной классификации, при попадании в которую образа данного события производится детерминированное решение об отнесении события к данному классу. Эти области должны отвечать двум условиям. Первое - требование непересечения областей: образ события не должен попадать более чем в одну область одновременно. Второе - требование простоты описания границ - связано с особенностями моделей сигналов с повторяющимися признаками формы: провести разделяющую гиперплоскость в пространстве переменной размерности затруднительно; кроме того, процедура классификации должна быть достаточно простой - иначе теряется выигрыш в быстродействии. При этом в пространстве признаков остаются области, не относящиеся ни к одной из областей точной классификации. Образ событий в случае непопадания ни в одну из областей точной классификации будет обрабатываться ранее рассмотренными вероятностными методами. Получены алгоритмы смешанного типа, которые в зависимости от близости участка реализации к эталону данного класса сегментируют его либо детерминированными, либо вероятностными методами.

Метод "фиксированной окрестности" для каждого класса i событий задаёт некоторую величину ai. Критерием классификации является отклонение формы участка от эталона не более чем на ai в любую сторону по всём отсчётам сегмента. Область точной классификации - гиперкуб с ребром 2ai в пространстве признаков, центром которого является точка с координатами эталона. Величины ai ограничены сверху условием непересечения таких областей.

Для каждого отсчёта xt определяется набор логических переменных yik(t) как результат сравнения величины xt с матрицей эталонов Q :

(26)
Критерием отнесения сегмента (t-Ti+1,...,t) к классу i является выполнение логического условия

(27а)
либо более "мягкого" логического условия

, (27б)
то есть допускается отклонение, превышающее величину ai, для небольшого числа отсчётов, доля которых не превышает заданной малой величины e от длины эталона. В случае e =0 критерий (27б) превращается в (27а). Для модели переменной длины фрагмента рассматривается его информационно значимый средний участок. Оставшиеся неклассифицированными участки обрабатываются вероятностными методами, при этом априорные вероятности известны на обоих его концах.

Метод "окрестности переменной ширины" использует верхний и нижний пределы детерминированного решения - +j ik и -j ik соответственно. Значение логических переменных yik(t) находится как

(28)

Предыдущий алгоритм является частным случаем данного при выборе пределов +j ik=j ik+ai и -j ik=j ik-ai. Этот способ задаёт область точной классификации в пространстве признаков в виде гиперпараллелепипеда, грани которого перпендикулярны осям координат, а сам параллелепипед задан координатами двух вершин, лежащих на главной диагонали. Образ центра класса находится (при симметричном выборе пределов) в точке пересечения диагоналей. В остальном оба алгоритма для всех моделей сигнала аналогичны.

Для многоэталонного способа задания признака формы области точного принятия решений представляют собой набор ni отдельных областей для каждого эталона. Эти области (в отличие от областей для различных классов) в общем случае могут перекрываться, однако для принятия детерминированного решения о классификации образ данного участка реализации должен полностью попасть в одну из ni областей данного класса. Случай, когда он частично попадает в различные области одного и того же класса, не является основанием для точной классификации.

Ускоренные методы для модели с заданием формы линейной комбинацией эталонов используют её отличие от остальных моделей - этот способ уже задаёт область в пространстве признаков в виде выпуклой линейной оболочки, натянутой на вектора базиса (совокупности эталонных форм) данного класса событий. Эта область используется как область точной классификации событий данного класса. Предложены два типа алгоритмов ускоренной классификации. Первый использует в качестве области точной классификации выпуклую линейную оболочку класса "в чистом виде", а второй - её же с добавлением e -окрестности. Вычислять логические переменные yik(t) не требуются. Принадлежность данного участка к области точной классификации определяется после вычисления коэффициентов a i разложения сигнала на данном участке по базису эталонных форм данного класса соответственно из условий 0£ a i£ 1 либо -e j £ a i£ 1+e j для " i=1,...,ni, где e j - положительный коэффициент, определяющий величину превышения областью точной классификации размеров выпуклой линейной оболочки. В этом случае разделяющие поверхности не перпендикулярны осям координат. Таким образом, участок реализации обрабатываемого сигнала может полностью находиться между двумя эталонами, но не являться их линейной комбинацией и не входить в область точной классификации.

На приведенном графике показана зависимость времени работы ускоренного алгоритма обработки от отношения сигнал/шум по сравнению с вероятностным методом (горизонтальная линия). Пунктиром обозначены границы отклонений в различных опытах.

В пятой главе приведены методы восстановления параметров модели. В случае полностью зарегистрированной реализации алгоритм может неоднократно возвращаться к ранее обработанным участкам для более точной настройки параметров. Метод максимального правдоподобия находит оценки параметров модели из условия максимума функции правдоподобия, что для первой модели имеет вид

, где L(Q ,Q,B) = ln f (X1N/Q ,Q,B) - функция правдоподобия, , и - оценки истинных значений параметров. Для поиска функции правдоподобия предложен итерационный алгоритм [7], строящий последовательность оценок параметров увеличивающую на каждом шаге значение условной функции правдоподобия

(29)
причем равенство в (6.1.1) возможно лишь в случае, когда набор параметров удовлетворяет необходимым условиям максимума условной функции правдоподобия

(30)
Для первой модели доказана Теорема:

Последовательность значений оценок определяемая соотношениями

где W - множество всех возможных комбинаций принадлежности отсчетов реализации, удовлетворяет неравенству

причем приращение условной функции правдоподобия D L(Q s, Qs, Bs) равно нулю лишь в точках (Q *, Q*, B*). Аналогичные теоремы доказаны и для других моделей наблюдаемого и ненабдюдаемого процессов, кроме задания признака формы линейной комбинацией эталонов.

Метод заключается в вычислении апостериорных вероятностей принадлежностей отсчётов (13)¸ (16) на основании полученных на данном шаге оценок параметров , после чего находим новые оценки этих параметров. Предложенная модель позволяет разбить условие максимального правдоподобия на отдельные условия для элементов матрицы Q эталонов и вектора B уровней шума, и отдельные условия для строк матрицы Q - причём условия для элементов в строке связаны только условием нормирования. В результате получены формулы для пересчёта оценок параметров

,

,

.

Аналогичные формулы пересчёта получены для всех моделей, кроме модели с заданием признака формы линейной комбинацией эталонов. Для неё требуется одновременно с параметрами оценивать размер набора эталонов для каждого класса, поэтому данная задача рассматривается в шестой главе.

Предложенный подход к моделированию, заключающийся в использовании более сложных моделей по сравнению с чисто марковскими, позволяет получить более простые и существенно быстрее сходящиеся процедуры оценивания значений этих параметров. Условие максимального правдоподобия при таком подходе удается разбить на отдельные условия для элементов матриц Q и W и отдельные условия для строк матриц Q и V, причем условия для отдельных элементов в этих строках связаны только условиями нормирования.

Кроме метода максимального правдоподобия используется более простой метод обратной связи, который заключается в вычислении очередных оценок параметров на основании результатов сегментации, проведённой с использованием предыдущих оценок параметров. Известно, что подобные методы позволяют получить только смещённые оценки параметров, однако в ряде практических задач их точность достаточна и вполне компенсируется такими их качествами, как простота и быстродействие.

Данный м модели примут вид

Критерием окончания итерационного процесса является получение на очередном шаге сегментации, совпадающей с ранее полученной либо близкой к ней по какому-либо критерию.

Методы пересчёта оценок для остальных моделей наблюдаемого и ненаблюдаемого процессов получаются аналогично. Методы обратной связи могут использовать любой алгоритм сегментации, но в случае, когда вся реализация зарегистрирована и любой ее отсчет доступен для обработки, не имеет смысла применять последовательный алгоритм сегментации (снижается точность), и алгоритмы сегментации с задержкой (увеличивается общее время работы). Они используются при оценивании параметров в режиме реального времени.

Подход к моделированию, состоящий в применении различных матриц условных вероятностей для описания различных вероятностных характеристик ненаблюдаемого процесса, оказывается в данном случае весьма результативным, поскольку существенно снижает общее число параметров модели и при оценивании этих параметров позволяет получить отдельные условия для элементов либо строк таких матриц, что весьма значительно ускоряет сходимости алгоритмов оценивания по сравнению с одновременным оцениванием всего набора параметров модели.

Методы оценивания параметров в режиме "с учителем" используется для задания начальных приближений параметров: их близость к истинным значениям ускоряет сходимость алгоритмов оценивания. Кроме того, при некотором значении отклонения начальных приближений оценок параметров от их истинных значений алгоритм перестаёт соотносить их с эталонами именно этого класса, в результате происходит перенумерация и участки, на самом деле относящиеся к классу i, алгоритмом относятся к классу j. Это важно при решении практических задач, для которых требуется правильная нумерация классов.

В классической теории распознавания образов такой метод оценивания параметров строит правило классификации образов на основании некоторого набора размеченных объектов. При обработке структурных экспериментальных кривых редко возникает возможность получить достаточно длинную реализацию наблюдаемого процесса с известной для неё реализацией ненаблюдаемого процесса. Обычно имеется некоторый относительно небольшой участок реализации, размеченный экспертом - "учителем" с указанием моментов начала однородных участков и номеров классов соответствующих им событий. Эта разметка может быть не очень точной и поэтому пригодна только для получения предварительных оценок параметров модели. Для размеченного участка X={x1,xL}, где L - длина размеченного участка, по данным разметки восстанавливается ненаблюдаемый процесс , после чего вычисляются оценки параметров модели. С использованием дельта-функции формулы вычисления оценок параметров примут для первой модели вид

,

Формулы сходны с аналогичными для метода обратной связи. В отличие от ранее рассмотренных данный метод не является итерационным, оценки параметров вычисляются только один раз. В дальнейшем они используются в качестве начальных приближений оценок для алгоритмов максимального правдоподобия или обратной связи.

Во второй части пятой главы рассматриваются методы получения оценок параметров моделей в случае, когда такую обработку необходимо проводить в режиме реального времени. В простейшем случае после получения очередного отсчета xt необходимо сразу использовать содержащуюся в нем информацию для пересчета текущих оценок параметров модели, после чего значение отсчета больше не используется. Возможна постановка задачи, когда алгоритм "помнит" относительно небольшой участок реализации.

Основное отличие от ранее описанных методов обработки полностью зарегистрированной реализации заключается в невозможности вернуться к ранее обработанным участкам, поэтому разработанным в данной главе алгоритмам для получения такой же точности оценок требуется обработать на порядок больший отрезок реализации. Отличие во времени работы алгоритмов меньше, поскольку алгоритмы максимального правдоподобия неоднократно обрабатывают отрезок реализации, а алгоритмы реального времени-более длинный отрезок, но только один раз.

Для поиска оценок использован метод стохастической аппроксимации, однако непосредственное применение процедур Роббинса-Монро или Кифера-Вольфовица невозможно, поскольку для реализации первой из них придётся вычислить производную от функции, заданной алгоритмом последовательного пересчета. В обоих случаях после получения на очередном t-ом шаге новых оценок параметров требуется вычислить вероятностей принадлежности очередного отсчета на основании этих значений, которые вычисляются рекуррентными процедурами (13)¸ (16) начиная с первого отсчета. Такой алгоритм не может работать в режиме реального времени.

Используется модификация метода стохастической аппроксимации для работы в реальном времени. Сохраняется общая схема Роббинса-Монро. Пусть на предыдущем шаге t-1 были получены оценки параметров , , и вычислены вероятности P*(ht-1=i,t t-1=k-1/X1t-1) принадлежности отсчёта xt-1. Пересчитаем эти вероятности в P*(ht=i,t t=k/X1t) с учётом значения нового отсчёта xt и новых оценок параметров с помощью одного шага процедуры (13)¸ (16). На основе полученных вероятностей и значения xt пересчитаем оценки параметров , , . При этом для ускорения сходимости процедуры используются отдельные последовательности коэффициентов авторегрессии для элементов матрицы Q , вектора B и строк матрицы Q. Процедура пересчёта для первой модели примет вид:

i=1,...,m, k=1,...,Ti,
где .

Особенность обработки структурных сигналов: на очередном однородном интервале оцениваются только некоторые параметры модели, соответствующие данному классу. На этом интервале должны уменьшаться последовательности коэффициентов для оцениваемых параметров и оставаться постоянными коэффициенты для параметров, оценки которых не изменяются. Используются наборы коэффициентов, скорость уменьшения которых пропорциональна апостериорным вероятностям соответствующих событий:

a,b,c=conct>0, s0ik=v0i=w0i=0, i=1,...,m, k=1,...,Ti.

Доказана теорема о сходимости процедуры с таким выбором последовательностей коэффициентов. Приведены процедуры пересчета параметров для всех предложенных в работе моделей наблюдаемого и ненаблюдаемого процессов, кроме задания признака формы линейной комбинацией эталонных форм (этот случай рассматривается в главе 6). Разработаны также методы обратной связи для пересчёта параметров моделей в режиме реального времени. Они более просты и имеют большее быстродействие по сравнению с методами стохастической аппроксимации, и достаточную точность для решения ряда практических задач. Для оценивания параметров модели в режиме "с учителем" для такой организации поступления информации также предложены методы пересчёта текущих оценок по размеченной реализации.

Шестая глава посвящена методам оценивания неизвестной структуры. Под структурными параметрами модели в узком смысле понимаются ее размерность-целочисленные параметры числа классов m, вектор длин эталонов T, число ni эталонных форм в каждом классе, для трехуровневой модели-число классов как на первом, так и на втором ненаблюдаемом уровнях, что соответствует второму и третьему уровням структурного процесса. В более широком смысле под структурой (структурными параметрами) понимаем в дополнение к перечисленным нечисловые параметры: тип модели ненаблюдаемого процесса (фиксированной или случайной длины, одно- или двусторонне обрывающиеся), тип модели наблюдаемого процесса (с повторением средней формы, многоэталонным заданием формы или линейной комбинацией базисных форм, с перекрыванием; сюда же отнесем случай, когда части классов соответствуют шумоподобные участки, описываемые уравнением авторегрессии), а также сложность иерархической структуры модели (использование двух, трех или большего числа уровней структурного случайного процесса в данной модели). Структурные параметры нельзя рассматривать как обычные параметры распределения. В частности, по ним нельзя дифференцировать функцию плотности вероятности, поэтому не выполняется условие регулярности и традиционные методы оценивания неприменимы. Задача оценивания структуры модели решается для случая полностью зарегистрированной реализации.

Существенной особенностью предложенных моделей является то, что число их независимых параметров зависит от конкретного вида оценок этих параметров, причем наиболее сильно - от значений элементов матриц условных вероятностей. При одинаковом числе классов и равных длинах эталонов число независимых параметров может отличаться в несколько раз, а иногда - и на несколько порядков. Кроме того, процесс оценивания параметров для модели с заданием признака формы линейной комбинацией эталонов неразрывно связан с оцениванием размерности этих наборов. В связи со всем вышеизложеннымизвестные методы оценивания размерности для применения к данным моделям структурного процесса нуждаются в существенных изменениях.

Если для оценивания параметров модели использовать метод максимального правдоподобия, то в качестве меры близости двух распределений может служить величина среднего логарифма максимального правдоподобия модели, а асимптотически несмещенной оценкой этой величины служит информационный критерий Акаике (ИКА). Таким образом, задача идентификации сводится к заданию множества допустимых моделей и оцениванию параметров каждой модели методом максимального правдоподобия с последующим выбором модели, обладающей минимальным значением ИКА.

Информационный критерий Акаике представляет собой аддитивную поправку к условной функции правдоподобия, зависящую от размерности модели. Для использованных моделей она имеет вид

ИКА[m,A(m)]=-L[m,A(m)]+U(m), (31)
где L[m,A(m)] - логарифмическая функция правдоподобия для реализации X1N при фиксированной структуре модели (m): L[m,A(m)]=lnf(X1N/m,A(m));

A(m)=[T(m),Q(m),B(m),Q (m,Tmax)] - искомая совокупность оцениваемых вторичных параметров для фиксированного набора первичных параметров (m), где Q (m,Tmax) - множество эталонных форм фрагментов, T(m) и B(m) - вектора длин эталонов и уровней шума ;

U(m) - число независимых вторичных параметров, различное для разных моделей формирования сигнала.

Процедура минимизации ИКА заключается в нахождении оценок максимального правдоподобия для каждого набора первичных параметров (m) с последующим выбором набора (m), обеспечивающего минимальное значение ИКА в заданном интервале mmin£ m£ mmax: . При этом функция правдоподобия не может быть выписана в явном виде и, очевидно, найти оценки максимального правдоподобия дифференцированием функции правдоподобия по параметрам невозможно.

Предлагаемая в настоящей работе итерационная процедура минимизации ИКА, являющаяся обобщением итерационного алгоритма построения оценок максимального правдоподобия на случай неизвестных первичных параметров. Алгоритм работает следующим образом: Для каждого значения размерности модели m в заданном интервале mmin £ m £ mmax "запускается" алгоритм оценивания параметров модели методом максимального правдоподобия, при этом не только оценивается набор параметров A(m) для данной размерности m, но и фиксируется достигнутое значение логарифмической функции правдоподобия L[m,A(m)]=lnf(X1N/m,A(m)). После этого вычисляется число независимых параметров модели U(m) для данной размерности m, которое зависит от полученных оценок параметров, вычисляются значения информационного критерия Акаике и находится искомая оценка размерности по критерию (31). Методы разработаны для всех комбинаций предложенных моделей наблюдаемого и ненаблюдаемого процессов, доказана теорема о сходимости предложенного метода. Для модели с многоэталонным заданием формы предложен метод обратной связи, использующий разбиение реализации на выборки отдельных классов на основании полученных на предыдущем шаге оценок параметров. На выборках независимо оцениваются размерности наборов эталонов каждого класса по критерию Акаике. Скорость сходимости такого алгоритма увеличивается.

Рассматриваются методы оценивания параметров модели с заданием признака формы линейной комбинацией эталонов с использованием критерия Акаике - поскольку в данном случае оценивание размерности набора эталонов неразрывно связано с оцениванием их форм. Наиболее быстрый метод оценивания использует предварительную обработку алгоритмом оценивания параметров для многоэталонной модели и разбиение с её помощью реализации наблюдаемого процесса на выборки классов, на которых независимо проверяются гипотезы о возможности использования других моделей наблюдаемого процесса и оценивается их размерность. Этот же метод используется и для выбора типа модели, в том числе авторегрессионных (могут быть получены различные типы моделей для разных классов событий). При этом используются известные алгоритмы оценивания размерности для моделей авторегрессии со скачкообразно изменяющимися параметрами [8,11], после чего сравниваются достигнутые значения критерия AIC для различных моделей и выбирается вид модели (с уже выбранной размерностью). Для определения структуры в ряде случаев использован метод проверки статистических гипотез - например, для проверки возможности совпадения эталонных форм различных классов событий для их объединения в один класс.

В седьмой главе рассматриваются результаты практического использования разработанных алгоритмов. Первая часть главы описывает экспериментальную проверку их работоспособности и качества работы на модельном материале, по результатам которой дан ряд рекомендаций по практическому использованию разработанных моделей и алгоритмов.

Вторая часть описывает применение разработанных методов для решения некоторых практических задач обработки больших массивов информации. Методы сегментации при известных параметрах модели применены при разработке программного обеспечения сканирующих микрокалориметров для системы управления режимом регистрации данных, которая на основе предварительной обработки данных и выделения на экспериментальных кривых по заданным признакам информативных участков, соответствующих интересующим исследователя процессам, управляла режимом записи результатов эксперимента. Была получена система с параметрами: вероятность пропуска не выше 2%, вероятность "ложной тревоги" не выше 5%. Эти работы были выполнены в СКБ Биологического приборостроения АН СССР (г. Пущино, 1985-1990 гг.). Методы сегментации при известных параметрах модели и методы оценивания неизвестных параметров модели применены при разработке программного обеспечения приборов для исследования гемодинамики. Система управления на основании предварительной обработки данных для быстрого получения некоторых основных показателей процесса кроме выделения на реализации сигнала интересующих исследователя информативных участков использовалась для прогнозирования "аварийных ситуаций" в ходе проведения эксперимента, заранее описанных экспериментатором как "недопустимые". Работа также была выполнена в СКБ Биологического приборостроения. В качестве примера задач, приводящих к необходимости трёхуровневой модели структурного процесса, описывается обработка стабилограмм - результатов опыта по длительному поддержанию позы человеком. В данном случае наблюдаемый процесс отражает перемещение центра тяжести стоящего на платформе человека. Этот процесс в свою очередь претерпевает несколько изменений, интерпретируемых как смена программ поведения. Для описания такого процесса и были предложены [8,11] модели с тремя и более уровнями. Предложенные методы структурной обработки данных были использованы при анализе клеточного состава крови у крыс при низкоинтенсивном крайневысокочастотном электромагнитном облучении. Работа выполнена на Медицинском факультете Тульского государственного университета.

Приводится описание использования предложенных методов для обработки экспериментов по выявлению эффектов взаимодействия электромагнитного поля с живым веществом, проводимых в НИИ новых медицинских технологий. В частности, описывается эффект пространственной модуляции КВЧ-излучения нетепловой интенсивности. Данные эксперимента обрабатывались по предлагаемой в настоящей работе методике с использованием модели с заданием признака формы линейной комбинацией эталонов.

Описано использование методов сегментации и оценивания параметров в режиме реального времени для разработки метода контроля температуры процесса по косвенным признакам в установке для плавки сульфидных руд в "жидкой ванне" (ПЖВ)- работа выполнена совместно с Московским институтом стали и сплавов. Разработанные методы структурного анализа были использованы в рамках комплексной инновационной научно-технической программы 13.22 "Создание комплексов обработки изображений и средств отображения информации", Тульский Государственный университет. Алгоритмы обработки больших массивов информации использованы при выполнении хоздоговорных работ "Разработка алгоритмического обеспечения для системы контроля качества непрерывно-литых заготовок" и "Разработка программно-технических средств для системы ввода-вывода бинарной информации на микрофильм", выполненных на кафедре ЭВМ ТулГУ. Основные теоретические результаты работы включены в конспект лекций по курсам "Основы искусственного интеллекта" и "Основы теории управления". Предложенные методы используются для обработки биомедицинской информации сотрудниками НИИ новых медицинских технологий и медицинского факультета ТулГУ.

В конце главы приведены области возможного эффективного применения разработанных алгоритмов для решения задач управления в биологических и медицинских системах и ряд практических рекомен нятия диагностических решений по косвенным данным посредством анализа признаков повторяющейся формы и закономерностей их появления на реализации генерируемого объектом сигнала. Решение указанной проблемы позволяет развить перспективное научное направление разработки методов диагностики в биологии и медицине.

  1. Предложена концепция моделирования для описания поведения объектов со сложной структурой поведения как реализации многоуровневого структурного случайного процесса, отличающегося раздельными механизмами чередования типов событий и вариаций их длительностей, что позволяет описывать процессы с любыми дискретными законами распределения, включая полимодальные.
  2. Предложен способ описания исследуемого объекта, являющегося источником сигнала, с помощью иерархической модели многоуровневого случайного процесса, что позволяет описать совместное влияние многих факторов на исследуемый объект.
  3. В рамках общего подхода разработаны три различных способа задания признака повторяющейся формы, пригодных для описания экспериментальных данных биомедицинского происхождения, а также способ формирования наблюдаемого сигнала путем сложения форм соседних участков, пригодный для всех способов задания признака формы.
  4. Предложено четыре модели для описания ненаблюдаемого процесса второго уровня (чередования однородных участков), которые могут применяться в различных сочетаниях друг с другом, основанные на однородном Марковском процессе переключений. Дана общая модель для описания ненаблюдаемого процесса третьего и более высоких уровней. Все модели предусматривают возможность совместного использования с известной моделью авторегрессии со скачкообразно изменяющимися параметрами для описания сигналов со сложным характером поведения.
  5. Модели разных уровней могут использоваться в любых сочетаниях. Получен набор порождающих моделей, обеспечивающих описание широкого класса объектов и позволяющих проводить интерполяцию и экстраполяцию данных в случае их неполноты, что достаточно вероятно при обработке медицинских данных.
  6. Применительно к предложенным моделям сформулированы основные группы задач обработки структурных сигналов: задачи сегментации или определения ненаблюдаемых состояний источника сигнала при известных параметрах модели (аналог собственно распознавания образов), задачи восстановления неизвестных параметров модели "с учителем" и "без учителя" (аналог обучения и самообучения распознаванию образов) и задачи оценивания неизвестной структуры модели (аналог выбора модели и метода распознавания). Каждая задача имеет несколько подзадач в зависимости от объёма априорной информации, организации процесса обработки и потоков информации, целей и задач исследования.
  7. Исследованы различные постановки задачи сегментации и различные виды функций потерь. Предложен ряд алгоритмов сегментации - на основе всей реализации, только её предшествующей части, с постоянной и переменной задержкой. Построен алгоритм, использующий общую схему метода динамического программирования, модификация этого алгоритма пригодна для работы в реальном времени.
  8. Предложен новый метод построения алгоритмов сегментации, являющийся комбинацией вероятностных и детерминированных методов. Построенные по этому методу алгоритмы обеспечивают существенный выигрыш в быстродействии без заметного снижения качества сегментации. Сигнал сегментируется с помощью быстрых детерминированных методов на участках с низким отношением шум/сигнал, затем более медленными вероятностными методами обрабатывают участки, с которыми не справились детерминированные методы, что позволяет существенно увеличить быстродействие без заметного снижения точности работы алгоритмов.
  9. Задача восстановления неизвестных параметров модели исследована в двух схемах организации потока информации. Для случая полностью зарегистрированной и доступной для обработки реализации предложен подход, основанный на методе максимального правдоподобия, предложена итерационная процедура пересчета оценок параметров, доказана теорема о сходимости этой процедуры и получены формулы пересчёта для параметров, позволяющие не вычислять на каждом шагу значение функции условного правдоподобия.
  10. Для оценивания параметров в режиме реального времени использован метод стохастической аппроксимации. Задача оценивания параметров сведена к задаче поиска корня уравнения регрессии, предложена итерационная процедура пересчета оценок параметров, использующая общую схему метода Роббинса и Монро. Применен специальный способ формирования последовательности коэффициентов стохастической аппроксимации, существенно ускоряющий сходимость процесса, доказана теорема о выполнении необходимых условий сходимости процесса при таком выборе коэффициентов.
  11. Для восстановления неизвестных параметров модели в обеих схемах организации потока информации предложены алгоритмы, построенные по схеме с обратной связью. Они отличаются большим быстродействием по сравнению с "точными" алгоритмами, а полученные в результате их работы оценки параметров пригодны для использования в ряде практических задач.
  12. Для обеих схем организации потока информации даны алгоритмы идентификации неизвестных параметров модели в режиме "с учителем". Они используются для получения начальных приближений оценок параметров, которые затем уточняются другими алгоритмами в режиме "без учителя".
  13. Исследованы задачи оценивания неизвестной структуры модели, под которой понимается вид используемой модели и её размерность. Для оценивания неизвестной размерности использованы метод сравнения статистических гипотез и метод, основанный на информационном критерии Акаике (AIC).
  14. Предложены методы выбора вида модели (моделей), используемой для описания данного процесса, также основанные на информационном критерии Акаике, дающие возможность построения "гибридных" моделей, и методы оценивания числа уровней иерархических многоуровневых моделей.
  15. Предложен итерационный метод, подбирающий за конечное число шагов тип модели для каждого класса ненаблюдаемой последовательности событий, позволяющий одновременно оценивать тип и размерность моделей.
  16. Разработанные алгоритмы использованы для решения ряда прикладных задач обработки результатов эксперимента в биомедицинских системах.

СПИСОК ОСНОВНЫХ РАБОТ ПО ТЕМЕ ДИССЕРТАЦИИ

  1. Математическая обработка результатов исследований в медицине, биологии и экологии: Монография / С.А. Воробьёв, А.А. Яшин; Под ред. А.А. Яшина. - Тула: ТулГУ, 1999. - 120 с.
  2. Воробьёв С.А. Оптимальные алгоритмы выделения непрерывных линий на полутоновых изображениях // Автоматические системы оптимального управления технологическими процессами. / ТПИ. Тула, 1982. - С. 83-90.
  3. Воробьёв С.А. Алгоритмы выделения и классификации фрагментов повторяющейся формы на экспериментальных кривых // Автоматика и телемеханика, 1985. - № 8. - С. 89-93.
  4. Yakovlev V.G., Vorob'yov S.A. Estimation of model parameters of random processes with instantly changing properties // Preprints of the Second IFAC Symposium on Stochastic control. / Vilnius, USSR, 1986. - Part 2. - P. 224-228.
  5. Vorob'ev S.A. Algorithms for Identification and Classification of Repeating Fragments on Experimental Curves // Automation and Remote Control. - New York, USA, 1986. - V. 46. - №. 8. - Part 2. - P. 1003-1006.
  6. Воробьёв С.А.. Иванова Т.О. Анализ трехуровневого структурного случайного процесса (модель и методы) // Методы и алгоритмы анализа эмпирических данных. / ИПУ. - М.:, 1988. - С. 49-57.
  7. Воробьёв С.А. Алгоритмы обработки экспериментальных кривых с фрагментами повторяющейся формы нестабильной длины // Статист. пробл. управл. / ИМК АН Литвы. - Вильнюс, 1990. - № 89. - С. 144-149.
  8. Воробьёв С.А. Алгоритмы динамического программирования в задаче распознавания потока событий в реальном масштабе времени // Системы автоматического управления и их элементы. / ТулГТУ. - Тула, 1994. - С. 128-135.
  9. Воробьёв С.А. Задача оценивания размерности модели в алгоритме восстановления параметров модели структурных кривых с фрагментами повторяющейся формы // Электротермические процессы и установки. / ТулГТУ. - Тула, 1994. - С. 63-67.
  10. Воробьёв С.А. Алгоритм максимального правдоподобия восстановления параметров модели структурных случайных процессов с фрагментами повторяющейся формы // Алгоритмы и структуры систем обработки информации. / ТулГУ. - Тула, 1995. - С. 103-109.
  11. Воробьёв С.А. Алгоритмы сегментации структурных экспериментальных кривых с многоэталонным заданием классов // Известия Тульского госуниверситета. Сер. Математика Механика. Информатика. - Тула: ТулГУ. - 1996. - Т. 2. - Вып. 3. - С. 45-49.
  12. Воробьёв С.А. Анализ экспериментальных кривых с фрагментами повторяющейся формы переменной длины при неизвестной размерности модели // Системы автоматического управления и их элементы. / ТулГУ. - Тула, 1996. - С. 157-161.
  13. Воробьёв С.А., Игнатьева Т.В. Структурный подход к задаче выделения участков повторяющейся формы на экспериментальных кривых // Применение вычислительной техники в измерительных системах. Межвузовский сборник. - Ижевск: "Экспертиза", 1997. - С. 11-15.
  14. Игнатьев В.М., Воробьёв С.А. Оценивание параметров модели структурных экспериментальных кривых с многоэталонным заданием классов // Научно-технический сборник № 4 Михайловской артиллерийской академии. - СПб, 1997. - С. 63-71.
  15. Воробьёв С.А. Базисное задание формы структурных экспериментальных кривых на повторяющихся участках // Известия Тульского Государственного университета. Сер. Математика Механика. Информатика. / ТулГУ. Тула, 1997. - Т. 3. Вып. 3. - C. 10-13.
  16. Воробьёв С.А. Методы структурного анализа экспериментальных кривых с участками повторяющейся формы // Автоматизация и современные технологии, 1997. - № 7. - С. 22-25.
  17. Данилкин Ф.А., Воробьёв С.А. Использование теории нечетких множеств для описания сегментации изображений // Известия Тульского Государственного университета. Сер. Математика Механика. Информатика. / ТулГУ. - Тула, 1997. - Т. 3. - Вып. 3. - C. 21-23.
  18. Воробьёв С.А. Методы структурного анализа экспериментальных кривых с участками повторяющейся формы при неизвестных параметрах модели // Автоматизация и современные технологии, 1997. -№ 9. -С. 26-29.
  19. Воробьёв С.А. Структурный анализ экспериментальных кривых при параллельном оценивании неизвестных параметров модели // Автоматизация и современные технологии, 1997. - № 11. - С. 13-16.
  20. Воробьёв С.А. Оптимальные алгоритмы разбиения структурных экспериментальных кривых с повторяющимися признаками формы // Известия Тульского Государственного университета. Сер. Математика Механика. Информатика. Тула, ТулГУ, 1998, Т. 4. Вып. 3. C. 12-17.
  21. Воробьев С.А., Яшин А.А. Методы обработки структурных кривых с повторяющимися признаками формы при обработке результатов медико-биологического эксперимента // Вестник новых медицинских технологий, 1998. - Т.V. - № 3-4. - С. 17-19.
  22. Игнатьев В.М., Воробьев С.А. Ускоренные методы сегментации структурных экспериментальных кривых с фрагментами повторяющейся формы // Известия Тульского Государственного университета. Сер. Вычислительная техника. Автоматизация. Управление. / ТулГУ. - Тула, 1997. - Т. 3. - Вып. 1. - С. 47-63.
  23. Воробьев С.А., Ларкин Е.В. Оценивание параметров модели структурных кривых с многоэталонным заданием классов в режиме реального времени. // Известия Тульского Государственного университета. Сер. Вычислительная техника. Автоматизация. Управление. / ТулГУ. - Тула, 1997. - Т. 3. - Вып. 2. - С. 59-68.
  24. Воробьев С.А. Структурный анализ результатов медико-биологического эксперимента при неизвестных параметрах модели // Вестник новых медицинских технологий, 1999. - Т.VI. - № 1. - С. 113-115.
  25. Воробьёв С.А. Способы задания признака формы в задаче структурного анализа результатов медико-биологического эксперимента // Физика волновых процессов и радиотехнические системы. 1999. Т.2. № 2. с. 60-62.
  26. Методы структурной обработки экспериментальных данных с участками повторяющейся формы // Известия Тульского Государственного университета. Сер. Математика Механика. Информатика. Тула, ТулГУ, 1999, Т. 5. Вып. 3, c. 15-20.
  27. Обработка результатов биофизического эксперимента с высокочастотным облучением методом автоматизированного анализа структурных кривых с повторяющимися признаками формы // Электродинамика и техника СВЧ и КВЧ. Electrodynamics and Technique of Microwave and EHF. М.: 1999, Вып. 3(24), С. 157.

Дополнительную информацию
о работах соискателя можно получить
по следующим адресам адресам

http://vorobei.narod.ru/
E-mail: vorobei@uic.tula.ru
FidoNet 2:5022/49.40 aka 2:5022/25.58

Сайт создан в системе uCoz