МИНИСТЕРСТВО ОБЩЕГО И ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ РФ ПЕНЗЕНСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ Н. П. Вашкевич, Е. И. Кали...
2 downloads
195 Views
489KB Size
Report
This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form
МИНИСТЕРСТВО ОБЩЕГО И ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ РФ ПЕНЗЕНСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ Н. П. Вашкевич, Е. И. Калиниченко
ПРОЕКТИРОВАНИЕ ПАРАЛЛЕЛЬНЫХ АЛГОРИТМОВ В ЗАДАЧАХ ИДЕНТИФИКАЦИИ Учебное пособие
ПЕНЗА 1999
УДК 519.713 В 23 Вашкевич Н.П., Калиниченко Е.И. Проектирование параллельных алгоритмов в задачах идентификации: Учеб. пособие. - Пенза: Пенз. государ. ун-т, 1999. - 80 с.: 18 ил., библиогр. 5 назв. Рассматриваются вопросы решения задач распознавания цепочек - образов с использованием теорий регулярных выражений алгебры событий и недетерминированных автоматов. Приводятся примеры решения таких задач. Предлагается методика проектирования параллельных алгоритмов. Описывается инструментальная система, позволяющая автоматизировать разработку алгоритмов с последующей их верификацией. Учебное пособие подготовлено на кафедре "Вычислительная техника" и предназначено для студентов специальности 2201 при изучении ими дисциплин "Теория автоматов", "Недетерминированные автоматы и их применение", "Системное программирование", выполнения курсового проектирования, а также может быть использовано студентами других специальностей при изучении дисциплин связанных с синтаксическим анализом и т.п. Рецензент М. М. Бутаев, к.т.н., вед.н.с. ГНПП “ Рубин” © Издательство Пензенского государственного университета, 1999 © Н. П. Вашкевич, Е. И. Калиниченко
2
Предисловие Задачи идентификации языков, реализуемые цифровым автоматом-распознавателем, имеют в настоящее время очень широкое применение. В частности, идентификация цепочек символов входит как составная часть во многие задачи, связанные с редактированием текстов, поиском данных и символьной обработкой. Многие программы для редактирования текстов разрешают пользователю задавать типы замен в цепочке - тексте. Например, пользователю необходимо заменить какое-то слово другим словом во всем тексте или его части. Чтобы выполнить такое действие, программа редактирования текста должна суметь найти вхождение слова и определить его местоположение. Некоторые искусные редактирующие программы разрешают пользователю в качестве множества заменяемых цепочек символов указывать регулярное множество [1]. Например, пользователь может поставить задачу: "Заменить [Z*] в тексте W пустой цепочкой", имея в виду, что в W следует стереть пару квадратных скобок и символы между ними. Антивирусной программе, для обнаружения "простых" вирусов необходимо найти последовательность байт (сигнатуру), а при поиске "полиморфных" вирусов обнаружение сигнатуры может входить как одна из составляющих технологии поиска. В данном пособии приводятся методы и примеры решения таких задач. При проверке алгоритмов использовалась система "СОМПА", в разработке которой принимали самое активное участие студенты Синев С. А. (гр. 95В1), Антонов А. В., Токарев А. Н. (гр. 96ВВ1). Использованы также результаты курсовой работы студента Евдокимова А.С. (гр. 96ВВ3). 1 Задачи идентификации В типичной задаче идентификации цепочек -образов - задаются входная последовательность W (например, символов или пронумерованные фрагменты графических файлов и т.п.)) и множество цепочек-образов {z1, z2, ... zn}. Требуется найти либо хотя бы одно вхождение какой-то цепочки-образа, либо m из n (1 ≤ m