СИНХРОНИЗАЦИЯ ПРОЦЕДУР НЕЙРОСЕТЕВОГО ОБУЧЕНИЯ ОСОБЕННОСТЯМ

advertisement
Информационно-инновационные технологии: интеграция науки, образования и бизнеса: Труды II Международной
научно-практической конференции. - 2011. - Том 2. - С. 118-123
СИНХРОНИЗАЦИЯ ПРОЦЕДУР НЕЙРОСЕТЕВОГО ОБУЧЕНИЯ ОСОБЕННОСТЯМ
РУКОПИСНОГО ПОЧЕРКА ПО ТОЧКАМ СМЕНЫ НАПРАВЛЕНИЯ ДВИЖЕНИЯ
1
ПЕРА
Ахметов Б.С., Елфимов А.В., Иванов А.И.,Малыгин А.Ю.
Казахский национальный технический университет, г.Алматы, Казахстан, b_akhmetov@ntu.kz
Пензенский государственный университет, г.Пенза, Россия, pniei@penza.ru
1
Вычисление вектора
контролируемых
биопараметров
Первичное преобразование физического
образа в электронный
Биометрический
образ на физическом
уровне
Рукописный почерк каждого человека несет в себе практически однозначные данные об
этом человеке, позволяющие определить и доказать авторство рукописного текста и даже
отдельного слова. Анализ этих данных можно использовать как для идентификации автора
текста, так и для распознавания самого текста.
Одним из направлений анализа биометрии рукописного почерка является
использование искусственных нейронных сетей. Особенностью нейронных сетей является
то, что они способны преобразовывать непрерывные биометрические данные в выходной
код. Это находит свое применение в вопросах идентификации человека по его рукописному
вводу. В частности для этого может быть использован один нейрон, который будет
принимать решение «Свой» или «Чужой» [1-4]. Блок-схема вырожденного нейросетевого
преобразователя биометрия-код с одним выходом представлена на рисунке 1.
Составной
нейрон
Да / Нет
3
2
Нейросетевой контейнер для
хранения личной биометрии
Таблицы связей и таблицы
весовых
коэффициентов
обученного нейрона
4
Рисунок 1 – Вырожденный
единственным составным нейроном
нейросетевой
преобразователь
биометрия-код
с
Нейросетевой преобразователь использует преобразованный в электронный вид
биометрический образ (для рукописной идентификации это рукописный текст или слово). На
основе этого образа вычисляется вектор контролируемых биометрических параметров,
поступающий на вход составного нейрона. В соответствии с данными этого вектора
1
Статья подготовлена в рамках выполнения комплексного проекта «Разработка и подготовка производства
телекоммуникационного оборудования, разработка программного сетевого, прикладного и специального
обеспечения для создания цифровых сетей связи с персонализированным доступом» в соответствии с
Постановлением Правительства № 218 от 09.04.2010 г.
искусственная нейронная сеть принимает решение о принадлежности входного образа к
множествам образов «Свой» или «Чужой».
Использование искусственных нейронных сетей для распознавания рукописного
почерка [5] использует ту же концепцию, только выдавая на выходе не флаг принадлежности
свой/чужой, а принадлежность распознаваемой буквы «к» ее электронному представлению в
виде двоичного кода символа.
Использование искусственных нейронных сетей при работе с рукописными символами
(в том числе и при распознавании знаков) опирается на преобразования ортогональных
проекций функции колебания пера в коэффициенты разложения ортогонального ряда Фурье.
Эти коэффициенты разложения и являются входными данными для обучения искусственных
нейросетей и исходными данными для вынесения решений.
Данные во входном векторе нейросети должны нести как можно больше
индивидуальных особенностей биометрии рукописного почерка человека. Чем полнее будут
эти биометрические данные, тем эффективней будет обучение и работа искусственной
нейронной сети. Для иллюстрации процесса обучения может быть использована
вычислительная среда моделирования «НейроПреподаватель», используемая с 2000 года. В
качестве примеров образа «Свой» воспользуемся 13 рукописными образами слова «Пенза»,
воспроизведенными одним и тем же человеком (рисунок 2).
В качестве анализируемых параметров среда моделирования «НейроПреподаватель»
использует коэффициенты Фурье колебаний пера, получающихся при рукописном
воспроизведении анализируемых слов. На рисунке 2 приведен пример подобных колебаний.
Рисунок 2 – Пример колебаний пера Y(t) и X(t) при рукописном воспроизведении
парольного слова «Пенза»
Практика показала, что для рукописных слов из 4, 5, 6 букв достаточно учитывать
порядка 24 косинусных и синусных коэффициентов ряда Фурье (k=1,2,3,…., 24). Тогда учет
2 координат позволяет получить вектор из 96 биометрических параметров:
1T
2
 k   Y (t )  cos(k
t )dt,
T0
T
 3k 
1T
2
X( t )  cos(k
t )dt ,

T0
T
( 1.2 );
1T
2
 2 k   Y (t )  sin( k t )dt
T0
T
( 1.4 );
 4k 
1T
2
X( t )  sin( k t )dt

T0
T
где T - полное время ввода подписи (рукописного слова-пароля).
(1.3);
(1.5);
Кроме использования непосредственного полного начертания слова для получения
вектора входных коэффициентов Фурье возможно также расширение вектора с помощью
использования коэффициентов преобразования неравномерно найденных кривых,
формирующих само рукописное слово или символ (использование равномерных разбиений
кривых обхода неэффективно вследствие того, что такие участки будут давать
коэффициенты с высокой линейной зависимостью к уже полученным биометрическим
параметрам из анализа целого слова или символа). Границы таких неравномерных участков
можно привязывать к точкам смены направления движения пера автора.
На рисунке 3 на примере рукописного образа буквы «а» показаны точки, являющиеся
точками экстремальной смены направления движения пера при рукописном вводе. Как видно
из рисунка – такими точками являются точки начала и конца росчерка пера, в которые
входят и точки разрыва между символами (отрыва пера от бумаги), а также точки, в которых
перо резко меняет своё направление, образуя своеобразные острые углы на начертании
символа.
Рисунок 3 – Точки экстремальной смены направления движения пера
Обнаружение таких точек является отдельной задачей, которую возможно решить
рядом способов: первый из них – визуальное определение этих точек человеком и отметка их
на псевдодинамике. Второй способ – обнаружение точек смены направления движения пера,
как пересечений производной от функции псевдодинамики с осью х. Третий - отслеживание
направления движения пера и отметка точек смены этого направления.
Ручное обнаружение в полуавтоматическом режиме имеет самый высокий показатель
точности и синхронизации точек экстремальной смены направления пера. При применении
этого метода оператор вручную отмечает точки синхронизации и передаёт их программе
масштабирования.
Хотя это и самый точный метод – он имеет ряд недостатков. В эти недостатки входят:
 необходимость создания интерфейса взаимодействия с пользователем;
 высокие трудозатраты оператора, так как ему придется отмечать экстремальные точки
на каждом введенном символе;
 большие временные затраты системы на обработку входных данных – так как все
входные данные будут проходить через оператора – это на порядки понизит скорость
обработки данных системой.
Обнаружение точек смены направления движения пера, как пересечений производной
от функции, описывающей движение пера при обходе псевдодинамики рукописного ввода,
фактически решает проблему, так как производная от этой функции пересекает ось
координат при любом изменении направления штриха пера. Однако вычисление уравнения
производной от функции движения пера сопряжено с серьезными вычислительными
нагрузками на обрабатывающий данные компьютер, что так же ухудшает быстродействие
системы. Кроме того, необходимо также решение уравнения производной, что тоже требует
ресурсов.
Отслеживание направления движения пера при обработке псевдодинамики
рукописного ввода является фактически приложением предыдущего варианта решения
проблемы через производную функции движения пера в псевдодинамике к дискретным
значениям точек псевдодинамики и вычисления изменения к каждой последующей точке.
Фактически мы определяем Х и Y для каждой точки псевдодинамики и вычисляем
непосредственное значение производной от функции псевдодинамики в данной точке.
Нахождение точек смены знака производной(X или Y) даст нам точки изменения
направления движения пера в псевдодинамике рукописного ввода.
Однако точки изменения направления движения пера не всегда являются точками
экстремального изменения движения пера. Поэтому для этого необходимо выделить из всех
точек смены направления пера, точки его экстремального изменения. Это возможно при
обнаружении точек, в которых производная меняет свой знак одновременно и по оси Х и по
оси Y.
Рассмотрим обнаружение экстремальных точек при написании символа «м».
Начертание символа изображено на рисунке 4.
Рисунок 4 – Начертание буквы «м»
Как видно из рисунка – псевдодинамика имеет две экстремальные точки и задача
состоит в том, чтобы обнаружить их позицию в массиве координат для учета при
выполнении масштабирования. Для этого нам необходимо получить производные движения
пера по осям X и Y. Графики движения пера по осям изображены на рисунке 5, а графики их
производных – на рисунке 6.
Рисунок 5 – Разложение движения пера по осям
Рисунок 6 – Производные движения пера по осям
Анализ производных дает две точки одновременной смены знака обеими
производными от движений пера по осям Х и Y. На рисунке 7 отмечены две точки
одновременной смены знака производными – они соответствуют точкам 74 и 37 во входном
массиве точек динамики воспроизведения рукописных символов.
Рисунок 7 – Точки одновременной смены знака производными
На рисунке 8 эти точки отмечены пересечением прерывистых линий. Как видно из
этого рисунка – в отмеченных точках происходит экстремальная смена направления
движения пера. Найденные точки можно использовать как точки синхронизации при
разбиении динамики воспроизведения на участки для получения коэффициентов
преобразования Фурье. Анализ полученных неравномерных участков динамик
воспроизведения рукописных символов даст в несколько раз меньше косинусных и
синусных коэффициентов ряда Фурье для передачи в вектор входных коэффициентов
нейросети из-за уменьшения участка анализа, но большое количество таких неравномерных
участков дает значимое увеличение вектора биометрических параметров.
Рисунок 8 – Точки номер 37 и 74 в исходном начертании символа
Использование равномерно полученных биометрических параметров на примере слова
«Пенза» дает для учета 94 контролируемых параметров.
Таким образом, применение дополнительного разложения областей между особыми
точками позволяет провести разложение еще по девяти неравномерным участкам. При учете
с преобразования по этим участкам хотя бы четырех косинусных и синусных
коэффициентов ряда Фурье к вектору контролируемых параметров можно добавить еще 81
параметр и повысить количество входных биометрических параметров искусственной
нейронной сети практически в 2 раза.
ЛИТЕРАТУРА
1. Иванов А.И. Биометрическая идентификация личности по динамике
подсознательных движений. – Пенза: Изд-во Пенз. гос. ун-та, 2000. – 188 с.
2. Иванов А.И. Нейросетевые алгоритмы биометрической идентификации личности.
Книга 15, серии «Нейрокомпьютеры и их применение». – М.: Радиотехника 2004. – 144 с.
3. Волчихин В.И., Иванов А.И., Фунтиков В.А. Быстрые алгоритмы обучения
нейросетевых
механизмов
биометрико-криптографической
защиты
информации.
Монография. – Пенза: Изд-во Пенз.гос.ун-та, 2005. – 273 с.
4. Малыгин А.Ю. и др. Нейросетевое преобразование биометрического образа
человека в код его личного криптографического ключа. Монография. – Москва,
Радиотехника (ИПРЖ) книга №29 научной серии «Нейрокомпьютеры и их применение»,
2008. – 87 с.
5. Елфимов А.В. «Способ распознавания знаков», Патент Российской Федерации RU
2 390 843 C2, Иванов А.И, Андреев Д.Ю., Воячек С.А.
Download