Классификация лекарственных растений по форме листа на

advertisement
Классификация лекарственных растений по форме листа на основе скелетного представления
(ММРО-15)
1
Классификация лекарственных растений по форме листа
на основе скелетного представления
Макарова Е. Ю.
Luar.Soll@gmail.com
Москва, Московский государственный университет им. М. В. Ломоносова
В данной работе предлагается признаковое описание для бинарных изображений листьев, полностью вычисляемое по скелетному представлению этих изображений, и приводится краткий анализ результатов
классификации тестовой выборки с использованием предложенного описания.
Возможность автоматического или полуавтоматического распознавания растений является весьма полезной, причём не только для тех, кто занимается ботаникой профессионально, поскольку может оказаться необходимым, например, отличить
лекарственное или съедобное растение от похожего
на него ядовитого. Но фотографии растения в целом могут слишком сильно различаться между собой, поэтому ограничим нашу задачу только изображениями листьев, причём только их формой, без
учёта расцветки и жилкования, то есть бинарными
изображениями.
Конечно, существуют различные варианты численного описания различных морфологических
признаков листа, используемого потом в качестве
признакового описания. Однако в работах по этой
теме, например, в [2], в основном использовались
характеристики либо границы листа, либо отдельных вписанных в лист и описанных около листа
фигур, или, например, в [3], соотношения площадей частей листа и содержащих эти части прямоугольников.
В данной работе предлагается построение признакового описания, вычисляемого на основе скелетного представления, поскольку скелетное представление фигуры содержит всю информацию
о форме этой фигуры, причём даёт не локальное,
а интегральное представление о ней.
Основные понятия
Будем считать, что заданное бинарное изображение листа аппроксимировано многоугольной фигурой, то есть его граница состоит из одной или
нескольких замкнутых ломаных без самопересечений, не имеющих общих точек. Тогда к нему применимы следующие понятия.
Для скелета существует графовое представление, причём вершинами графа являются центры
максимальных кругов, касающихся границы фигуры в трёх и более точках, а ребрами — линии, состоящие из центров пустых кругов, касающихся границы ровно в двух точках. Если граница фигуры
состоит только из отрезков прямых и выпуклых наружу дуг окружностей, то ребра её скелета являются отрезками либо прямых, либо парабол. В таком случае форма фигуры однозначно определяется по графовому представлению её скелета и значениям радиальной функции в его вершинах, а вдоль
ребер радиальная функция изменяется линейно.
Определение 4. Объединение всех максимальных пустых кругов с центрами на подграфе скелета
называется силуэтом этого подграфа.
Определение 5. Вершина скелета, которой в графовом представлении инцидентно ровно одно ребро, называется терминальной.
Определение 6. Скелет со стрижкой степени
p — скелет размыкания исходного изображения
с кругом радиуса p с центром в начале координат
в качестве примитива.
Утверждение 1. Скелет со стрижкой степени p
является подграфом скелета исходного изображения.
Утверждение 2. Расстояние Хаусдорфа от силуэта скелета со стрижкой степени p до исходного
изображения равно p, причём расстояние от силуэта любого подграфа скелета со стрижкой степени
p до исходного изображения больше p.
Биологические понятия. Необходимо уточнить, что под листом далее подразумевается одна
листовая пластинка. Кроме того, не будем делать
различия между сегментами, долями и лопастями
листа — частями листовой пластинки, разделённыОпределение 2. Скелет фигуры — множество цен- ми вырезами, более 2/3, от 1/3 до 2/3 и менее 1/3
полуширины листа соответственно ([4]). Для краттров максимальных пустых кругов.
кости будем называть все такие части долями, а все
меньшие вырезы относить к изрезанности края лиОпределение 3. Радиальная функция точки скеста. Лист, вырезы края которого не превышают
лета — величина радиуса максимального пустого
1/4 полуширины листа будем называть цельным.
круга с центром в этой точке.
Определение 1. Круг, полностью лежащий внутри фигуры, называется пустым кругом. Максимальный пустой круг — пустой круг, не содержащийся ни в каком другом пустом круге.
Всероссийская конференция «Математические методы распознавания образов» (ММРО-15), г. Петрозаводск, 11–17 сентября 2011 г.
2
(ММРО-15)
Макарова Е. Ю.
Рис. 1. Скелет листа
Рис. 3. Лист с не сильно изрезанным краем.
Рис. 2. Скелет листа со стрижкой степени 15.
Рис. 4. График зависимости числа терминальных вершин от степени стрижки для листа со слабо изрезанным краем (рис. 3).
Признаковое описание
Терминальные вершины и стрижка скелета. Наиболее важными и заметными характеристикой листовой пластинки являются количество
долей и степень изрезанности края листа. Но определить количество долей по скелету листа непосредственно как число терминальных вершин этого скелета невозможно, так как терминальных вершин оказывается намного больше (рис. 1). Поэтому
количество долей приходится определять по скелету листа с некоторой стрижкой (рис. 2). Необходимо обратить внимание, что число терминальных
вершин и в таком случае является не строго равным количеству долей, а только характеристикой
числа долей, поскольку, например, у цельного листа доля одна, а терминальных вершин скелета две.
Однако в таком случае возникает вопрос, каким
образом определить такую степень стрижки скелета, когда уже нет тех терминальных вершин, которые происходят от локальной изрезанности края,
но ещё имеются все вершины, соответствующие отдельным долям. Конечно, можно выбрать число,
примерно равное 1/8 ширины листа, так как при
меньших выемках лист считается цельным. Но возможно также поступить иначе.
Построим последовательность скелетов одного и того же листа со степенями стрижки p =
= 0, 1, 2, . . . . Рассмотрим количества терминальных вершин t0 , t1 , t2 , . . . этих скелетов.
Утверждение 3. Для любого интервала стабилизации n существует p0 такое, что tp0 = tp0 +1 =
= · · · = tp0 +n−1 , причём если n не велико, а скелет
листа не содержит циклов, то tp0 > 2.
При удачно подобранном интервале стабилизации p0 оказывается минимальным радиусом кругапримитива, операция размыкания с использованием которого сглаживает изрезанность краев, но не
сглаживает вырезы между долями. Возможно заметить, что чем больше изрезанность края листа
при постоянном n и примерно постоянных линейных размерах листа на изображении, тем больше
этот радиус, поэтому его можно считать признаком, описывающим изрезанность края листа. В качестве примера можно рассмотреть графики зависимости числа терминальных вершин от степени стрижки скелета: на рис. 4 график для листа
с рис. 3 (менее изрезанный край) и на рис. 5 график для листа с рис. 2 (более изрезанный край).
Максимальный и средний круги. Помимо числа долей и изрезанности края, листья могут
заметно различаться соотношением длины и ширины, что особенно заметно и важно для цельных
Классификация лекарственных растений по форме листа на основе скелетного представления
Рис. 5. График зависимости числа терминальных вершин от степени стрижки для листа со слабо изрезанным краем (рис. 2).
листьев. Кроме того, могут существовать как листья, почти равномерно широкие по всей длине,
так и с близким к линейному изменением ширины
от нуля до максимума. Поэтому необходимо ввести
признаки, отвечающие как за максимальную, так
и за среднюю ширину листьев.
В качестве характеристики максимальной ширины листа в данной работе используется отношение наибольшего значения радиальной функции
к расстоянию между двумя наиболее удалёнными друг от друга вершинами скелета. Необходимо
заметить, что, во-первых, максимальное значение
радиальная функция всегда принимает в вершине
скелета, во-вторых, эта вершина и это значение совпадают для полного скелета и скелета со стрижкой степени p0 , в-третьих, наиболее удалённые друг
от друга вершины также возможно искать в скелете со стрижкой степени p0 , поскольку перебор
по его вершинам делается гораздо быстрее, а разница в расстояниях не может превысить 2 ∗ p0 , что
в большинстве случаев слабо влияет на оценку.
Среднюю ширину листа нельзя считать как
среднее арифметическое значений радиальной
функции в вершинах скелета, поскольку вклад
в среднее для вершин, инцидентных коротким ребрам и вершин, инцидентных длинным, заметно различается. Поэтому среднюю ширину листа будем
вычислять следующим образом:
Rav =
P
(bi ∗ (ri,1 + ri,2 ) /2)
P
bi
/d0 ,
где bi — длина i-го ребра, ri,1 и ri,2 — значения радиальной функции в вершинах, инцидентных i-му
ребру, d0 — расстояние между наиболее удалёнными друг от друга вершинами скелета, а оба суммирования ведутся по всем ребрам скелета со стрижкой степени p0 .
Положение максимального круга. Ещё одним достаточно заметным признаком, отличающим
(ММРО-15)
3
листья растений разных видов может оказаться положение максимального круга. У одних листьев
ширина наибольшая примерно в центре, у других —
ближе к одному из концов. К сожалению, определение по листовой пластинке, с какого конца её присоединялся черенок, иногда затруднительно, поэтому
положение максимального круга будем определять
только по близости к любому из концов.
Для нахождения значения этого признака необходимо найти две наиболее удалённые друг от друга вершины скелета, и вычислить отношение расстояния от вершины, в которой достигается максимум радиальной функции, до ближайшего из них,
к расстоянию между ними.
Признаковое пространство.
Во-первых,
нужно заметить, что, с одной стороны, наиболее
важным из приведённых признаков является характеристика числа долей: цельный лист и лист
с несколькими долями не могут принадлежать одному и тому же классу, с другой стороны, листья
с числом долей, например, 5, 6 и 7 могут быть
от растений одного вида. Поэтому в качестве признака предлагается использовать не само число tp0 ,
а его двоичный логарифм, но использовать этот
признак с большим весом.
Во-вторых, различия в признаках, характеризующих ширину листа, в десятые доли, являются более заметными, чем различия в значениях p0
в единицы. Значит, веса признаков ширины должны быть больше, чем вес признака стрижки.
Классификация тестовой выборки
В качестве метода классификации в описанном
выше признаковом пространстве со взвешенными
признаками использовался метод ближайшего соседа. Причём, так как итоговый алгоритм должен
иметь скорее рекомендательный, чем решающий
характер, то есть результаты его работы должны только подсказывать, на принадлежность какому виду прежде всего надо проверить исследуемое растение, то рассматривались три ближайших
соседа классифицируемого объекта, и классификация считалась успешной, если хотя бы один из этих
соседей был того же класса, что и классифицируемый.
Во время экспериментов использовались бинарные изображения листьев растений 32 видов, всего 1907, каждого вида — от 50 до 70. В качестве
обучающей выборки от каждого вида было взято
по 10 объектов; в качестве тестовой выборки — все
1907 объектов, включая вошедшие в обучающую.
Веса признаков и интервал стабилизации n подобраны вручную, поэтому, возможно, не оптимальны.
В результате из 1907 объектов успешно классифицированы 1560 объектов; среди 32 классов по ко-
4
(ММРО-15)
личеству правильно определённых объектов можно
выделить следующие группы:
— 2 класса, все объекты которых классифицированы успешно;
— 10 классов, на объектах которых ошибок было
не более 5;
— 15 классов, на объектах которых число ошибок
не более трети от числа объектов класса;
— 5 классов, на объектах которых число ошибок
более трети от числа объектов класса.
Выводы
Если вычесть из общего числа объектов тестовой выборки и из числа успешно классифицированных объектов число объектов, вошедших в множество эталонов, то окажется, что удалось добиться доли удачных классификаций около 75%. При
таком количестве классов, которое имеется у нас,
это является неплохим результатом, однако требует дальнейшей работы.
В процессе проведения экспериментов были обнаружены важные характеристики формы листа,
не охваченные имеющимся признаковым описанием, однако могущие помочь различить некоторые,
плохо различимые сейчас, классы. Однако теперь
Макарова Е. Ю.
уже имеет смысл вычислять дополнительные признаки для объектов не всех классов, а только наиболее часто смешиваемых.
Кроме того, так как, как уже было упомянуто,
параметры классификации подбирались вручную,
и алгоритм классификации был использован наиболее простой; возможно, в какой-то степени улучшить качество классификации сможет также более точный подбор параметров и смена алгоритма
классификации.
Литература
[1] Местецкий Л. М. Непрерывная морфология бинарных изображений: фигуры, скелеты, циркуляры. —
Москва: ФИЗМАТЛИТ, 2009.
[2] Knight D., Painter J., Potter M. Automatic Plant
Leaf Classification for a Mobile Field Guide. — 2010. —
http://www.stanford.edu/~jpainter/documents/
PlantLeafClassification.pdf
[3] Суботэ А. E. О методе автоматизированной классификации листьев высших растений (на примере ископаемых буковых) // Вестник ДВО РАН. —
2004. — № 3. — C. 174–177.
[4] Коровкин О. А. Анатомия и морфология высших
растений: словарь терминов. — Москва: Дрофа,
2007.
Download