измеритель дальности и размерных параметров объектов на

advertisement
Физика
Наблюдаемый наклон выхода РОР от Si и Ge в спектрах РОР для пленок, осажденных при
500÷600 ºС, свидетельствует не о наличии переходного слоя Si1–xGex-сплава, а является результатом
развитой (шероховатой) поверхности, причем шероховатость поверхности возрастает с температурой
осаждения.
С помощью метода комбинационного рассеяния света установлено, что в слоях Ge, осажденных в
диапазоне температур 470÷600 ºС, отсутствует кремний в значительном количестве, что, по нашему
мнению, свидетельствует об осаждении слоя чистого Ge в этих условиях. Показано, что в осажденных слоях Ge присутствуют механические напряжения растяжения. Степень релаксации напряжений
в слоях Ge, полученных пиролизом моногермана при пониженном давлении, возрастает по мере роста температуры осаждения.
Для использования нанослоев германия, получаемых пиролизом моногермана при пониженном
давлении, в качестве приборных структур в фотонике и микроэлектронике требуются дополнительные исследования структурных, оптических и электрофизических свойств.
1. S a m a v e d a m S . , C u r r i e M . , L a n g d o T . , F i t z g e r a l d E . //Appl. Phys. Lett. 1998. Vol. 73. P. 2125.
2. I s e l l a G . , O s m o n d J . , K u m m e r M . , K a u f m a n n R . // Semicond. Sci. Technol. 2007. Vol. 22. P. S26.
3. M a s i n i G . , C e n c e l l i V . , C o l a c e L . et al. // Appl. Phys. Lett. 2002. Vol. 80. P. 3268.
4. C o l a c e L . , F e r r a r a P . , A s s a n t o G . et al. // IEEE Photon. Technol. Lett. 2007. Vol. 19. № 22. P. 1813.
5. З и С . Физика полупроводниковых приборов. М., 1984.
6. M u r o t a J . , K a t o M . , K i r c h e r R . , O n o S . // J. de Physique II. 1991. Vol. 1. P. C2-795.
7. M u r o t a J . , O n o S . // Jap. J. Appl. Phys. 1994. Vol. 33. P. 2290.
8. B a n d a r u P . R . , S a h n i S . , Y a b l o n o v i t c h E . // Material Science and Engineering. 2004. Vol. B113. P. 79.
9. H a l b w a x M . , R o u v i e r e M . , Z h e n g Y . et al. // Optical Materials. 2005. Vol. 27. P. 822.
10. H u a n g Z . Germanium Photodetector Integrated with Silicon-based Optical Receivers // Ph. D. Thesis, 2006.
11. Н а л и в а й к о О . Ю . , Г а й д у к П . И . , Т у р ц е в и ч А . С . и др. // Материалы V Бел.-рос. науч.-техн. конф. «Технические средства защиты информации». Мн., 2007. C. 83.
12. Е м е л ь я н о в В . А . , Т у р ц е в и ч А . С . , Н а л и в а й к о О . Ю . Эпитаксиальные слои кремния и германия для интегральных микросхем. Мн., 2008.
13. G a i d u k P . I . , L a r s e n A . N . , H a n s e n J . L . et al. // Appl. Phys. Lett. 2001. Vol. 79. P. 4025.
14. В о л о д и н В . А . , Е ф р е м о в М . Д . , Д е р я б и н А . С . , С о к о л о в Л . В . // Физика и техника полупроводников. 2006. Т. 40. № 11. С. 1349.
Поступила в редакцию 12.10.10.
Валерий Александрович Зайков – старший научный сотрудник кафедры физической электроники и нанотехнологий.
Петр Иванович Гайдук – доктор физико-математических наук, профессор кафедры физической электроники и нанотехнологий.
Андрей Геннадьевич Новиков – младший научный сотрудник кафедры физической электроники и нанотехнологий.
Станислав Леонидович Прокопьев – младший научный сотрудник кафедры физической электроники и нанотехнологий.
Аркадий Степанович Турцевич – доктор технических наук, главный инженер ОАО «ИНТЕГРАЛ».
Олег Юрьевич Наливайко – заместитель главного технолога ОАО «ИНТЕГРАЛ».
Евгений Николаевич Пшеничный – ведущий инженер ОАО «ИНТЕГРАЛ».
Владимир Болеславович Карпович – младший научный сотрудник лаборатории электроники НИИПФП им. А.Н. Севченко БГУ.
УДК 621.375.826
В.Л. КОЗЛОВ, И.Р. КУЗЬМИЧЕВ
ИЗМЕРИТЕЛЬ ДАЛЬНОСТИ И РАЗМЕРНЫХ ПАРАМЕТРОВ ОБЪЕКТОВ
НА ОСНОВЕ ЦИФРОВОЙ ФОТОКАМЕРЫ
The technique and corresponding hardware for distance and size measurements of different objects based on analysis of the digital photographic images, not using the measuring object located in the center of the measured area, is offered. The experimental results obtained for the proposed measuring equipment are presented.
В настоящее время цифровая фотосъемка почти полностью вытеснила традиционную пленочную,
однако ее возможности недостаточно используются для решения различных научных и технологических задач. В России производится ряд фотограмметрических комплексов, позволяющих измерять
расстояния и размеры объектов на основании анализа цифровых фотографических изображений. Такие измерители используются главным образом для фиксации обстановки мест различного рода преступлений и происшествий. Основной недостаток этих комплексов заключается в том, что для прове33
Вестник БГУ. Сер. 1. 2011. № 1
дения измерений в них необходимо использовать мерные объекты и маркировочные конусы, расположенные в центре измеряемой зоны. Это, во-первых, неудобно в эксплуатации, а во-вторых, существенно ограничивает функциональные возможности, так как их нельзя использовать в случае техногенных катастроф, взрывов, пожаров, наводнений и т. п. Кроме того, точность измерения таких
систем составляет всего 1÷3 % от измеряемого расстояния, диапазон измеряемых расстояний – до ста
метров, что в большинстве случаев недостаточно. Из сказанного следует, что разработка методики и
соответствующих аппаратных средств для измерения расстояний и размеров объектов на основе анализа цифровых фотографических изображений, не использующих мерный объект и обладающих
более высокой точностью измерений, является актуальной задачей.
Рис. 1. Проективная модель фотокамеры и стереоскопической системы:
f – фокусное расстояние, L – величина базы, Z – дальность до объекта
Предлагаемая методика повышения точности измерения расстояний и размеров объектов основана
на принципах фотограмметрии и корреляционной обработке цифровых изображений стереопары
[1, 2]. Один из способов получения информации о дальности состоит в регистрации нескольких изображений объектов под различными ракурсами. При сопоставлении этих изображений удается реконструировать трехмерную структуру сцены. Если расстояние между камерой и наблюдаемой сценой значительно превышает фокусное расстояние оптической системы, можно считать, что
изображение строится в ее фокальной плоскости [1]. В этом случае воспользуемся проективной моделью камеры, представленной на рис. 1, в которой изображение трехмерного объекта получается его
проектированием в фокальную плоскость. Начало стандартной системы координат камеры в трехмерном пространстве OXYZ совпадает с оптическим центром О, а ось OZ – с оптической осью камеры. Пусть плоскость изображения находится на расстоянии фокуса f от оптического центра. В этой
плоскости зададим систему координат oxy с началом в главной точке о и осями ox и oy, параллельными осям OX и OY соответственно. Тогда проекцией точки трехмерного пространства M с координатами (X, Y, Z), где Z – расстояние, является точка m с координатами (x, y), при этом выполняются следующие соотношения:
fX
fY
, y=
.
x=
Z
Z
В современных фотокамерах для регистрации цифрового изображения устанавливается фотоприемная матрица. Для полного описания модели необходимо выразить координаты точки m в естественных координатах фотоприемной матрицы:
x
y
и = + и0 , v = + v0 ,
(1)
w
h
34
Физика
где u0, v0 – координаты главной точки относительно начала координат фотоприемника (в естественных координатах фотоприемника); w и h – масштабы вдоль осей ox и oy (расстояния между ячейками
матричного фотоприемника вдоль строк и столбцов).
В новой системе координаты проекции точки m (1) примут вид
fX
fY
и=
+ и0 , v =
+ v0 .
wZ
hZ
Следовательно, трехмерный вектор m внутренних координат камеры будет иметь вид V = (u, v, 1),
а трехмерный вектор, соответствующий координатам точки M в пространстве, равен M = (X, Y, Z).
Связь координат в пространстве с координатами в плоскости изображения можно выразить соотношением ZV = KM через постоянную матрицу K, которая называется калибровочной, или матрицей
внутренних параметров камеры, и определяется соотношением
0
u0 ⎤
⎡f w
⎢
K=⎢ 0
f h v0 ⎥⎥ .
⎢⎣ 0
0
1 ⎥⎦
Для определения координаты объекта достаточно знать его внутренние координаты на фотоприемной матрице V, расстояние до объекта Z и калибровочную матрицу K. Для нахождения расстояния
Z используется стереоскопическая система. В пространстве произвольно выбираются два положения
камеры (положение и ориентация оптической оси). На практике сложно установить связь ориентации
и координат двух положений регистрирующей камеры при случайной ориентации в пространстве,
что существенно влияет на погрешность измерений. Поэтому было принято решение использовать
методику измерений, при которой исключено изменение угловой ориентации оптической оси камеры
при перемещении в пространстве. Принцип простейшей стереоскопической пары изображен на
рис. 1. Камера, состоящая из линзы F с фокусным расстоянием f, регистрирует изображение объекта
M из положения 1, имеющее координаты m' (x', y'). Затем камера параллельным сдвигом в направлении, перпендикулярном ее оптической оси, переносится в положение 2 на величину базы L и регистрирует изображение объекта m′′( x′′, y ′′). Полученные изображения представляют собой простейшую
стереопару.
Дальность до объекта Z из геометрии изображений определяется соотношением
fL
,
Z=
x′ − x′′
где разность ( x′ − x′′) – смещение (диспарантность) объекта в плоскости изображения на первом и
втором снимках стереопары соответственно. Затем определяются координаты исследуемого объекта
в пространстве из следующих соотношений:
L( y′ + y′′)
L( x′ + x′′)
X=
, Y=
,
2( x′ − x′′)
2( x′ − x′′)
где ( x′, y ′) и ( x′′, y ′′) – координаты объекта в плоскости изображения на первом и втором снимках стереопары соответственно. Зная необходимые координаты исследуемых объектов, можно оценить расстояния между ними. Аналогичным образом можно определять линейные размеры исследуемых объектов.
Для нахождения разности координат объекта (смещения) в плоскостях первого и второго изображений стереопары была разработана соответствующая методика корреляционной обработки изображений. В процессе обработки выполняется автоматическое сканирование первого изображения относительно второго и осуществляется поиск максимального соответствия, который проходит в два
этапа – грубая оценка и уточнение.
При грубой оценке координаты сходства определяется сдвиг между изображениями с разрешением в 1 пиксель. На этом этапе задается окно сканирования, содержащее участок исследуемого объекта. Каждую итерацию окно сдвигается на 1 пиксель вдоль оси ох в системе координат изображения,
затем вычисляется значение корреляционной функции. Далее проводится повторное независимое
сканирование по осям ох и оy в области найденной точки максимума соответствия. Для нахождения
меры сходства можно использовать специфические методики, которые определяются видом корреляционной функции. Например, если исследуется объект с вертикальной осью симметрии, вид корреляционной функции значительно упрощается [3]. И наоборот, следует значительно усложнить функцию
35
Вестник БГУ. Сер. 1. 2011. № 1
корреляции и алгоритм поиска, если условия регистрации таковы, что нельзя пренебречь взаимным
поворотом объекта и его перспективными искажениями [2]. Сдвиг между изображениями ∆x = x′ − x′′
определяется по положению максимального значения двухмерной нормированной корреляционной
функции [4] в соответствии с выражением
I n ( x, y )
( I1 ( x, y ) − I1 )( I 2 ( x + ∆x, y + ∆y ) − I 2 )
∑
x, y
x, y
R (∆x, ∆y ) =
, In =
,
2
2
x
y
(
I
(
x
,
y
)
−
I
)
(
I
(
x
+
∆
x
,
y
+
∆
y
)
−
I
)
макс
макс
∑ 1
1 ∑
2
2
∑
x, y
x, y
где I1, I2 – сигнал окна сканирования первого и второго изображения; xмакс, yмакс – размер сканирующего
окна по горизонтали и вертикали соответственно; ∆x, ∆y – сдвиг по горизонтали и вертикали соответственно; I1 , I 2 – средние значения сигнала в первом и втором окне сканирования; n = 1, 2. Нормированная кросс-корреляция также применима в случае, когда одно изображение отличается от другого не
только относительным сдвигом, но и подвержено монотонному амплитудному преобразованию [2].
На этапе уточнения разрешение поиска можно улучшить до сотых долей пикселя. Обычно область
уточнения выбирается шириной и высотой 4 пикселя. Для уточнения величины смещения в субпиксельном диапазоне используется билинейная интерполяция сигнала с заданным шагом на этапе корреляционной обработки изображений. Алгоритм этапа уточнения заключается в следующем: в области наибольшего значения корреляционной функции, полученного на этапе грубой оценки,
предусмотрен этап повторного сканирования с шагом, равным 0,05 пикселя. Затем производится коррекция ошибки при помощи параболической интерполяции между узлом сетки с наибольшим значением корреляционной функции и соседними узлами, локализирующая максимум параболы в заданном интервале [2, 5]. Так как параболическая интерполяция имеет относительную погрешность 13 %,
то разрешение при определении сдвига улучшается до сотых долей пикселя.
Абсолютная погрешность измерения расстояния ∆Z определяется следующим выражением:
f
rZ 2
∆Z =
, au = ,
w
Lau − rZ
где au – эффективный размер пикселя, w – расстояния между чувствительными элементами фотоприемной матрицы вдоль строк, f – фокусное расстояние оптической системы; r – разрешение обработки,
Z – измеряемое расстояние. Определять точное расстояние между чувствительными элементами фотоприемной матрицы и значение фокуса объектива нет необходимости, так как эти параметры можно
установить при калибровке системы на известном расстоянии. На рис. 2 представлены зависимости
абсолютной погрешности измерений от величины измеряемого расстояния при разрешении 0,01 пикселя и базах 50 см и 1 м. Калибровочный параметр au для построенных зависимостей определялся
экспериментально для камеры Canon PowerShot A550 с матрицей 7,1 мегапикселя и фокусом объектива 5,8 мм. Из графиков следует, что на расстояниях до 50 м достигается погрешность измерения
лучше 1 см. На расстояниях порядка 1 км относительная погрешность измерения составляет 0,6 %
для базы 50 см и 0,3 % – для базы 1 м. Очевидно, что, используя длиннофокусный объектив, фотоприемную матрицу большего размера и большую базу съемки, можно значительно снизить погрешность измерения дальности.
Рис. 2. Зависимость абсолютной погрешности измерений от расстояния для r = 0,01 и величины базы: 1 – 0,5 м, 2 – 1,0 м
36
Физика
Интерфейс системы измерения расстояний и размеров объектов на основе анализа цифрового изображения представлен на рис. 3. Приложение разработано для пользователя, и на экране отображается лишь первое изображение из стереопары. Интерфейс включает пользовательские элементы: информационную строку (строка состояния); общие инструменты: открыть изображение, сохранить
отчет, очистить отчет; функциональные инструменты: манипуляция с объектами (выделить, переместить, удалить), создание окна (задать область региона), создание связи (задать связь между регионами
или в области одного региона), калибровка камеры (вычислить калибровочные параметры по объекту
на известном расстоянии); переключение режима просмотра: включить/выключить отображение подписей расстояний, включить/выключить отображение второго изображения стереопары с вспомогательными обозначениями привязки регионов; вызов диалога установки параметров анализа; прокрутка и масштабирование области изображения; запуск расчета. Приложение позволяет пользователю
определять дальность до всех объектов, расстояния между объектами и их линейные размеры.
Рис. 3. Интерфейс измерительной системы и пример работы измерителя по цифровой
фотографии учебного корпуса факультета радиофизики
На рис. 3 показан пример работы измерительной системы по цифровой фотографии учебного корпуса факультета радиофизики, сделанной с 5-го этажа радиофизического корпуса. Цифрами отмечены расстояния L от фотоаппарата до объектов на фотографии: автомобиля – 89,08 м, двух ангаров –
93,86 и 124,01 м, антенны, расположенной на крыше учебного корпуса, – 314,2 м и до учебного корпуса факультета радиофизики – 332,7 м. Приводятся также расстояния между измеряемыми объектами:
от первого ангара до автомобиля – 17,77 м и до антенны – 224,4 м, от второго ангара до учебного
корпуса – 228,3 м. Возможно также измерение расстояний между автомобилями, размеров предметов
на фотографии, высоты зданий и т. п. Приведенные данные показывают достаточно высокую эффективность использования разработанной методики для построения пассивного измерителя расстояний.
Очевидно, что система позволяет измерять расстояния и размеры всех объектов, одновременно попадающих в поле зрения. Были исследованы возможности измерения расстояния до тех объектов, до
которых это сложно сделать с помощью обычных лазерных дальномеров, например, до тонких проводов и антенн, находящихся на большом расстоянии, объектов с низким коэффициентом отражения,
зеркальных поверхностей, прозрачных облаков, птиц, животных и т. п. Полученные результаты свидетельствуют о широких функциональных возможностях разработанного измерителя.
По сравнению с известными выпускаемыми фотометрическими комплексами представленная система имеет некоторые преимущества: в ней не используются мерный объект и маркировочные кону37
Вестник БГУ. Сер. 1. 2011. № 1
сы, что значительно упрощает процесс измерений и позволяет проводить их в случаях, когда нет возможности разместить мерный объект в центре измеряемой области – на местах взрывов, техногенных
аварий, пожаров, наводнений и т. п., занимающих большие территории. Этот фактор значительно
расширяет функциональные возможности системы. Кроме того, в ней использована корреляционная
методика обработки изображений, обеспечивающая разрешение порядка 0,01 пикселя, что позволяет
расширить диапазон измеряемых расстояний и повысить точность измерений. Предлагаемая система
может использоваться как для решения задач криминалистики и обеспечения работы правоохранительных органов на местах преступлений, так и для решения ряда промышленных и технологических
задач. Целесообразно использование такой системы в геодезии и картографии, в метеорологии для
измерения высоты и размеров облаков, высоты леса, полета птиц и т. п.
1. Г р у з м а н И . С . , К и р и ч у к В . С . , К о с ы х В . П . Цифровая обработка изображений в информационных системах. Новосибирск, 2000.
2. Г у б а н о в А . В . , Е ф и м о в В . М . , К и р и ч у к В . С . // Автометрия. 1988. № 3. C. 29.
3. Patent US № 5432594 G 01 C 3/00 Optical Distance Measurement Device Using Image Sensors For Determining Distance To
Symmetric Objects / Kenji Ogawa. 1995.
4. A c k e r m a n n F . // The Photogrammetric Record. 1984. Vol. 11. İss. 64. P. 429.
5. P r e s s W . H . , F l a n n e r y B . P . , T e u k o l s k y S . A . Numerical recipes in C: the art of scientific computing. 2nd ed.
Cambridge, 1995.
Поступила в редакцию 30.11.10.
Владимир Леонидович Козлов – кандидат технических наук, доцент кафедры квантовой радиофизики и оптоэлектроники.
Илья Романович Кузьмичев – магистрант кафедры квантовой радиофизики и оптоэлектроники.
УДК 004.021:004.85
СЕ ЦЗИНЬБАО (КНР)
МОДЕРНИЗИРОВАННЫЙ АЛГОРИТМ КЛАССИФИКАЦИИ
НА ОСНОВЕ МЕТОДА ОПОРНЫХ ВЕКТОРОВ
An improved algorithm based on support vector machine for text classification is considered in this paper. Experiment results
show that improved algorithm based on support vector machine is better for its speed and classification accuracy than known support
vector machine method.
Использование метода опорных векторов SVM (Supporting Vector Machines) относится к числу
наиболее распространенных и успешных способов решения задач распознавания образов [1–3]. В настоящее время одной из проблем, возникающих при обучении SVM, является выбор внутренних параметров алгоритма, т. е. таких параметров, которые задает сам пользователь и не изменяемых при
обучении [4]. Цель данной работы заключается в разработке метода, позволяющего, используя принцип наименьшего евклидова расстояния, автоматически подбирать значения параметров границ решения в SVM.
Метод опорных векторов в задачах классификации
Рассматривается задача обучения по прецедентам [X, Y], где X – пространство объектов, Y – множество ответов. Требуется построить алгоритм X→Y, аппроксимирующий целевую зависимость на
всем пространстве X. Признаковый набор обучающих данных представляет собой набор пар
( x1 , y1 ),( x2 , y2 ),..., ( xs , ys ), xi ∈ R n , yi ∈ {1, −1} , i = 1, 2,..., s. Необходимо найти правила классификации
C ( x), позволяющие наилучшим образом распознавать один из двух классов.
Задача нахождения оптимального разделения множества векторов на два класса может выполняться с помощью линейной решающей функции. Тогда разделяющей два класса гиперплоскостью
будет
(ω⋅ x) + b = 0,
где ω – вектор весовых коэффициентов, b – некоторое число. Значения ω и b находим как решения
оптимизационной задачи квадратичного программирования, минимизируя для обучающей выборки
функцию
1 2 1
ϕ(ω) = ω = (ω⋅ ω)
2
2
38
Download