АНАЛИЗ ДАННЫХ С ИСПОЛЬЗОВАНИЕМ ИНТЕЛЛЕКТУАЛЬНЫХ МЕТОДОВ К.Б. Корыкбасова

advertisement
АНАЛИЗ ДАННЫХ
С ИСПОЛЬЗОВАНИЕМ ИНТЕЛЛЕКТУАЛЬНЫХ МЕТОДОВ
К.Б. Корыкбасова
Восточно-Казахстанский государственный университет
имени С. Аманжолова, г. Усть-Каменогрск, Казахстан
В настоящее время информационные технологии широко используются
во всех областях жизни человека. Система образования не стала
исключением. Годами накапливалось множество информации о студентах, их
успеваемости, преподавателях, создавались дистанционные курсы обучения
студентов, образовательные форумы, системы тестирования студентов,
продолжать можно бесконечно. Таким образом, накопилась масса
информации. И в настоящее время крайне актуальным стал вопрос обработки
этой информации, возможности извлечения новых знаний из уже
представленных в базах данных, хранилищах и т.д.
Существует множество задач, в которых методы статистики, машинного
обучения и извлечения знаний (data mining) очень полезны как для учащихся,
так и для преподавателя и для людей, ответственных за весь образовательный
процесс в целом. Анализ данных позволяет лучше понять студентов, узнать
какие предметы вызывают большие затруднения, как лучше построить курс,
чтобы получить максимально высокие баллы, с какими тестами студенты
справляются, какую форму занятий предпочитают, в какой области научных
интересов преуспевают и т.д. Эти данные могут быть использованы для
принятия эффективных решения по управлению образовательным
процессом.
Анализ данных – область математики и информатики, занимающаяся
построением и исследованием наиболее общих математических методов и
вычислительных алгоритмов извлечения знаний из экспериментальных
данных;
процесс
исследования,
фильтрации,
преобразования
и
моделирования данных с целью извлечения полезной информации и
принятия решений.
Анализ данных имеет множество аспектов и подходов, охватывает
разные методы в различных областях науки и деятельности.
Интеллектуальный анализ данных (DM – data mining) как раз занимается
обработкой и анализом данных из образовательного процесса. Это область
науки, связанная с разработкой методов для изучения уникальных типов
данных, поступающих из образовательной сферы и использование этих
методов для лучшего понимания студентов и условий в которых они учатся.
Основные направления в данной области - использование анализа анных
для поддержки интеллектуальных систем обучения (Intelligence Tutoring
Systems), анализ образовательных процессов, визуализация данных и
паттернов образовательного процесса.
Область Data Mining началась с семинара (англ. workshop), роведѐнного
Григорием Пятецким-Шапиро в 1989 году. Ранее, работая в компании GTE
Labs, Григорий Пятецкий-Шапиро заинтересовался вопросом: можно ли
автоматически находить определѐнные правила, чтобы ускорить некоторые
запросы к крупным базам данных. Тогда же было предложено два термина Data Mining («добыча данных») и Knowledge Discovery In Data (который
следует переводить как «открытие знаний в базах данных»).
Знания, добываемые методами Data mining, принято представлять в
виде моделей (рисунок1).
Рисунок 1 – Модели представления знаний Data Mining
В 1993 году вышла первая рассылка «Knowledge Discovery Nuggets», а в
1994 году был создан один из первых сайтов по Data Mining.
Основу методов Data Mining составляют всевозможные методы
классификации, моделирования и прогнозирования, основанные на
применении деревьев решений, искусственных нейронных сетей,
генетических алгоритмов, эволюционного программирования, ассоциативной
памяти, нечѐткой логики. К методам Data Mining нередко относят
статистические методы (дескриптивный анализ, корреляционный и
регрессионный анализ, факторный анализ, дисперсионный анализ,
компонентный анализ, дискриминантный анализ, анализ временных рядов,
анализ выживаемости, анализ связей). Такие методы, однако, предполагают
некоторые априорные представления об анализируемых данных, что
несколько расходится с целями Data Mining (обнаружение ранее неизвестных
нетривиальных и практически полезных знаний).
Одно из важнейших назначений методов Data Mining состоит в
наглядном представлении результатов вычислений (визуализация), что
позволяет использовать инструментарий Data Mining людьми, не имеющими
специальной математической подготовки. В то же время, применение
статистических методов анализа данных требует хорошего владения теорией
вероятностей и математической статистикой.
Разработка информационной системы мониторинга и управления вузом
обусловлена высокой стоимостью готовых решений, отсутствием жестко
регламентированных функциональных моделей в системе образования и
специфическими особенностями вузов. Кроме того, большинство
функционирующих в вузах информационных систем носят фрагментарный
характер, не ориентированы на информационные потребности студентов,
преподавателей, сотрудников вуза и иных заинтересованных лиц, не
позволяют осуществлять мониторинг образовательного процесса, не
обеспечивают комплексную поддержку принятия управленческих решений.
Список литературы
1 Барсегян А.А., Куприянов M.С., Степаненко В.В., Холод И.И.
Технологии анализа данных: Data Mining, Visual-Minings Text Mining,
OLAP//- 2-е: изд-во.,перераб.и доп.- СИб.: БХВ-Петербург, 2008.-384c.ISBN978-5-94157-991-4.
2 В.А. Дюк, А.В. Флегонтов, И.К. Фомина, Применение технологий
интеллектуального анализа данных в естественнонаучных, технических и
гуманитарных областях.
Download