Распределенная поддержка исследовательской деятельности Егерев Сергей Викторович Захарова Светлана Арменовна

advertisement
Распределенная поддержка
исследовательской деятельности
Егерев Сергей Викторович
Акустический институт
имени академика Н.Н.Андреева
Захарова Светлана Арменовна
Российская академия народного хозяйства
и государственной службы
ИНИОН, 18 марта 2015 г.
Распределенная исследовательская деятельность
(distributed problem solving)
Это совместное выполнение проектов
исследователями или экспертами,
использующими новые коммуникационные
технологии для удаленной работы и
выполняющими эту работу вне рамок
традиционных лабораторий.
Термин используется по аналогии с известным
термином «распределенные вычисления»,
определяющим совместную «параллельную»
работу множества пространственно разнесенных
компьютеров.
Краудсорсинг
(crowdsourcing)
– букв. «ресурсы толпы», т. е. использование
внешних по отношению к организации или
компании интеллектуальных ресурсов за счет
вовлечения добровольцев в решение
исследовательских или инновационных задач
компании
(Стеффен Рот)
Проекты простых решений
Всего
850 публикаций
за 5 лет
Динамика публикаций (статьи и обзоры), в которых
crowdsourcing упоминается или в названии, или в
аннотации или в списке ключевых слов
Источник: Scopus
Почему опыт распределенной поддержки
исследований важен для России?
• Многолетний дисбаланс кадровой структуры
российской науки
• Неблагоприятная динамика затратности
российских научных исследований
• и др.
Некоторые условия для успеха
краудсорсингового проекта
• Инициатор – организация с ярким брендом
• Должна быть сформулирована ясная задача – с
разделением творческой и рутинной частей
• Задача должна быть интересна широкому кругу
участников, иметь элементы «челленджа»
• Призовая стратегия
• Система IT-поддержки данного проекта
• Наличие открытых информационных источников
• и др.
Известные краудсорсинговые проекты
в т.ч. простых решений
eBird.org. Орнитологический проект.
Поиск и идентификация редких видов птиц силами
добровольцев и профессионалов.
Тип – вклада “Photo+comments”
Folding@home («свертывание-на-дому»).
Проект распределенных вычислений для проведения
компьютерного моделирования свёртывания молекул
белка.
Тип – вклада “Volunteer computing + game”
Сайт: http://folding.stanford.edu
SETI@home (Search for Extra-Terrestrial Intelligence at
Нome)
Проект распределенных вычислений, использующий
для поиска радиосигналов внеземных цивилизаций
Тип – вклада “Volunteer computing”
Сайт http://setiathome.berkeley.edu
Простые решения с корректировкой
В поисках могилы Чингисхана
• Тип проекта – «поиск иголки в стоге сена при
том, что вид иголки неизвестен»
• Организатор - National Geographic
• Объект обработки – спутниковые снимки
обширного участка Северной Монголии 6000 км2
• Число участвующих добровольцев – 10000
• Трудозатраты - 30000 человеко-часов или 3,4
человеко-лет, более 1 миллиона отметок.
• Мотивация – слава первооткрывателя и вообще
интересно.
Lin A. Y. M. et al. Crowdsourcing the Unknown: The Satellite Search for Genghis
Khan //PloS one. – 2014. – Т. 9. – №. 12. – С. e114046.
В поисках могилы Чингисхана – стадии проекта
-Участники (их число – n) получают
случайные частично перекрывающиеся
фрагменты спутниковых съемок и делают
пометки
- Вклады аккумулируются, математически ищут консенсус
- На место обнаруженных артефактов выезжает археологическая
экспедиция
Lin AYM, Huynh A, Lanckriet G, Barrington L (2014) Crowdsourcing the Unknown: The Satellite Search for
Genghis Khan. PLoS ONE 9(12): e114046. doi:10.1371/journal.pone.0114046
http://127.0.0.1:8081/plosone/article?id=info:doi/10.1371/journal.pone.0114046
В поисках могилы Чингисхана
Пример вклада отдельного добровольца
Результат вклада коллектива
В поисках могилы Чингисхана
Процедурная часть на
примере выявления древнего
артефакта
A . Метки как результат
коллективного вклада
формируют кластер – признак
чего-то интересного на
местности
Б. Плотность консенсуса
В. Кластеры помечаются
кругами с радиусом,
пропорциональным
плотности консенсуса
В поисках могилы Чингисхана
Некоторые итоги проекта
- На основе консенсуса более миллиона
вкладов-пометок выявлены около 100
потенциальных артефактов
- Наземная экспедиция подтвердила из
этого числа 55 ранее неизвестных
археологических объектов от бронзового
века до монгольского периода, включая
захоронения, мегалитические конструкции
и фортификацию древнего города
- Могилу Чингисхана не нашли
Еще примеры научного краудсорсинга
Археология
Картография
Биология
Биология
Разное
Фармацевтика
и медицина
Климатология
Астрономия
Биология
Изучают обрывки египетских папирусов и восстанавливают
тексты
Промеряют глубины в шельфовых районах и уточняют рельеф
дна
Запись и обработка сигналов летучих мышей
Расшифровка генов болезнетворных бактерий (несколько
проектов)
Поиск ключевых данных по массивам текстов научных
публикаций (несколько проектов)
Клинические испытания лекарств и методов на больших
массивах добровольцев (новые краудсорсинговые подходы)
Выявляют зародыши циклонов по спутниковым снимкам
Уточняют мелкую структуру поверхности Луны по спутниковым
снимкам.
Выращивают специальные растения, привлекательные для пчел
и сообщают о текущих результатах
Еще примеры …
Биология
Медицина
Математика
Океанология
Океанология
Морская
биология
Наблюдают за процессом гнездования и семейной активности
птиц
Пополняют базу данных «Кто, как и от чего лечится»
Распределенное решение математических задач (много
проектов)
Обнаруживают вредные и подозрительные объекты - инспекция
морского дна
Мониторинг концентрации фитопланктона в приповерхностном
слое с помощью диска Секки (ХIХ в.) и мобильного приложения
(XXI в.)
Мониторинг разных аспектов «морской жизни» по данным
подводных съемок
Морская
биология
Классификация песен китов и выявление совпадающих песен.
Биология
Устанавливают кормушку во дворе и ведут статистику посещений
Заключение-1
Science sourcing
(Scisourcing)
Citizen science
(термин вошел в состав
Большого Оксфордского словаря
в 2014 году)
Заключение-2
Citizen science – примерная схема
Открытое
Краудсорсинговые R&D
проекты по заказу
корпораций
(типа Mechanical Turk)
Закрытое
Участие в проекте
Классификация систем получения знаний по
степени открытости
Традиционная наука с
«принудительным»
раскрытием промежуточных
Традиционная наука
данных, например, по
(«Мертоновского» типа)
требованию журналов или
фондов
Закрытый
Citizen science
Открытый
Общественный доступ к промежуточным данным
Franzoni, Chiara, and Henry Sauermann. "Crowd science:
The organization of scientific research in open
collaborative projects." Research Policy 43.1 (2014): 1-20.
Заключение-3
Download