Технологии геномного анализа Illumina на основе биочиповых тест-

advertisement
Технологии геномного анализа
Illumina на основе биочиповых тестсистем и секвенирования NGS:
Возможности,
Успехи,
Достижения!
Илья Дёмин
Специалист по
продвижению продукции
Moscow, 2011
Welcome to illumina!
Миссия компании
Инновационные разработки будущего в области генетического анализа
От исследования генома человека…
до валидации новых мишеней…
Задача компании illumina состоит в достижении лидирующих позиций при
разработке комплексных решений в области генетики и здравоохранения
illumina в мире
Illumina Китай
(Пекин)
Illumina BV
(Нидерланды)
Illumina
Кембридж
Illumina Хейвард
(Хейвард, Калифорния)
Главное управление
Illumina
(Сан Диего,
Калифорния)
Illumina Восток
(Валингфорд,
Коннектикут)
Россия
Корея
Турция
Израиль
Персидский залив
Джинан
Ченгду
Индия
Тайланд
Illumina
Сингапур
Illumina KK (Токио)
Шанхай
Тайвань
Вьетнам
Малайзия
Южная Африка
Австралия
Новая Зеландия
Компания основана в 1998 году, штаб-кватрира –
San-Diego, США

Коммерческий
Производство/исследования и разработки
Партнеры
Дважды становилась №1 в рейтинге Forbes как
наиболее быстро развивающаяся технологическая
компания - 2007 и 2009; в 2008 попала в рейтинг
NASDAQ-100

Сейчас – более 2500 сотрудников

3
Сегодня компания illumina предлагает:
Секвенирование
• Ресеквенирование
• Секвенирование de novo
• Выявление редких
вариантов
• Цифровое изображение
картин экспрессии генов
• Определение
транскриптов
• Секвенирование
продуктов CHiP
• Mетиллирование
• Метиллирование de novo
Генотипирование
• Комплексное
изучение генома
человека и животных
• Исследование
биомаркеров и их
валидация
• Эпигенетические
исследования
• Проведение
клинических
экспериментов
Анализ генной
экспрессии
• Профиль
экспрессии
• Поиск биомаркеров
и их валидация
• Выявление
ассоциированных
заболеваний
• Проведение
клинических
экспериментов
• Потребительские
услуги
Персонализированная медицина
Молекулярную
диагностику
• Применение НИР
• Продукты домашнего
приготовления
(Homebrew)
• Диагностика
сопутствующих
заболеваний
• Стандартный скрининг
• Выявление
инфекционных
заболеваний
MiSeq
Genome Analyser
Настольный
ДНКсеквенатор
ДНКсеквенатор
HiSeq 1000/2000
ДНКсеквенатор
Секвенирование
HiScanSQ
Анализатор
биочипов
+
Сиквенсовый
модуль
BeadXpress
Анализатор
биочипов
iScan
Анализатор
биочипов
Анализ
микроматриц
Секвенирование сегодня:
Новые горизонты
ВОЗМОЖНОСТЬ ГЛУБОКОГО АНАЛИЗА МНОЖЕСТВА КРУПНЫХ,
КОМПЛЕКСНЫХ ГЕНОМОВ И ТРАНСКРИПТОМОВ
СОСТАВЛЯЕТ ОСНОВУ КРУПНЕЙШИХ ИССЛЕДОВАНИЙ В ОБЛАСТИ
КАНЦЕРОГЕНЕЗА И ИЗУЧЕНИЯ ГЕНЕТИЧЕСКИХ ЗАБОЛЕВАНИЙ
ЛЕЖИТ В ОСНОВЕ ТРАНСЛЯЦИОННОЙ МЕДИЦИНЫ
ПОЗВОЛЯЕТ ОСУЩЕСТВЛЯТЬ DE NOVO СЕКВЕНИРОВАНИЕ:
Человека
Растений
Животных
Объектов потребительской геномики
Общие технологические шаги NGS
•
•
•
Подготовка библиотек (матриц), оценка их качества
– Выделение ДНК или РНК с ОТ - кДНК,
– Разрушение ДНК на короткие участки (УЗ,
ферменты)
– Достройка ДНК под требования платформы
секвенирования – лигирование адаптеров и
индексов
– Оценка качества библиотеки
– Предамплификация – формирование кластеров
Секвенирование
– Секвенирование путём синтеза (Illumina),
Анализ данных - биоинформатика
– Сборка ридов – превращение данных от прибора в
данные последовательности нуклеотидов,
построение метрик качества
– Сборка контигов – выравнивание ридов так, чтобы
они сформировали разумную последовательность
или ее варианты
Шаг 1: Пробоподготовка
Active Chromatin
Genomic DNA
(1-5 ug)
Small RNA
mRNA
10 ug total RNA
10 ug total RNA
10 ng
ChIP-Sequencing
Other Apps
Фрагменты ДНК
Затупление концов
Фосфорилирование
Аденилирование
Лигирование адаптеров
Epicentre Nextera
Технология подготовки библиотек для NGS
2 часа, одна пробирка, 50 нг ДНК
Разнообразие наборов для пробоподготовки
Sample Prep Kits
• Спецификация по
типу исследования
Геномная
ДНК
• Возможность
мультиплексного
анализа
Экзомное
обогащение
ChiP-Seq
Полногеномная
экспрессия
РНК и
микроРНК
Mate Pair
секвенирование
(фрагменты 2-5 kb)
Flow Cell
Поверхность
flow cell
покрыта
газонов
парных олигов
Генерация кластеров:
Гибридизация и комплиментарный синтез
Сиквенсовый
адаптер
3’ удлинение
Генерация кластеров:
•
•
•
Двуцепочечная
молекула
денатурирует
Первичная цепь
вымывается
Новая цепь
закреплена на
поверхности
проточной ячейки
Денатурация 2-цепочечной ДНК
Новая цепь
Первичная
цепь
сброс
Генерация кластеров:
Ковалентно-связанные одиночные молекулы разделены пространственно
Единичные
молекулы
рандомно
расположены на
внутренней
поверхности
проточной
ячейки
Генерация кластеров:
Амплификация по типу мостов
•
•
Одноцепочечные
молекулы становятся
«мостиком» и
гибридизуются на
смежных олигах
Затем происходит синтез
новой цепи
Генерация кластеров:
Амплификация по типу мостов
•
Образуется двуцепочечный мостик
Генерация кластеров:
Амплификация по типу мостов
•
Цикл повторяется, пока не
образуются структуры из
множества мостов
Генерация кластеров:
•
•
Структура моста
денатурирует
Результат: 2 копии
ковалентно-связанных
одноцепочечных
молекул
Генерация кластеров:
•
«Отстающая
цепь»
вымывается,
остаётся только
«лидирующая»
Генерация кластеров:
Генерация кластеров:
•
Свободные
3’ концы
блокируются
•
Сиквенсовый
праймер
гибридизуется
на
сиквенсовый
адаптер
Сиквенсовый
праймер
Амплификация кластеров
100um
~1000 молекул на ~ 1 um кластер
~7 миллиардов кластеров
«Звёздное небо» из молекулярных кластеров ДНК
Sequencing Process
1
Library prep (~ 6 hrs)
Fragment DNA
Repair ends / Add A overhang
Ligate adapters
Select ligated DNA
2
Automated Cluster Generation (~ 5 hrs)
1-8 samples
Hybridize to flow cell
Extend hybridized oligos
Perform bridge amplification
3 Непосредственно секвенирование
(~1,5-11 дней)
Анализ последовательности DNA
Первичная обработка данных
Секвенирование путем синтеза (SBS)
3’ 5’
Цикл 1: Добавить реагенты для секвенирования
Первое основание включено
Удалить невключившиеся основания
Детектировать сигнал
A
T
G
C
C
G
T
PPP
T
A
C
A
Разблокировать и снять флуоресцентную метку
Основание
Флюоресценция
C
G
A
T
Цикл 2: Добавить реагенты для секвенирования
и повторить
T
A
G
A
C
T
C
C
G
A
G
C
T
C
G
A
T
5’
•
•
•
•
Все 4 нуклеотида добавляются в одной реакции
Высокая точность
Секвенирование от основания к основанию
Не возникает проблем с гомополимерными
повторами
Технология Clonal Single Molecule Array (Клональная
амплификация на чипе )
>7 миллионов кластеров
на проточную кювету MiSeq
И >3 млрд кластеров на
проточную кювету HiSeq
20 микрон
100 микрон
27
Новая разработка illumina
Персональный NGS
Встречайте! MiSeq
52.3 cm
12 cm
Эволюция приборов NGS на
примере платформы illumina
Все технологические этапы работы с пробами объединены в одном приборе
Генерация кластеров
Флюидика для парно—концевых чтений
Первичный и вторичный компьютерный анализ
По цене обычного секвенатора по Сенгеру
MiSeq – Подготовка, Запуск, Анализ
Ампликоны
Образец
gDNA
Подготовка
бибилотеки
1,5 часа
Клональная
амплификация и
Сиквенс
4,5 часа
Биоинформатическая
обработка данных
2 часа
полностью
автоматизированно)
MiSeq – единственная система, дающая результат
от образца до собранной последовательности за 8 часов
08:00:00
MiSeq: NGS это просто
Next-Gen Made Simple: Load & Go
Интуитивно понятный интерфейс
Катридж с реагентами (одноразовый)
Генерация кластеров (клональная амплификация)
и блок флюидики для парноконцевых чтений
встроены в прибор
Радиометка (RFID) на реагентах и
проточной ячейке
Автоматическая настройка и регулировка
Автоматизация «включил и ушел»
Load
Go
Анализ данных
MiSeq
Характеристики и производительность
Производительность оптимальна для работы с небольшими геномами
(может сделать полный сиквенс нескольких бактериальных
геномов de novo, достаточен для метогеномных исследований)
Самый простой из существующих на рынке методов пробоподготовки
для систем полногеномного секвенирования
Наиболее проверенная по качеству и надежности данных технология на
данный момент
Недорогой прибор и недорогой запуск – ~50 долларов за бактериальный
геном.
«Все в одной коробке», включая биоинформатику
Сравнительная характеристика секвенирующих платформ illumina
HiSeq2000
HiSeq1000
HiScanSQ
Genome Analyzer
MiSeq
Количество
генерируемых
данных, Гб
> 600
> 300
> 150
95
>1
Количество
проточных
ячеек/каналов
2/16
1/8
1/8
1/8
1/1
Возможность
мультиплекса,
образцы
192
96
96
96
48
Одноконцевое
чтение
2,5-3 млрд
1,3-1,5 млрд
600-750 млн
320 млн
3,4 млн
Чтение с двух
концов
5-6 млрд
2,5-3 млрд
1,2-1,5 млрд
640 млн
6,8 млн
2*100
2*100
2*100
2*150
2*150
Геномика,
транскриптомика,
эпигенетика
Ампликоны, малые
геномы и
транскриптомы,
проверка результатов
клонирования и
генной модификации
Длина чтения, п.н.
Применение в
исследованиях
Геномика,
транскриптомика,
эпигенетика
Геномика,
транскриптомика,
эпигенетика
Геномика,
транскриптомика,
эпигенетика
Сколько стоит NGS?
Изменение цены сиквенса полного генома человека как
универсального ценового индикатора
$10,000,000
500-кратное
уменьшение
стоимости за 3
года!
$1,000,000
$100,000
$10,000
$1,000
2007 1G
2007 GA
2008 GAII
2009 GAIIx 2010 HiSeq 2011 HiSeq 2011 MiSeq
MiSeq
Удобное решение для любой лаборатории
ВСЕ МЕТОДИКИ NGS В ОДНОМ ИНСТРУМЕНТЕ
УДОБНОЕ, ДЕШЕВОЕ И ПРОИЗВОДИТЕЛЛЬНОЕ
СЕКВЕНИРОВАНИЕ АМПЛИКОНОВ
СЕКВЕНИРОВАНИЕ ГЕНОМОВ МИКРООРГАНИЗМОВ И
МЕТАГЕНОМОВ
БЫСТРЫЙ И КАЧЕСТВЕННЫЙ СКРИНИНГ
Инфекционных болезней
Качества лекарственных препаратов
Контроля лечения
Проверка клонов
Целевое секвенирование участков генома
Тканевое типирование
КОНТРОЛЬ ЭКСПРЕССИИ И ГЕННОЙ РЕГУЛЯЦИИ
•
•
•
•
Спектр задач, решаемых полногеномными
секвенаторами
Геномика
– Секвенирование геномов de novo
– Полное повторное секвенирование геномов (поиск SNP, структурных перестроек и
вариаций, полногеномное генотипирование).
– Копийность генов, структурные вариации ДНК
Транскриптомика
– Анализ РНК (RNA-Seq)
– Изучение малых РНК (miRNA, siRNA, piRNA, esiRNA).
– Измерение уровней мРНК, анализ изоформ мРНК, изучение некодирующих РНК,
детекция новых транскриптов.
– Анализ экспрессии генов, в том числе, в отдельной клетке, по чувствительности
сравнимый с ПЦР.
Эпигенетика
– Иммунопреципитация хроматина с последующим секвенированием (ChIP-Seq).
• Факторы транскрипции, Модификации гистонов
– Анализ статуса метилирования ДНК в полногеномном масштабе (MeDIP-Seq).
Исследование бактериома (метагеномика)
– Прямое полногеномое типирование микроорганизмов и вирусов
– Определение микробиологического состава популяций (экология, экосистемы, почвы)
– Таксономия
Объединение технологий NGS и
микрочипов высокой плотности
Платформа iScan –биочипы высокой плотности
• Технология биочипов высокой
плотности
• 2 вида чипов:
– Infinum – плотность 6К-240К5М маркеров /чип
– GoldenGate – плотность 96-6К
маркеров/чип
• Производительность – 2-12
образцов на чип
Технологическая платформа используется для высокопроизводительного
анализа SNP; экспрессии генов; CNV (вариацию числа копий); генетических
полиморфизмов MHC, ассоциированных с заболеваниями; метилирования;
Есть панели на человека, мышь, овцу, лошадь, Custom-панели
Технология BeadChip
Приготовление микролунок с BeadChip
Кремниевое покрытие
Фотоустойчивый
слой
Микролунки
2um
2um
3.7um
G
G
C
T
A
A
Однонуклеотидное удлинение
GC
CG
CG
AT
A
T
C
G
AT
dintrophenol-labeled ddNTPs
TA
biotin-labeled ddNTPs
Окрашивание
streptavidingreen
anti-DNPred
C
C
G
A
T
T
anti-streptavidinbiotin
anti-AbDNP
Усиление сигнала и визуализация
A
T
INTENSITY
G
C
INTENSITY
INTENSITY
C
T
Анализ данных. Genome Studio
Анализ данных. Genome Studio:
Наглядное и простое представление цитогенетических данных
KaryoStudio Screenshot
Known regions
track
Zooming, editing,
reporting functions
Found regions
table
Samples table
with QC score
Data display
Known regions
database
Gene Information
Chromosome
information
Семейство биочипов Illumina.
Цель: изучение человека
Семейство биочипов Illumina.
Цель: изучение генома животных
iScan with Autoloader2
Платформа BeadXpress –
Суспензионные биочипы
•
•
•
•
•
Биочиповая технология для больших потоков образцов – 96-луночные плашки, 8луночные стрипы
Мультиплексность – до ~384 образцов одновременно (технология штрих-кодирования
микрочастиц)
Возможность работы с ДНК, РНК и белками
Готовые наборы VeraCode, и возможность создавать собственные наборы на основе
этой технологии
2 флюорисцентные краски для 2 типов зондов
Технология VeraCode
КАПИЛЛЯРЫ ГОНЯТ ЧИПЫ К
АНАЛИТИЧЕСКОЙ ПЛАСТИНЕ
АНАЛИТИЧЕСКАЯ ПЛАСТИНА
С СЕКЦИЯМИ ДЛЯ ЧИПОВ
ЧИПЫ
ПОПАДАЮТ В
СЕКЦИИ
ПЛАСТИНКИ
ЧИПЫ РАСПОЛАГАЮТСЯ В ПОЗИЦИЯХ
ОПТИМАЛЬНЫХ ДЛЯ СКАНИРОВАНИЯ
Анализ чипов
CCD
ВОСПРИНИМАЮЩИЙ
ЭЛЕМЕНТ
ЧИП
СЧИТЫВАЮЩИЙ
ЛУЧ
Pixel
240
220
200
180
160
140
120
100
80
60
40
20
220
200
390
180
340
160
140
290
200
240
180
340
160
290
140
180
160
120
240
290
140
160
190
240
120
140
240
120
140
100
190
120
190
100
120
140
190
100
100
140
80
100
140
80
140
80
80
80
90
60
90
90
60
90
60
60
40
0
ADC Output
220
440
200
240
160
290
390
340
180
BeadXpress Reader
НАБОРЫ
ЖИДКИХ
ЧИПОВ
ПЛАНШЕТ ДЛЯ
ОБРАЗЦОВ
РЕЗУЛЬТАТ
ЗА
СЧИТАННЫЕ
МИНУТЫ
ПАНЕЛЬ
МУТАЦИЙ
INSTRUMENT SPECIFICATIONS
ПРОСТОЙ ФОРМАТ ИССЛЕДОВАНИЙ
Стандартный 96-луночный планшет, или стрипы
МУЛЬТИПЛЕКС НА ОДНУ ЛУНКУ
1 to 384
ПРОИЗВОДИТЕЛЬНОСТЬ
120 образцов/час при 10-плексном исследовании
80 образцов/час при 96-плексном исследовании
ДЕТЕКЦИЯ
2 лазера, 2 цвета + штрих-код
АВТОМАТИЗАЦИЯ
Совместим со стандартным лабораторным оборудованием
Совместим с любой ЛИС
Платформа BeadXpress
Решаемые задачи и реагентное обеспечение
Технология – суспензионный (жидкостный)
биочип
Преимущества:
•дешевизна точки за счет мультиплекса
•большая производительность по образцам
•SNP генотипирование с выской производительностью (по образцам)
•Фармакогенетика (ADME панели – основные SNP, ассоциированные с
метаболизмом лекарств)
•Метиллирование
•Анализ экспрессии генов
•(Пользователь выбирает до 384 целевых генов и из них делается набор под
стандартную 96 луночную плашку)
•Наборы для пришивки белков и антител
•Наборы для создания собственных гибирдизационных тест-систем
Совмещая технологии…
HiScanSQ
Scan & Seq =
HiScanSQ
Единственная в своём роде система, совмещающая
высокопроизводительный анализ биочипов и
секвенирование нового поколения
Возможности сканера
– Загрузка и сканирование 4-х биочипов в
реальном времени
– Высокоточная оптическая система
– 2 CCD камеры
Разрешение сканера 0,5 микрон
Возможности секвенирования
Производительность данных
– До 150 Gb за 1 запуск
– Более 17,5 Gb в день
Время 1 запуска
– 1.5 дня при 1*36 bp SR
– 8 дней при 2*100 bp PE
Плотность кластеров
– Более 1,5 миллиардов кластеров,
прошедших фильтр и пригодных для анализа
HiScanSQ
Динамика числа публикаций
(только по данным, полученным на платформе Illumina)
1000
900
800
700
600
500
400
300
200
100
0
Q1
Q2
Q3
2007
Q4
Q1
Q2
Q3
2008
Q4
Q1
Q2
Q3
2009
Q4
Q1
Q2
2010
Q3
Применение
технологий
illumina в мире
Русский учёный Евгений Рогаев
и его группа путём глубокого
секвенирования ДНК семьи
Николая II с помощью
технологий Illumina определили
состав генетического кода
членов семьи, характерные
мутации в геноме, отделили
членов царской семьи от
прислуги и доказали, что
найденные отдельно останки
соответствуют геномам
царевича Алексея и княжны
Анастасии
СЕКВЕНИРОВАНИЕ ГЕНОМА РАКОВЫХ ОПУХОЛЕЙ
Nature 2008. 456:66-72
Секвенирование генома лейкемии в сравнении с образцами нормальной ткани у того
же пациента
Возможность отделить геном раковой опухоли от генома здоровых клеток в одной
пробе даже при небольшом количестве материала
“Большинство из
исследованных генов на период
начала работы даже не
рассматривались, как
кандидаты на раковую
предрасположенность”
Greninger et al,
PLOS 2010
Результат:
•
Удалось идентифицировать
вирус H1N1 даже при сверх
низких титрах
• Собрать геном вируса de novo
на основе полученных данных
• Идентифицировать SNP в
последовательностях H1N1
• Получить данные о вирусном
и микробиологическом
составе образцов
• Характере и степени
иммунного ответа
«Глубокий» сиквенс
региона V6 16s rRNA
Идентификация не
культивируемых видов
Высокая
чувствительность
Мультиплексирование
(сотня разных образцов
за один запуск)
Исследование пренатальной анеуплоидии путём сиквенса с
низким покрытием в неинвазивной пренатальной диагностике
–“Sequencing is the clear way to do
non-invasive prenatal testing. …
existing noninvasive Down syndrome
tests are not very informative and
provide variable results depending on
the ethnicity of those taking the test.”
DNA
Sequence
Miller Syndrome
Tumor Profiling
Cytogenetics
Selected
Publications
Cytogenetics
Algorithms
WGAS/Algo
WGAS
www.illumina.com/publications
Illumina Epigenomics
Глубокое и быстрое изучение всех областей в полном геноме,
транскриптоме и генной регуляции
ChIP-Seq
DNA Sequencing
Targeted Resequencing
Genotyping arrays
GG geno on Veracode
Bisulfite Seq
Infinium methylation
GG meth on Veracode
ChI
PSe
q
mRNA-Seq
smRNA-seq
Expression arrays
Transcriptome
Epigenome
Genome
Download