ПДФ 12

РОССИЙСКАЯ АКАДЕМИЯ НАУКИнститут биоорганической химииим. академиков М. М. Шемякина и Ю. А. ОвчинниковаНа правах рукописиУДК 577.2Ажикина Татьяна ЛеодоровнаГИБРИДИЗАЦИОННЫЕ ПОДХОДЫ В ШИРОКОМАСШТАБНЫХ ИССЛЕДОВАНИЯХ ГЕНОМОВ03.00.03 — Молекулярная биологияАВТОРЕФЕРАТдиссертации на соискание учёной степенидоктора биологических наукМосква – 20092Работа выполнена в лаборатории структуры и функций генов человека Института биоорганической химии им. М.М. Шемякина и Ю.А. Овчинникова РАННаучный консультант:Академик РАН, докт. хим. наук, профессор Е. Д. СвердловОфициальные оппоненты:Чл.-корр. РАН, докт. биол. наук С. А. ЛукьяновЧл.-корр. РАН, докт. биол. наук, профессор Б. Ф. ВанюшинДокт. биол. наук П. М. РубцовВедущая организация: Институт Биологии Гена РАНЗащита состоится » » 2009 г. в часов на заседании Специализированного совета Д 002.019.01 при Институте биоорганической химии им. М.М. Шемякина и Ю.А. Овчинникова РАН по адресу:117997, г. Москва, ул. Миклухо-Маклая, 16/10С текстом диссертации можно ознакомиться в библиотеке Института биоорганической химии им. М.М. Шемякина и Ю.А. Овчинникова РАНАвтореферат разослан » » _____________ 2009 г.Учёный секретарьСпециализированного советадоктор физ.-мат. наук В. А. Олейников3ХАРАКТЕРИСТИКА РАБОТЫАктуальность проблемы. Структурно-функциональные и сравнительные исследования геномов по-прежнему остаются основой молекулярной биологии и генетики. Все методы таких исследований условно подразделяют на две большие группы: методы прямого секвенирования и методы несеквенирующего сравнительного анализа. Современное секвенирование включает серию высокотехнологичных масштабных методов, позволяющих определять в короткие сроки последовательности десятков и сотен миллионов нуклеотидов. Однако полностью решить проблемы полногеномного исследования только прямым секвенированием вряд ли возможно, поскольку в геномах (особенно эукариотических) имеются локусы, недоступные для клонирования, определения первичной структуры ДНК или однозначной реконструкции протяженных фрагментов из-за наличия большого числа гомопоследовательностей, GC-богатых участков и/или повторов. Так, например, в «окончательном» варианте генома человека, опубликованном International Human Genome Sequencing Consortium в 2004г., оставалось более чем 340 участков, для которых не была определена первичная структура. Кроме того, полногеномное секвенирование остается очень дорогим методом, и всестороннее изучение громадной геномной вариабельности посредством секвенирования с точки зрения материальных затрат в настоящее время и в обозримом будущем нереально.Методы, относящиеся ко второй группе, основанные на использовании свойства ДНК образовывать устойчивые двухцепочечные структуры из комплементарных одноцепочечных молекул, получили название гибридизационных. Среди гибридизационных подходов в частности активно используются различные виды микроэрреев, позволяющие в значительной степени интенсифицировать исследования при снижении временных и стоимостных затрат. Несмотря на широкое распространение в мире и успешное применение для решения самых разнообразных задач геномики, микроэррейные технологии имеют серьезные недостатки: недостаточная специфичность гибридизации на твердой подложке, а также большое количество ложнопозитивных сигналов, возникающих при взаимодействии повторяющихся элементов генома, семейств генов и других неоднозначных участков. Существенным ограничением метода является обязательность знания нуклеотидной последовательности генома-стандарта, без чего невозможно сконструировать микроэррей, а в сравниваемых со стандартом исследуемых геномах невозможно детектировать последовательности, присутствующие в исследуемом геноме, но отсутствующие в стандарте.Таким образом, по-прежнему актуальными являются разработка и совершенствование гибридизационных методов анализа геномов, которые могли бы4расширить возможности уже существующих методов, в частности, позволили бы непосредственно выделять последовательности, отличающие разные геномы или их транскриптомы.Цель работы. Целью данной работы являлось создание и применение для решения разнообразных задач функциональной и эволюционной геномики новых гибридизационных методов выявления и выделения последовательностей, отличающихся или, наоборот, совпадающих в различных геномах и транскриптомах, в частности, с использованием олигонуклеотидов с повышенным сродством к комплементарной матрице.Задачи исследования. В ходе работы были решены следующие задачи:1.Предложена оптимизация метода вычитающей гибридизации для сравнения близкородственных геномов. С помощью этого метода проведено широкомасштабное сравнение и построена карта характерных делеционно-инсерционных различий в геномах российских штаммов Mycobacterium tuberculosis. Проведено сравнение геномов близкородственных сиговых рыб — байкальского омуля и сига.2.Разработан метод Coincidence Cloning (клонирование идентичных последовательностей), заключающийся в отборе фрагментов с одинаковыми нуклеотидными последовательностями, принадлежащими двум разным образцам. Предложен новый экспериментальный подход для изучения тканеспецифического метилирования протяженных геномных участков (млн. п.о.). С использованием разработанного метода проведен сравнительный анализ метилирования участка ДНК 19-ой хромосомы в нормальных и опухолевых тканях.3.Разработан новый экспериментальный подход для изучения транскриптома внутриклеточных патогенов в системе in vivo. С применением разработанного метода получен и охарактеризован транскриптом штамма H37Rv M. tuberculosis в инфекционной системе (легкое мыши, инфицированной M. tuberculosis).4.Исследована возможность использования олигонуклеотидов с повышенным сродством к комплементарной матрице (содержащих 5-метил-цитозин и 2-аминопурин) в качестве зондов в секвенировании и ПЦР.Научная новизна, теоретическая и практическая значимость работы. Разработана методика экспериментального сравнительного анализа геномов – ПДРФ-вычитающая гибридизация, позволяющая сравнивать геномы близкородственных бактериальных штаммов. С ее помощью впервые проведено сравнение геномов различных штаммов M. tuberculosis, циркулирующих на территории РФ и вызывающих различные5клинические формы заболевания. На основе полученных нуклеотидных последовательностей и методики геномной ПЦР разработан экспериментальный подход для изучения инсерционно-делеционного полиморфизма российской популяции Mycobacterium tuberculosis (ID-типирование). Впервые данный подход был применён для генотипирования российских клинических штаммов и последующей кластеризации популяции на генетически однородные группы. Также впервые описана делеция, строго характеристичная для высоковирулентного семейства штаммов W/Beijing. Идентифицированные нуклеотидные последовательности могут быть использованы в качестве молекулярно-генетических маркеров для фундаментальных исследований в области микобактериальной популяционной генетики, а также для практического применения в медико-генетических и эпидемиологических целях, в частности для диагностики различных подгрупп M. tuberculosis в клинических условиях.Методом ПДРФ вычитающей гибридизации впервые исследован геномный полиморфизм представителей байкальских сиговых рыб – озерного сига (Coregonus lavaretus baicalensis Dybovsky) и омуля (C. autumnalis migratorius Georgi), дивергировавших от общего предка 10–20 тыс. лет назад. Впервые найденные генетические различия между байкальскими сиговыми чрезвычайно малы и соответствуют полиморфным некодирующим участкам геномов, варьирующим в результате однонуклеотидных замен и коротких делеций.Разработан новый метод изучения метилирования ДНК на протяженных геномных участках, который дает информацию о статусе метилирования CpG динуклеотидов вне зависимости от их расположения относительно кодирующих и регуляторных областей. Разработан и протестирован новый методический принцип, позволяющий с минимальными затратами времени картировать сайты расщепления генома. Для ускорения обработки получаемых массивов данных создан комплекс программных продуктов, предложены несколько подходов к визуализации данных, а также разработано программное обеспечение, осуществляющее эту визуализацию максимально простым для пользователя способом. Метод был использован для анализа распределения неметилированных CpG сайтов для различных нормальных и опухолевых тканей человека в полигенном локусе 19 хромосомы FXYD5-COX7A1 размером 1,02 млн.п.о. В результате работы впервые получены подробные эпигенетические карты этого локуса. Разработанный метод может быть применен в фундаментальных исследованиях в области молекулярной биологии и медицины для решения широкого круга проблем, связанных с эпигенетической регуляцией генома, а также для практического применения в медико-6генетических целях, в частности, для поиска диагностических маркеров различных патологий, а также терапевтических мишеней.Впервые разработан метод анализа транскриптома внутриклеточных патогенов непосредственно в инфицированных тканях. С его использованием получен и проанализирован набор генов Mycobacterium tuberculosis, транскрибирующихся в легочной ткани мышей, больных туберкулезом. Разработанный метод анализа патогенной бактериальной РНК из пораженных тканей может быть использован для исследований любого бактериального инфекционного возбудителя, в том числе, поиска факторов вирулентности, мишеней лекарственной терапии, разработки стратегии эпидемиологического мониторинга заболевания.Впервые исследована возможность использования модифицированных олигонуклеотидов с повышенным сродством к комплементарной матрице, содержащих 5-метилцизозин и 2-аминоаденин, в качестве праймеров в секвенировании и ПЦР. Показана их повышенная эффективность праймирования при сохранении специфичности отжига. Разработан вариант молекулярной дактилоскопии, RAPD, с использованием таких олигонуклеотидов.Апробация результатов работыОсновные результаты работы были представлены на научных конференциях и симпозиумах, в том числе: Международных конференциях «Молекулярная медицина и безопасность» (Москва, 2008,), IV съезде Российского общества биохимиков и молекулярных биологов (Новосибирск, 2008), Всероссийской научно-практической конференции с международным участием «Молекулярная диагностика-2007, Москва», 5-ой (1996 г.), 6-ой (1997 г.) и 9-ой (1999 г.) конференциях российской программы «Геном человека», Международных Энгельгардтовских конференциях по молекулярной биологии (1994, 1999, 2005); III (1996), IV (1998), VI (2002), VIII (2006) чтениях, посвященных памяти академика Ю.А. Овчинникова, 2-ой Международной научно-практической конференции МЕДБИОТЕК «Перспективы развития биотехнологий в России» (Пущино, 2005), Международных конференциях «Фундаментальные науки – медицине» (Новосибирск, 2006, 2007, 2008), конгрессах HUGO Human Genome Meeting (Heidelberg 1996, Brisbane 1999, Vancouver 2000, Helsinki 2006), Cancer Genomics and Emerging Technologies (Boston, 2006), 3rd Congress of the International Union against Tuberculosis and Lung Diseases (Moscow, 2004), Symposium der Deutschen Akademie der Naturforscher Leopoldina «DNA Methylation — An Important Genetic Signal: Its Significance in Biology and Pathogenesis» (Weissenburg, 2004), 26th Annual Congress of the European Society of7Microbiology (Istanbul, 2005), 10th International Symposium on the Biology and Management of Coregonid Fishes (Winnipeg 2008), и других Российских и международных симпозиумах.Структура и объем диссертацииДиссертационная работа состоит из введения, обзора литературы, описания материалов и методов исследования, изложения результатов работы и их обсуждения, заключения, выводов и списка литературы. Работа изложена на …….странице, содержит ….. рисунков и …… таблиц. Список литературы включает …….источников.Личный вклад автораАвтору принадлежит решающая роль в планировании эксперимента, разработке методик и обобщении полученных результатов. Весь экспериментальный материал получен автором и руководимыми им аспирантами ИБХ РАН.ПубликацииДиссертация обобщает данные 22 основных статей.РЕЗУЛЬТАТЫ И ОБСУЖДЕНИЕ1. ВЫЧИТАЮЩАЯ ГИБРИДИЗАЦИЯ БЛИЗКОРОДСТВЕННЫХ ГЕНОМОВ1. 1 МЕТОД ВЫЧИТАЮЩЕЙ ГИБРИДИЗАЦИИ И ОПТИМИЗАЦИЯ ЕГО ВАРИАНТА – ПДРФ- ВЫЧИТАЮЩЕЙ ГИБРИДИЗАЦИИОдним из перспективных подходов к решению задачи поиска различий между двумя сравниваемыми геномами является метод вычитающей гибридизации (ВГ). Этот метод даёт возможность находить нуклеотидные последовательности (мишени), отличающие геном одного организма – так называемого трейсера, от генома другого организма – драйвера. При использовании метода вычитающей гибридизации образцы двух геномных ДНК фрагментируют на отрезки небольшой длины (300–2000 п.о.). Один из образцов (трейсер) смешивают с большим избытком другого (драйвер), ДНК сначала денатурируют, а затем ренатурируют. В ходе ренатурации цепи ДНК трейсера, идентичные драйверу, образуют с ним гибриды, в то время как уникальные трейсер-специфические последовательности гибридизуются сами на себя, образуя гомодуплексы трейсера или «мишени». Удаление гибридов и гомодуплексов «драйвер/драйвер» приводит к значительному обогащению «мишенями» в дифференциальном продукте.Мы оптимизировали версию ПДРФ-вычитающей гибридизации (RFLP subtraction) для сравнения близкородственных геномных последовательностей. Основной принцип метода приведён на рис. 1.8Геном 1 Геном 2Фрагменты, полученные в результате расщепления двух сравниваемых геномов, можно разделить на три типа: (i) фрагменты, имеющие идентичные нуклеотидные последовательности в двух геномах и т.о. имеющие одинаковые длины (фрагменты 1 и 2); (ii) фрагменты, произошедшие от одной нуклеотидной последовательности, но претерпевшие изменения в процессе эволюции и имеющие небольшие инсерции или делеции, их длины будут различны (фрагменты 3, 5). Такие фрагменты могут быть легко утеряны при проведении стандартной процедуры вычитания, т.к. существует возможность их совместной гибридизации. Вероятность такой гибридизации будет тем выше, чем меньше размер инсерций или делеций. Длины фрагментов третьего типа (iii) различаются из-за наличия точечных мутаций и возникновения дополнительных сайтов узнавания рестрикционными эндонуклеазами (фрагмент 4).Рис. 1. Основной принцип ПДРФ-вычитающей гибридизации. Геномная ДНК обозначена горизонтальными линиями. Чёрный прямоугольник – инсерция в геномной ДНК, белый прямоугольник – делеция. Стрелками указаны сайты рестрикции; точечная мутация, приводящая к возникновению дополнительного сайта рестрикции, обозначена звёздочкой. Получаемые рестриктные фрагменты пронумерованы. Электрофореграмма рестриктных фрагментов представлена в нижней части схемы.1 2 3 4 5 1 2 31 41 42 51Геном 1 Геном 2Зона 1.1Зона 1.251Зона 2.2Зона 2.11134Вычитание наборов ДНК из разных зонзона 1.1 – зона 1.2 = фрагменты 3, 43142524129Параллельное электрофоретическое разделение двух наборов рестрикционных фрагментов приводит к тому, что идентичные фрагменты располагаются в идентичных положениях электрофореграммы, в то время как гомологичные фрагменты, несущие инсерции или делеции, находятся в различных положениях электрофореграммы (рис. 1). Оба набора фрагментов делятся на зоны, содержащие фрагменты с различными длинами. При проведении вычитающей гибридизации двух наборов ДНК одинаковой длины гомологичные фрагменты с различными длинами оказываются в разных зонах и не гибридизуются друг с другом.Таким образом, разработанный нами подход включает предварительный этап подготовки сравниваемых геномных образцов, состоящий из следующих стадий:-исчерпывающий гидролиз двух сравниваемых образцов ДНК частощепящей эндонуклеазой рестрикции (например, Alu I).-лигирование к рестриктным фрагментам обеих ДНК адаптера, состоящего из длинного олигонуклеотида (20-25 нуклеотидов) и комплементарной ему короткой «подложки». Адаптер конструируется таким образом, что при лигировании к фрагментам, образующимся в результате гидролиза ДНК, сайт, специфически узнающийся используемой эндонуклеазой рестрикции, восстанавливается.-ПЦР амплификация фрагментов ДНК с лигированными адаптерами и электрофоретическое разделение продуктов ПЦР в агарозном геле. Вырезание зон, содержащих фрагменты ДНК определённой длины, элюция ДНК из геля.Полученные наборы фрагментов ДНК далее используются для приготовления трейсера и драйвера. Проведение вычитающей гибридизации и дальнейший анализ проводится стандартным способом.1.2. ПОЛНОГЕНОМНОЕ СРАВНЕНИЕ РАЗЛИЧНЫХ ШТАММОВ M. tuberculosis1.2.1.Полногеномное сравнение штаммов HN878 и CDC1551, вызывающих различные клинические формы туберкулёзаНами было проведено сравнение генома штамма M. tuberculosis HN878, способного вызывать туберкулёз с внелёгочной формой локализации, и штамма CDC1551. Целью сравнения была оценка эффективности оптимизированного метода ПДРФ-вычитающей гибридизации и поиск молекулярно-генетических маркёров, характеризующих ту или иную форму протекания заболевания. Штамм HN878 принадлежит семейству W, которое выделяется на основании одинакового сполиготипа Beijing, и характеризуется в частности повышенной частотой проявления множественной лекарственной устойчивости. Штамм CDC1551 является высококонтагиозным. Последовательность его10генома была полностью определена и охарактеризована (Fleischmann et al, 2002). В результате проведённого полногеномного сравнения нами были получены дифференциальные последовательности, присутствующие в геноме штамма HN878 и делетированные или изменённые в геноме штамма CDC1551.Анализ полученных нуклеотидных последовательностей проводился с помощью международных баз данных, содержащих полногеномные последовательности штаммов M. tuberculosis H37Rv и CDC1551, а также последовательности геномов M. tuberculosis 210, M. bovis AF2122 и M. bovis BCG, определение которых не было завершено на момент проведения работы.Было охарактеризовано 9 дифференциальных фрагментов, представляющих собой последовательности ДНК, заключённые между двумя сайтами рестрикции, узнаваемыми эндонуклеазой рестрикции Alu I, которая использовалась в работе. Все фрагменты оказались высоко подобными (97-99% идентичности) последовательностям генома штамма M. tuberculosis 210. Меньший уровень идентичности наблюдался с участками генома CDC1551. Найденные в результате сравнения отличия можно разделить на три группы.Первая группа генетических различий между геномами HN878 и CDC1551 — это новые места интеграции транспозона IS6110. В результате вычитающей гибридизации было найдено три различных фрагмента, 5′-концевая часть которых была идентична концевой части транспозона IS6110, а 3′-концевая часть каждого фрагмента оказалась идентичной определённому гену CDC1551. В геноме CDC1551 в районе данных генов встраивания IS6110 не происходит. ПЦР ортологичных локусов в геномах HN878 и CDC1551 показала, что во всех трёх случаях в геном HN878 интегрирована полноразмерная копия транспозона. Места интеграции находятся в межгенных участках генома штамма HN878 (гены MT3269–МТ3270, МТ0001–МТ0002), а также непосредственно в кодирующей последовательности гена МТ1515, кодирущего катион-транспортирующую АТФазу.Вторая группа дифференциальных фрагментов является результатом внутригеномных перестроек, связанных с различными повторяющимися последовательностями. Два фрагмента представляют собой комбинации участков генов семейства PPE, характерных только для микобактерий. Третий фрагмент представляет собой последовательность ДНК, идентичную участкам в составе повторов в геноме CDC1551 (clustered regularly interspaced short palindromic repeat), но содержащую небольшие мутации инсерционно-делеционной природы. Подобные различия в структуре,11связанные с повторяющимися последовательностями, могли появиться в результате внутригенных рекомбинационных событий или в процессе репликации.Характерной особенностью третьей группы генетических различий между штаммами HN878 и CDC1551 является наличие протяженных нуклеотидных последовательностей, отсутствующих в геноме CDC1551.Все обнаруженные нами дифференциальные фрагменты, характерные для генома «внелёгочного» штамма M. tuberculosis HN878, оказались полностью гомологичными соответствующим локусам генома M. tuberculosis 210, вызывающего туберкулёз с классическими лёгочными симптомами течения заболевания. Это означает, что обнаруженные нами различия не связаны с внелегочной локализацией заболевания. Возможно, выбор пригодной для штамма среды обитания обуславливается не столько его генотипическими особенностями, сколько особенностями организма хозяина и конкретными внутренними условиями во время размножения патогена. Этот вопрос требует дальнейшего изучения.В результате проведённого геномного сравнения нами было показано, что метод вычитающей гибридизации с использованием разделения полного набора рестрикционных фрагментов по длине и последующим вычитанием полученных «зон» даёт возможность обнаружения небольших мутаций инсерционно-делеционной природы и геномных перестроек. Такие незначительные изменения геномной структуры невозможно детектировать при помощи обычного варианта вычитающей гибридизации. Тем не менее, они могут оказывать существенное влияние на формирование фенотипических свойств патогена, приводя к возникновению генетически близких, но фенотипически различных штаммов.1.2.2. Полногеномное сравнение геномов российских клинических штаммов M. tuberculosis с геномом штамма H37RvДля исследования вариабельности геномов российских штаммов M. tuberculosis было выбрано три штамма, принадлежащих семейству W/Beijing (155/6, 1643, 1462), и один штамм семейства Haarlem (1540), для которого была показана повышенная степень вирулентности по сравнению с представителями семейства W/Beijing. Отбор и культивирование штаммов M. tuberculosis, их микробиологическая характеристика и получение образцов геномной ДНК проводились в лаборатории И.Г. Шемякина (ГНЦ Прикладной Микробиологии, г. Оболенск). В нашей работе геномы штаммов M. tuberculosis 1540, 155/6, 1643 и 1462 сравнивались с геномом штамма H37Rv, последовательность которого определена и охарактеризована (Cole et al, 1998).12В результате сравнения было получено 12 фрагментов, присутствующих в геномах российских штаммов M. tuberculosis и делетированных в геноме H37Rv, из которых 10 фрагментов идентичны различным участкам генома штамма CDC1551, а два – участкам генома M. tuberculosis 210. Фрагменты, найденные нами при вычитании, представляют собой геномные последовательности, заключённые между двумя сайтами рестрикции, узнаваемыми эндонуклеазой рестрикции AluI, и являются частью более протяжённых делеций. Большинство фрагментов присутствует в геномах всех сравниваемых штаммов, что может свидетельствовать об определённой степени родства между этими штаммами. Все обнаруженные последовательности располагаются в кодирующих областях генома, это согласуется с данными о пониженной частоте возникновения мутаций в межгенных участках микобактериальных геномов. Кроме того, они не распределяются по геному случайно, а концентрируются в определённых его областях, характеризующихся повышенной степенью вариабельности среди различных штаммов M. tuberculosis.. Некоторые из генов, в состав которых входят найденные дифференциальные фрагменты, кодируют белки с известными функциями, для белковых продуктов других генов функция является лишь предполагаемой (табл.1).Табл. 1. Дифференциальные локусы, найденные при сравнении геномов четырёх российских клинических штаммов M. tuberculosis с геномом штамма H37Rv. Серый прямоугольник – наличие локуса в геноме соответствующего штамма, белый прямоугольник – данный фрагмент делетирован в геноме штамма. Буквами МТ обозначены гены CDC1551, в состав которых входят найденные дифференциальные фрагменты, фрагменты A4 и G2 идентичны участкам генома M. tuberculosis 210.локус155/6164314621540ФункцияMT1360предполагаемая аденилатциклазаMT1799предполагаемая фосфолипаза СMT1802мембранный белок, семейство MmpLMT2081консервативный гипотетический белокMT2082предполагаемая хеликазаMT2508трансмембранный нуклеотидсвязывающий белокMT3426птерин-4-α-карбиноламин дегидратазаMT3427белок А, участвующий в биосинтезе кофактора молибдоптеринаMT3428регулятор транскрипции, семейство AfsR/DnrI/RedDMT3489белок, родственный 1-дезоксиксилулозо-5-фосфат-синтазеA4белок – гомолог белков РРЕ семейства (идентичность аминокислотного состава ~ 55%)G2белок – гомолог белков РРЕ семейства (идентичность аминокислотного состава ~ 60%)13Большинство найденных нуклеотидных последовательностей присутствует в геномах всех исследуемых российских штаммов M. tuberculosis, однако геном наиболее вирулентного из исследуемых штаммов M. tuberculosis 1540 имеет как минимум три отличия от менее вирулентных штаммов 155/6, 1643 и 1462. Найденные нами дифференциальные фрагменты являются частью генов MT1799, MT1802 и MT2508. Ген МТ1799 (plcD) кодирует известный фактор бактериальной вирулентности – фосфолипазу С. Ген МТ1802 (mmpL8) кодирует один из мембранных белков, предположительно определяющих характер взаимодействия M. tuberculosis с клеткой хозяина. Третьим отличием генома штамма 1540 от штаммов 155/6, 1643 и 1462 является делеция размером 212 п.о. в гене MT2508. Таким образом, наличие в геноме этих трёх инсерций может обуславливать проявление штаммом 1540 более вирулентных свойств.1.2.3. Исследование полиморфизма найденных дифференциальных локусов в российской популяции клинических штаммов M. tuberculosisНами предложен способ генотипирования штаммов M. tuberculosis методом геномной ПЦР следующих локусов: G2, MT1360, MT1799, MT1802, MT2081, MT2082, MT2508, MT3426, MT3427, MT3428, Rv0073, Rv1762с. Локусы А4 и MT3489 оказались неполиморфными в изученной популяции, поэтому были исключены. Локусы Rv0073 и Rv1762с получены как дифференциальные в серии не описанных в диссертации экспериментов. Эффективность и достоверность предложенного нами метода, названного ID-типированием, была показана на коллекции 172 штаммов M. tuberculosis, циркулирующих в центральных регионах Российской Федерации. Данная коллекция создана в лаборатории И.Г. Шемякина (ГНЦ Прикладной Микробиологии, г. Оболенск), там же проводилось IS6110-RFLP-типирование, сполиготипирование и кластеризация штаммов. Согласно результатам, полученным И.Г. Шемякиным с сотр., 51 штамм из коллекции принадлежал семейству AI (сполиготип LAM), циркулирующему на территории Российской Федерации и выделенному недавно; 46 штаммов входило в состав семейства W/Beijing, 49 штаммов представляло семейство Haarlem. Остальные представители коллекции либо принадлежали редко представленному сполиготипу Т, либо для них сполиготип не был идентифицирован.Гены, которые были использованы для ID-типирования, имеют различную степень полиморфизма (табл. 2).14Табл. 2 Инсерционно-делеционный полиморфизм в основных сполигосемействах.Наличие исследуемого локуса в данном типе сполигосемейства обозначено цифрами (%)UEP — unique event polymorphismДелетированный районГены в составе делецииBeijing(44 штамма)Haarlem(49 штаммов)LAM/A1(51 штамм)Характеристика делецииMT25080100100UEPG2 фрагмент1009610MT1799010016RvD2MT1802010016IS-dependentMT208110010094RvD1MT20821008892UEPMT34261008698MT34271008880MT34281008882IS-dependentRvD5MT13601009821RD105Rv00730100100UEPRD152Rv1762010012IS-dependentДелеция гена Rv0073, входящего в состав делетированной последовательности RD105 (Region of Difference, протяженная нуклеотидная последовательность, отсутствующая в геноме штамма M. tuberculosis H37Rv), характерна только для представителей семейства W/Beijing, что уже было описано в литературе. Мы подтвердили на другой географически обособленной группе штаммов, что делеция RD105 является UEP (unique event polymorphism), строго характеризующей это семейство. Также мы установили, что ранее нигде не упоминаемая делеция в гене МТ2508 размером 212 п.о. также характерна только для представителей семейства W/Beijing и представляет собой ещё один, до настоящего времени не описанный UEP.Как правило, геномные локусы, связанные с интеграцией транспозона IS6110, обладают повышенной вариабельностью. Таковы гены МТ1799 и МТ1802, входящие в состав ранее описанной делеции RvD2, и МТ3426, МТ2327, МТ3428, входящие в состав делетированного участка генома RvD5. Делеции этих локусов являются результатом гомологичной рекомбинации между последовательностями IS6110 и могут возникать независимо в геномах неродственных штаммов, поэтому их нельзя назвать отдельными характеристическими признаками. Однако изучение полиморфизма данных участков генома остаётся важной задачей, так как гены, входящие в состав RvD2 и RvD5, являются либо уже доказанными, либо кандидатными факторами вирулентности, следовательно, изменчивость этих районов генома может оказывать влияние на формирование и модуляцию вирулентных свойств патогена.15Штаммы семейства W/Beijing являются генетически однородными по проанализированным 11 последовательностям, промежуточными являются штаммы семейства Haarlem и наиболее генетически гетерогенными оказались штаммы группы AI/LAM. Это соответствует картине сполиготипирования представителей данного семейства. Несмотря на то, что семейства AI/LAM и Haarlem оказались генетически гетерогенными, каждое из них характеризуется определённым набором ID-профилей, с явным доминированием одного варианта. Кроме того, следует отметить отсутствие совпадений среди ID-профилей, характерных для разных семейств M. tuberculosis.В нашей работе был продемонстрирован высокий уровень инсерционно-делеционного полиморфизма некоторых областей генома, связанный с транспозициями IS6110 элемента. Чем чаще происходит последовательная передача штамма от человека к человеку и длиннее история циркуляции, тем больше наблюдается транспозиций IS6110 и тем выше степень разнообразия геномов. Исходя из того, что в штаммах семейства AI/LAM выявлено наибольшее разнообразие кодирующих областей генома, связанных с интеграциями транспозона, можно предположить, что представители этого семейства являются эволюционно наиболее древними из трёх проанализированных семейств.Важное преимущество используемого нами экспериментального подхода в отличие от других методов генотипирования состоит в том, что все используемые нами маркёры являются генами, то есть кодируют белковые продукты, которые в конечном итоге формируют фенотип патогена. Получаемые в ходе ID-типирования профили амплификации, отражающие геномную структуру того или иного микроорганизма, связаны с его фенотипическими чертами, включающими такое важное свойство, как вирулентность. Это открывает широкие возможности для функциональной диагностики M. tuberculosis и позволяет изучать эволюционные отношения между штаммами, базируясь не на чисто генетических, но и на функциональных различиях между ними.Таким образом, найденные нами дифференциальные нуклеотидные последовательности могут быть использованы для выделения отдельных ветвей внутри уже известных семейств штаммов, то есть для более детальной диагностики, и изучения эволюционных отношений между ними. Профили амплификации, полученные в результате ID-типирования популяции, позволяют проследить за полиморфизмом отдельно взятых генов, потенциальных факторов вирулентности, а также проводить функциональную кластеризацию популяции, опирающуюся на значимые различия между исследуемыми геномами.161.3. ГЕНОМНОЕ СРАВНЕНИЕ БЛИЗКОРОДСТВЕННЫХ ВИДОВ БАЙКАЛЬСКИХ СИГОВЫХБайкальский озерный сиг (Coregonus lavaretus baicalensis Dybovsky) – глубоководный бентофаг, обитающий в основном на глубинах 30–100 м и нерестящийся в самом озере. Байкальский омуль (C. autumnalis migratorius Georgi) – пелагический планктофаг, обитающий на глубинах до 350–400 м. Долгое время по морфологическим признакам этих рыб относили к разным видам. Проведенные недавно анализ вариабельности мтДНК и изоферментный анализ показали близость байкальского омуля к истинным сигам и, прежде всего, к виду C. lavaretus L. Последующий детальный филогеографический анализ структуры мтДНК палеоарктических и неоарктических сиговых, а также генеалогические реконструкции байкальских сиговых позволили сделать окончательный вывод о принадлежности байкальского омуля к виду C. lavaretus (Sukhanova et al, 2004). Таким образом, байкальский омуль и озерный сиг являются ближайшими родственниками, их дивергенция от общего предка произошла всего 10–20 тыс. лет назад, по-видимому, в связи с освоением разных трофических ниш. Довольно короткий срок дивергенции байкальского омуля и сига в масштабе эволюционного времени позволяет рассчитывать, что сравнение их геномов может выявить генетические факторы, которые в данном случае играют определяющую роль при дивергенции популяций. Целью нашей работы являлось проведение поиска элементов генома (как кодирующих, так и некодирующих), различных по структуре в геномах омуля и сига.Для проведения геномного сравнения сига и омуля был выбран метод ПДРФ- вычитающей гибридизации. Структура геномов сиговых неизвестна, однако, по аналогии с Danio rerio и Tetraodon, полногеномные последовательности которых определены (http://zfin.org/cgi-bin/webdriver?MIval=aa-ZDB_home.apg, www.genoscope.cns.fr/externe/tetranew), можно ожидать, что в них присутствует большое количество повторяющихся элементов, которые затрудняют как саму вычитающую гибридизацию, так и последующий анализ полученных клонов. Эту проблему можно преодолеть введением предварительной стадии «нормализации» сравниваемых фрагментированных геномов, широко используемой в схемах ВГ кДНК. На этой стадии происходит образование быстро ренатурирующей фракции, обогащенной высокопредставленными последовательностями, в случае геномного сравнения – повторяющимися элементами генома. Далее эта фракция удаляется из последующего сравнения. Тем самым, происходит обогащение трейсера низкопредставленными, в том числе кодирующими последовательностями генома.Помимо стадии нормализации мы также применили методическую идею, используемую в анализе полиморфизма длин рестрикционных фрагментов, полученных с17помощью ВГ. Кроме того, чтобы исключить из рассмотрения гетеродуплексы, образованные гомологичными фрагментами близкой длины (и находящимися после электрофоретического разделения в одном пуле), нами введена модификация, заключающаяся в обработке смеси после вычитающей гибридизации нуклеазой золотистой фасоли.С учетом вышеописанных модификаций нами проведено вычитание пулов геномных фрагментов длиной до 800 п.о. и получена ранжированная библиотека, обогащенная специфическими для сига геномными последовательностями. Клоны библиотеки анализировали методом дифференциальной гибридизации с радиоактивно меченными зондами, приготовленными из продуктов вычитания «сиг–омуль» и «омуль–сиг». Количество дифференциально гибридизующихся клонов составило 85. Для каждого клона была определена нуклеотидная последовательность и проанализирована с использованием доступных баз данных по программе BLASTn (табл. 3). Ни для одного из проанализированных фрагментов не было найдено существенного сходства с известными кодирующими последовательностями. Большинство дифференциально гибридизующихся клонов содержат фрагмент, идентичный на 84–88% внутреннему спейсеру гена 28S pРНК Salvelinus namaycush (клон 26A2, U17965.1).Среди остальных проанализированных клонов библиотеки два содержат вставку мтДНК, для 11 вставок нет существенной гомологии в банке данных, 14 гомологичны различным некодирующим участкам генов иммунной системы: клеточного рецептора (TCR), IgA, MHC, а также зонадгезинподобного гена (zlg), при этом пять различных фрагментов картируются в интронах гена zlg, а семь – перед первым экзоном в 5′-области.Геномные ПЦР с олигонуклеотидными праймерами, сконструированными на основе найденных нуклеотидных последовательностей, показали, что ни одна из проанализированных последовательностей не является сигспецифической. По-видимому, они представляют собой следствие мононуклеотидного полиморфизма в сайте узнавания рестрикционной эндонуклеазой, которая использовалась для фрагментирования сравниваемых геномов, что было подтверждено для некоторых найденных при вычитании фрагментов.Табл. 3. Результаты сравнения геномных фрагментов сига, полученных в результате вычитания,с геномными последовательностями различных организмов..НомерклонаСходство с аннотированными геномными последовательностямиДлина участка клонированного фрагмента, идентичная геномной последовательности, %;(в скобках приведен процент гомологии)Положение в геноме(локализация относительно гена)31, 20O. mykiss, локус IgH.A (AY872257.1)O. mykiss, район гена MHC класса Ia (AB162342.1)100 (88)99 (87)интрон~8 т.п.о. от последнего экзона100, 21S. salar, ген зонадгезинподобного белка (AY785950.1)S. salar, ген CD3 гаммадельта-A (EF421418.1)99 (90)98 (86)~100 т.п.о. до 1-го экзонаинтрон75, 82, 86,84, 08S. salar, ген зонадгезинподобного белка, (AY785950.1)S. salar, клон 249L01, TCR-альфа/дельта локус (EF467299.1)28–97 (76–94)94-99 (76–86)интроныинтроны30, 26, 29, 32, 27S. salar, клон 15J19 TCR-альфа/дельта локус (EF467295.1)S. salar, ген зонадгезинподобного белка, (AY785950.1)62 (88)63 (86)интроныинтроны25O. tshawytscha, ген инсулин-подобного фактора роста I (IGF-I.1), (AY100012.1)S. salar, ген интерферона альфа 1 (IFNA1), (DQ354152.1)90 (90)90 (88)интронинтрон51 клонSalvelinus namaycush, клон 26A2, ген 28S рРНК (U17965.1)23–25 (84–88)внутренний транскрибируемый спейсер,ITS76, 14C. lavaretus, митохондриальная ДНК (AB034824.1)48 (97)митохондриальная ДНК 11 клоновDanio rerio, различные геномные последовательности13–24 (91–98)некодирующие участкиВ полученной библиотеке более половины отобранных дифференциальных фрагментов имеют участки, гомологичные внутренним транскрибируемым спейсерам (ITS) генов 28S pРНК. Действительно, ITS-участки отличаются своей полиморфностью, а межвидовые различия по размеру транскрипционной единицы pРНК обуславливаются различиями в длине спейсерных участков.15% найденных дифференциальных фрагментов обладают высокой степенью сходства с некодирующими участками генов иммунной системы (TCR, MHC, IgA) и зонадгезинподобного гена (zlg). Функция последнего неизвестна, однако на основании того, что он экспрессируется преимущественно в кишечнике рыб и обладает значительной гомологией с генами иммунной системы слизистой кишечника (например, с FCGBP и с геном муцина), можно предполагать его участие в формировании иммунитета рыб. Известно, что генам иммунной системы свойственны частые перестройки и большая вариабельность. В нашем случае все найденные ПДРФ располагаются в некодирующих областях гена. В 5′- и 3′-UTR-областях zlg, занимающих до 90% длины локуса, возможно, расположено множество регуляторных элементов, мутации в которых способны изменять уровень транскрипции гена.Следует отметить одну отличительную особенность найденных нами геномных фрагментов сига, картированных вблизи генов иммунной системы. Почти все они имеют участки (9–37% длины фрагмента), которые на 65–85% сходны с широко распространенными среди рыб Тс1-подобными транспозонами (у лососевых – это 5% генома). С одной стороны, известно, что у рыб эти мобильные элементы нередко экспрессируются, а после встраивания их в геном происходит быстрое накопление мутаций (Krasnov et al, 2005). С другой стороны, существует немало доказательств участия некодирующих РНК-мобильных элементов в регуляции экспрессии генов на разных уровнях. Известно, что экспрессия Тс1-подобных мобильных элементов особенно активируется при внешних стрессовых стимулах. Возможно, что и в случае байкальских сига и омуля транспозонные последовательности играют определенную роль в активности найденных генов иммунной системы. Не исключено, что высокая фенотипическая пластичность сиговых (и вообще рыб) отчасти обеспечивается активностью многочисленных транспозонных копий в их геноме, особенно при активации их в стрессовых условиях окружающей среды, например, при резком похолодании.В целом, полученные нами данные свидетельствуют о малых различиях в геномах сига и омуля. Это может свидетельствовать о том, что, как предполагается в настоящее время, омуль и сиг образуют две субпопуляции одного вида. Дивергенция этих популяций, по-видимому, может идти по пути регуляторной эволюции, то есть сравнительно малых изменений в регуляторных системах организма, которые, тем не менее, обуславливают20значительные различия в уровнях и тканеспецифичности экспрессии генов. Вероятно в рассматриваемом нами случае пары близкородственных сиговых транскрипционная дивергенция, обусловленная однонуклеотидными заменами и короткими делециями/инсерциями в геномной ДНК, между изолированными популяциями возникает быстрее, чем масштабная дивергенция на геномном уровне.2. МЕТОД КЛОНИРОВАНИЯ ИДЕНТИЧНЫХ ПОСЛЕДОВАТЕЛЬНОСТЕЙ — ОТБОР ИЗ СЛОЖНЫХ СМЕСЕЙ ПОСЛЕДОВАТЕЛЬНОСТЕЙ С ЗАДАННЫМИ СВОЙСТВАМИВ основе разработанного нами метода лежит принцип клонирования идентичных последовательностей (Coincidence Cloning, СС), заключающийся в отборе фрагментов с одинаковыми нуклеотидными последовательностями, принадлежащими двум разным образцам. Применявшиеся ранее методы основанные на использовании этого принципа оказались низкоэффективны из-за высокого фона и не получили широкого распространения (Devon and Brookes, 1996). Для решения этой проблемы мы использовали эффект селективной супрессии ПЦР (Selection Suppression of PCR, SSP (Diatchenko et al, 1996)). На рис. 2 представлена общая схема метода.На первом этапе к двум наборам фрагментов ДНК лигируют разные по структуре супрессионные одноцепочечные адаптеры. После денатурации образцов и в процессе их последующей совместной ренатурации совпадающие последовательности способны к образованию гибридных дуплексов, содержащих на 5′-концах два разных адаптера и поэтому экспоненциально амплифицирующихся в ходе дальнейшей ПЦР. Молекулы ДНК, уникальные для одного из исходных наборов, образуют только гомодуплексы, которые имеют на концах одинаковые адаптеры и поэтому в силу эффекта SSP не способны к экспоненциальной амплификации.21СОВМЕСТНАЯ РЕНАТУРАЦИЯЛИГИРОВАНИЕ СУПРЕССИОННЫХ АДАПТЕРОВДЕНАТУРАЦИЯЭКСПОНЕНЦИАЛЬНАЯ АМПЛИФИКАЦИЯОБРАЗЕЦ2ОБРАЗЕЦ 1 ПЦР ДОСТРОЙКА 3’-КОНЦОВСУПРЕССИЯ ПЦРСУПРЕССИЯ ПЦРРис. 2. Схема процедуры клонирования идентичных последовательностей (Coincidence Cloning, СС), основанной на эффекте селективной супрессии полимеразной цепной реакции. Фрагменты, уникальные для каждого из исходных наборов, изображены пунктирными или штрих-пунктирными линиями, общие фрагменты – сплошными линиями. Два типа супрессионных адаптеров показаны в виде черных или белых прямоугольников; последовательности, комплементарные им, обозначены как заштрихованные прямоугольники соответствующего цвета.222.1 МЕТОД COINCIDENCE CLONING (КЛОНИРОВАНИЕ ИДЕНТИЧНЫХ ПОСЛЕДОВАТЕЛЬНОСТЕЙ) ДЛЯ АНАЛИЗА ТКАНЕСПЕЦИФИЧЕСКОГО МЕТИЛИРОВАНИЯ ПРОТЯЖЕННЫХ ГЕНОМНЫХ ЛОКУСОВВ качестве образцов для совместной гибридизации используются геномная ДНК из определенной ткани, фрагментированная с учетом тканеспецифического метилирования, и геномный локус, представленный набором клонированных последовательностей.2.1.1. Картирование неметилированных CpG-сайтовДля картирования неметилированных CpG-сайтов на стадии подготовки образцов к СС проводится рестрикция геномной ДНК метилчувствительной эндонуклеазой (HpaII, сайтыузнавания CCGG). Также использовался «частощепящий» фермент AluI, рестрикция которым позволяет получить набор фрагментов длиной не более 1,5 тыс. п.о. (подобный диапазон длин является оптимальным для проведения последующих процедур ПЦР-амплификации). На рис. 3 представлена общая схема этой модификации метода. Рис. 4. Электрофоретическое разделение продуктов ПЦР, полученных с использованием праймеров, специфичных к HpaII-AluI фрагментам, расположенным в конститутивно неметилированных локусах. Матрицы: «до СС» – смесь AluI – HpaII фрагментов, «после СС» – продукты амплификации после СС. Праймеры специфичные к CpG-островкам в промоторных областях генов COX7A1 (А и В) и CKAP1 (С). После CC 27 30 15 18 21 24 27 30Для контроля эффективности разработанного метода было оценено обогащение некоторых геномных фрагментов, расположенных в неметилированных областях исследуемого локуса (CpG-островки в промоторных областях генов «домашнего хозяйства») COX7A1 (регуляторная субъединица цитохромоксидазы митохондрий) и CKAP1 (цитоскелет ассоциированный белок). Для оценки обогащения выбранных участков, достигаемого в СС, были проведены ПЦР со специфичными праймерами, в качестве матриц использовали набор HpaII-AluI геномных фрагментов и амплификат после СС. Три примера амплификации представлены на рис. 4. Число циклов ПЦР, необходимых для детекции продукта в смеси после СС, на 15 меньше, чем в случае образца до СС. Таким образом, достигнуто обогащение в не менее чем 104 раз, т. е. близкое к максимально возможному.Для картирования найденных неметилированных CpG-сайтов и определения их положения относительно охарактеризованных генов, EST, повторяющихся элементов и CpG-островков использовалась база данных сервера UCSC Human Genome Browser (http://genome.ucsc.edu/cgi-bin/hgGateway). Для статистической обработки информации, полученной после скрининга библиотеки, и для графического изображения паттерна метилирования был применен специальный пакет программ, разработанный Гайнетдиновым И.В.242.1.2. Картирование гиперметилированных последовательностейВ другой модификации метода для отбора геномных последовательностей, обогащенных CpG-метилированными сайтами, используется аффинная хроматография на колонке с иммобилизованным метилсвязывающим белком. На рис. 5 представлена схема этой модификации метода.25черными стрелками для опухолевой ткани.Геномную ДНК гидролизовали эндонуклеазой рестрикции Mse I. Сайт узнавания этого фермента ТТАА встречается в геномной ДНК человека со средней частотой 1 на 100–200 п.о., однако в случае GpG-островков эта частота уменьшается до 1 на 1 000 п.о.Полученный набор Mse I-фрагментов геномной ДНК фракционировали на аффинной колонке для получения фракции, максимально обогащенной метил-CpG-содержащими фрагментами. Для этого в качестве аффинного агента в колонке был использован белок, содержащей метил-CpG-связывающий домен белка MeCP2 крысы (MBD-домен). Работа по созданию «MBD колонки» и фракционированию геномной ДНК была проведена в группе мембранных биоэнергетических систем Р. Дмитриевым под руководством д.х.н. М.И. Шахпаронова.Обе разработанные модификации были применены для исследования метилирования локуса 19-ой хромосомы человека FXYD5 –COX7A1 длиной 1,02 млн п.о. для образцов семиномы и нормальной паренхимы яичка, полученных от одного пациента.На рис. 6 представлено графическое распределение плотности неметилированных сайтов CCGG и картирование гиперметилированных последовательностей в локусе FXYD5 – COX7A1 19-ой хромосомы для образцов ДНК нормальной и опухолевой тканей яичка, полученные описанными выше двумя модификациями метода. Как видно, в ДНК обеих тканей неметилированные сайты неравномерно распределены по всему локусу и группируются в определенных местах, т.е. наблюдается их кластеризация. Найденные26гиперметилированные последовательности находятся в областях с низкой плотностью неметилированных сайтов.2.2. RAPID IDENTIFICATION OF GENOMIC SPLITS (RIDGES) – МЕТОД БЫСТРОГО КАРТИРОВАНИЯ САЙТОВ РАСЩЕПЛЕНИЯ ГЕНОМАДля получения подробных тканеспецифических карт распределения неметилированных сайтов для протяженных локусов необходим значительный объем секвенирования. Нами разработан метод, позволяющий минимизировать затраты на секвенирование и картирование большого количества сайтов расщепления генома (в нашем случае – неметилированных CG в составе рестриктных сайтов). Для этого используются эндонуклеазы рестрикции IIS-типа, вносящие разрыв в ДНК на некотором отдалении от сайта узнавания. Искусственное введение последовательности узнавания такой эндонуклеазы около картируемого сайта геномного расщепления осуществляется посредством лигирования нуклеотидного адаптера (рис. 7).Последующая обработка полноразмерных фрагментов этой эндонуклеазой приводит к образованию тагов. Эти короткие участки являются репрезентативными, поскольку получены однотипно, а их нуклеотидная последовательность является достаточной для однозначного картирования. Длина их определяется выбором используемого фермента IIS типа, и в нашем случае была использована эндонуклеаза MmeI, вносящая разрыв через 21 п.о. от своего сайта узнавания.Конкатамеризация тагов и последующее секвенирование полученных конкатамерных молекул позволяет получить информацию о сайтах расщепления генома при существенно меньших материальных и временных затратах на секвенированиеПолученная в результате проведения СС смесь представляла из себя набор AluI-HpaII рестриктных фрагментов, фланкированных с двух сторон адаптерами А (фланкирующий сайт AluI) и Б (фланкирующий сайт HpaII) (рис. 8, структура I). Для введения последовательности узнавания эндонуклеазы IIS-типа в непосредственной близи от исследуемого сайта HpaII полученные фрагменты гидролизовали эндонуклеазой HpaII (рис. 8, 1), затем смесь делили на две части и к образованному «липкому» концу лигировали адаптеры ВД и ГД (рис. 8, 2; адаптеры содержат общую (Д) 5′-последовательность, а также сайт MmeI на 3′-конце). Для удобства дальнейшей работы проводили амплификацию продукта лигирования (рис. 8, структура II) с праймерами, идентичными последовательностям лигированных адаптеров (рис. 8, 3). После обработки амплификата эндонуклеазой MmeI (рис. 8, 4) образовавшиеся 60-ти звенные нуклеотидные фрагменты (рис. 8, структура III) изолировали с помощью ПААГ-электрофореза (рис. 8, 5), а затем смешивали друг с другом и проводили лигирование (рис. 8, 6). При этом образовывались27Рис. 7. Схематическое изображение принципиальных стадий конкатамеризациифрагменты (рис. 8, IV), содержащие лигированные «хвост к хвосту» таги и различающиеся на концах адаптерные последовательности.Эти фрагменты амплифицировали в два этапа: сначала с праймерами, идентичными внешней части адаптеров Д, а затем внутренней В и Г (рис. 8, 7). Стадия образования димеров (рис. 8, структура IV) вводится для последующего выявления артефактов ПЦР- селекции: поскольку вероятность образования двух идентичных димеров в силу статистических закономерностей чрезвычайно низка, то появление их объясняется именно этим эффектом, по этой причине повторяющиеся последовательности удаляются из последующего анализа. Для избавления от адаптерных последовательностей амплификат гидролизовали эндонуклеазой HpaII. Целевые таги длиной 21 п.о. выделяли в28полиакриламидном геле в виде димеров (рис. 8, V), после чего для образования конкатамеров (рис. 8, VI) полученные димеры лигировали друг с другом (рис. 8, 9).Для последующего клонирования к образовавшимся конкатамерам лигировали адаптер, лигазную смесь амплифицировали с праймером, идентичным адаптеру. Для удобства последующего секвенирования клонов в дальнейший анализ отбирали фракцию конкатамеров длиной не более 600 п.о. Эту фракцию конкатамерных молекул лигировали в вектор и клонировали.Рис. 8 . Схема метода RIDGES. ДНК обозначена горизонтальными линиями и стрелками. Сайты узнавания рестрикционных эндонуклеаз – вертикальными линиями, адаптерные последовательности А, Б, В, Г, Д — прямоугольниками. 1–9 – стадии эксперимента,I–VI – промежуточные продукты.29В результате определения нуклеотидной последовательности клонированных конкатамеров полностью подтвердилась их структура – 21-нуклеотидные таги, перемежающиеся CCGG — сайтом узнавания эндонуклеазы HpaII (структура VI на рис 8).2.3. КОМПЬЮТЕРНАЯ АВТОМАТИЗАЦИЯ ОБРАБОТКИ ПОЛУЧАЕМЫХ РЕЗУЛЬТАТОВ И ИХ КАРТИРОВАНИЯ (совместно с Гайнетдиновым И.В.)Обработка результатов секвенирования конкатамеров и дальнейшее картирование неметилированных сайтов HpaII вручную является крайне трудоемким. По этой причине было создано компьютерное программное обеспечение, автоматизирующее обработку результатов эксперимента. Основные этапы обработки результатов представлены на рис. 9.2.3.1. Извлечение набора тагов из конкатамеровФормирование списка всех 21-нуклеотидных тагов, полученных в результате секвенирования конкатамеров, производится в результате следующих пошаговых операций:- поиск димеров в нуклеотидной последовательности конкатамеров с учетом максимальной и минимальной длины: димеры, образующиеся из тагов, могут иметь не только каноническую длину, но и большую, как результат ошибок при лигировании и ПЦР;- удаление из полученного списка совпадающих по нуклеотидной последовательности димеров (появление их в результатах крайне маловероятно в силу статистической закономерности образования димеров и объясняется ПЦР-селекцией);- выделение из димеров отдельных тагов, а также их одинаковая ориентация относительно разграничивающего сайта (для наглядности и удобства последующей обработки);2.3.2. Создание базы данных всех присутствующих в исследуемом локусе 21-нуклеотидных тагов, фланкирующих сайты HpaIIПолучаемый в конечном итоге набор коротких 21-нуклеотидных тагов необходимо однозначно картировать по длине исследуемого участка генома. Для этого требуется предварительно создать базу всех возможных имеющихся в локусе репрезентативных фрагментов, что осуществляется следующим образом:- поиск в последовательности исследуемого отрезка генома всех картируемых сайтов (5′-CCGG-3′, содержащиеся в AluI-HpaII; параметр можно изменять в зависимости от используемой метилчувствительной эндонуклеазы);- вычленение 21-звенных тагов, фланкирующих картируемый CCGG с обеих сторон;- исключение из конечной базы 21-звенных тагов, которые нельзя однозначно картировать. Как правило, это таги, расположенные в повторяющихся элементах генома.Был проведен предварительный статистический расчет картируемости 21- звенных тагов, содержащих сайт эндонуклеазы HpaII , в локусе D19S208-COX7A1. Согласно30полученным результатам около 12% всех присутствующих в локусе CCGG-сайтов невозможно картировать из-за вырожденности содержащих их тагов. Эта сравнительно небольшая фракция принадлежит, в основном, не функционально значимым, а высокоповторяющимся элементам генома, главным образом, SINE, то есть особого интереса для исследователей не представляет.Сохраненные в текстовом файле формата FASTA результаты содержат набор полученных последовательностей. В заголовке каждой из них указан порядковый номер картируемого сайта и его относительная координата по длине исследуемого локуса генома.2.3.3. Картирование полученных экспериментально тагов по базе данных тагов исследуемого локусаПоиск в построенной общей базе тагов исследуемого локуса тех тагов, которые содержатся в результатах реального эксперимента, производится путем сравнивания этих баз данных с помощью алгоритма BLAST, что позволяет получить относительные координаты всех картированных в эксперименте сайтов по длине исследуемого локуса генома.Конечный результат (список) сохраняется в обычном текстовом файле с суммированными данными (с указанием общего количества точных и неточных совпадений).2.3.4. Визуализация результатов картированияФинальным этапом любого метода является функциональный анализ полученных в ходе эксперимента результатов. В силу очевидно большого объема последних эта стадия представляется довольно сложной без выработки определенных подходов к ее решению.Одним из таких подходов является графическая визуализация местоположения каждого картированного неметилированного сайта относительно кодирующих и регуляторных последовательностей, а также различных повторяющихся элементов исследуемого геномного локуса. За основу для реализации данной задачи был использован Геномный Браузер (UCSC Genome Browser, сервер Университета Санта-Круз, США, http://genome.ucsc.edu/). Для интеграции в удобный графический интерфейс Геномного Браузера данных о картированных неметилированных сайтах HpaII подготавливается файл специального формата. Кроме непосредственного отображения всех картированных сайтов имеется также возможность указания степени повторяемости каждого из них в результатах эксперимента.2.3.5. Нормализация и последующая визуализация нормализованных результатовКак уже было указано выше, новый экспериментальный подход дает в качестве результата набор неметилированных сайтов исследуемого локуса. Однако распределение CpG-динуклеотидов в составе CCGG-сайта в геноме неравномерно и отсутствие экспериментально найденных сайтов в каких-либо участках генома может отражать всего31лишь отсутствие возможности картировать сайты в этих участках. Таким образом, для правильной интерпретации результатов необходимо нормализовать их перед отображением.Одним из способов нормализации является подсчет отношения количества сайтов, картированных в результате эксперимента, к общему количеству всех сайтов, которые можно картировать с помощью RIDGES. Подсчет этого отношения ведется внутри отрезков, содержащих равное количество последних, и отображается в соответствующем масштабе. В данном случае при отображении масштаб физической карты и получаемой карты нормализованной плотности метилированности совпадать не будут. Однако для удобства интерпретации результатов приводятся в соответствие: с помощью соединяющих их линий обозначаются общие границы отрезков, внутри которых проводится подсчет нормализованной степени метилированности. Степень метилированности каждого отрезка изображается в виде столбца соответствующей высоты.Таким образом, для обработки и визуализации получаемых результатов был создан комплексный программный продукт с простым интерфейсом, осуществляющий все необходимые операции.Рис. 9 Схема компьютерной обработки данных, полученных в результате секвенирования конкатамеров322.4 АНАЛИЗ РАСПРЕДЕЛЕНИЯ МЕТИЛИРОВАНИЯ ЛОКУСА FXYD5 – COX7A1 (Chr 19) В НОРМАЛЬНОЙ И ОПУХОЛЕВОЙ ТКАНЯХ ЛЕГКОГО И КЛЕТОЧНОЙ ЛИНИИ А549 (КАРЦИНОМА ЛЕГКОГО)Разработанный нами метод был использован при исследовании метилирования локуса 19-ой хромосомы FXYD5–COX7A1 для ДНК нормальной и опухолевой тканей легкого пациента с диагнозом плоскоклеточный рак легкого III стадии и ДНК клеточной линии А549 (карцинома легкого). Для всех трех образцов анализировалось распределение неметилированных сайтов CCGG. Для ДНК нормальной ткани легкого в исследуемом локусе было картировано 429 неметилированных сайтов, для ДНК опухолевой ткани легкого – 352 и для ДНК клеточной линии А549 –165. На основании повторяемости клонов в клонотеках неметилированных фрагментов был сделан вывод о том, что такое количество найденных сайтов является достаточным для достоверного описания метилирования данного локуса в трех тканях. На рис. 10 показано распределение найденных неметилированных CCGG- сайтов, картированных с использованием геномного браузера UCSC Human Genome Browser (http://genome.ucsc.edu/cgi-bin/hgGateway).Также для анализа использовался метод графического представления результатов, учитывающий неравномерность распределения CpG-сайтов в геноме – гистограмма плотности неметилированных сайтов CCGG относительно распределения всех сайтов ССGG (рис. 11). Анализ карт распределения неметилированных сайтов и их гистограмм показывает схожесть распределения метилирования для нормальной и опухолевой тканей легкого. Во всех трех случаях наблюдается ярко выраженная кластеризация неметилированных сайтов. Несмотря на существующее мнение о тенденции гипометилирования кодирующих последовательностей генов (Antequera, 2003), полученные результаты демонстрируют, что в ДНК обеих тканей гипометилированные области находятся как в богатых генами участках, так и в обедненных (например, участок локуса с условными координатами 0,3 – 0,35, рис. 11). С другой стороны, выявлено гиперметилирование генбогатых участков (участок 0,67 – 0,7). Возможным объяснением этого явления может быть существование еще неизвестных генов или же регуляторных cis-элементов, контролирующих удаленные гены.Сравнение полученных результатов демонстрирует схожесть распределения метилирования для нормальной и опухолевой тканей легкого, в то время как распределение метилирования в клеточной линии А549 отличается от исследованных тканей.Рис. 10 Распределение неметилированных сайтов в локусе FXYD5–COX7A1 в ДНК образцов нормальной и опухолевой тканей (плоскоклеточный рак легкого) и клеточной линии А549. На выноске приведен участок локуса с аномальным метилированием в клеточной линии А549.Самое существенное отличие линии А549 – наличие трех расположенных рядом участков, каждый из которых имеет длину около 30 тыс п.о. (см. выноску на рис. 10). Два района, ограниченные генами USF2–MAG и FFAR3–FFAR2, являются гиперметилированными и фланкируют гипометилированный участок, ограниченный генами CD22–FFAR1. Подтверждение разницы в уровне метилирования между двумя районами USF2–MAG и CD22–FFAR1 было сделано с применением гибридизации по Саузерну. Гиперметилированность участка USF2–MAG была также подтверждена результатами бисульфитного секвенирования некоторых фрагментов данного участка локуса*.2.5. ИССЛЕДОВАНИЕ ВЗАИМОСВЯЗИ ТРАНСКРИПЦИИ, СТРУКТУРЫ ХРОМАТИНА И МЕТИЛИРОВАНИЯ ПРОМОТОРНОЙ ОБЛАСТИ ГЕНОВ MAG И HAMP В КЛЕТОЧНОЙ ЛИНИИ А549При анализе распределения неметилированных CpG сайтов в 1Mb локуса 19-ой хромосомы FXYD5 –COX7A1 в клеточной линии А549 (карцинома легкого) было найдено аномальное гиперметилирование протяженного, около 30 тыс. п.о., генсодержащего участка. В этом участке находятся гены MAG и HAMP, для которых известно, что их экспрессия высоко тканеспецифична. В исследованных нами тканях (нормальная и опухолевая ткани легких) и клеточной линии А549 уровень метилирования локуса MAG-HAMP различен, в тканях этот участок существенно менее метилирован, чем в клеточной линии. При этом* Результаты гибридизации и секвенирования приведены в диссертации35транскрипция во всех трех образцах практически не детектируется, то есть отсутствует корреляция между транскрипцией этих генов и статусом метилирования локуса, в котором они расположены. Более того, уменьшение уровня метилирования при выращивании клеточной линии в присутствии 5-азадезоксицитидина (5-Aza-dC) не приводит к какому-либо существенному увеличению уровня транскрипции (рис. 12).Известно, что в ряде случаев понижение уровня метилирования оказывается непосредственным или опосредованным фактором в активации транскрипции генов. Но, с другой стороны, полногеномный анализ влияния деметилирующих агентов и эффекта инактивации метилтрансфераз показывает, что они оказывают различное действие на разные группы генов, активируя часть из них и не изменяя или даже понижая транскрипцию других (Gius et al., 2004). Одна из гипотез объясняет этот двойственный эффект деметилирования зависимостью изменения активности генов от региональных особенностей структуры локализованного рядом с ними хроматина. Известны случаи, когда неметилированные молчащие гены активировались под действием ингибитора деацетилаз гистонов трихлорстатина А (TSA) (Hitchins et al, 2007).Анализ состояния хроматина, проведенный для участков 5′-области генов MAG и HAMP, показал, что только дополнительное к деметилированию ДНК ингибирование деацетилирования гистонов приводит к ощутимому повышению активного состояния хроматина и транскрипционной активности этих генов (рис. 12). Однако, уровень транскрипции, достигаемый в линии, обработанной 5-Aza-dC и TSA одновременно, различается для MAG и HAMP почти в 3 раза, при том что уровень ацетилирования гистона H3К9 примерно одинаков. Ранее в гене MAG были картированы 2 сайта связывания транскрипционного фактора CTCF (Vetchinova et al, 2006), один из которых расположен в первом интроне гена, а второй – в третьем интроне, непосредственно перед CpG-островком. Известно, что метилирование блокирует связывание CTCF с ДНК (Mukhopadhyay et al, 2004), поэтому можно предположить, что в случае MAG (в отличие от HAMP) снятие метилирования приводит к связыванию CTCF со своими сайтами, расположенными в гене MAG, и последующей репрессии транскрипции. Подобный механизм подавления транскрипции был описан, например, для гена hTERT (Renaud et al, 2007).36B AРис. 12. А) Анализ уровня транскрипции генов MAG, HAMP методом ОТ-ПЦР в режиме реального времени. В) Анализ уровня ацетилирования H3K9, ассоциированного с генами MAG, HAMP методом иммунопреципитации хроматина и ПЦР в режиме реального времени.Представленные результаты получены в трех независимых экспериментах. Данные представлены для 4-образцов клеточной линии А549: 1) выращенного в стандартных условиях (контрольный образец), 2) в присутствии 5-Aza-dC , 3) в присутствии TSA и 4) при совместном действии 5-Aza-dC и TSAГликопротеин, ассоциированный с миелином, кодируемый геном MAG, – чрезвычайно специализированный белок, экспрессирующийся преимущественно в нервных тканях. Известно, что по мере дифференцировки и созревания олигодендритов крысы происходит повышение уровня транскрипции, которое сопровождается постепенным деметилированием CpG-сайтов промоторной области (Grubinska et al, 1994; Laszkiewicz et al,371997). CpG-сайты, расположенные в самом гене, сохраняют свой уровень метилирования. Таким образом, наши данные в сочетании с этими могут указывать на то, что активная экспрессия гена MAG происходит при деметилировании промоторной области и сохранении метилирования CpG-сайтов, расположенных внутри гена.2.5.АНАЛИЗ БАКТЕРИАЛЬНОГО ТРАНСКРИПТОМА ВНУТРИКЛЕТОЧНЫХ ПАТОГЕНОВIN VIVOАнализ специфической экспрессии генов патогенов (микроорганизмов и простейших) в инфицированном организме представляет собой широко распространенную задачу как в исследовательских лабораториях, где он нацелен на получение данных о взаимодействиях организма и патогена, так и, в перспективе, в клинике, где сведения о качественном и количественном содержании различных РНК патогена могут служить средством диагностики и прогноза течения болезни. Однако анализ транскриптома патогенной бактерии в непосредственной инфекционной среде – пораженной ткани существующими методами затруднен из-за сложностей, связанных с выделением бактериальной РНК, ее чрезвычайно малого количества и проблемы отделения бактериальной РНК от подавляющего количества тотальной РНК хозяина, в то время как изучение генной экспрессии бактерий при их выращивании в жидкой среде и имитации реальных условий инфекции не отражает реальной картины, возникающей при развитии болезни.Мы применили разработанный нами метод Coincidence Cloning для извлечения кДНК бактериального патогена из смеси с кДНК мыши. В качестве модели была использована модель инфекции мышей линии A/Sn штаммом M. tuberculosis H37Rv на 9-ой неделе заражения, то есть модель хронической фазы микобактериальной инфекции (предоставлена А.С. Аптом, ЦНИИ Туберкулеза РАМН). В качестве двух образцов ДНК (рис. 2) использовали суммарную кДНК, синтезированную на основе тотальной РНК, выделенной из ткани легкого инфицированной мыши и геномную ДНК M. tuberculosis H37Rv. Оба образца ДНК были предварительно гидролизованы частощепящей рестриктазой RsaI. К двум наборам RsaI фрагментов лигировали супрессионные одноцепочечные адаптеры.Полученные наборы фрагментов геномной ДНК и кДНК смешивали в равном весовом соотношении. Поскольку, по разным оценкам, содержание РНК M. tuberculosis в тотальной РНК, выделяемой из пораженного легкого, составляет менее 0,2% (Banaie et al, 2006), молярное соотношение микобактериальной геномной и кДНК в смеси составляет не менее 100 : 1. Такое избыточное количество геномной ДНК позволяет сохранить различную представленность микобактериальных транскриптов.38В результате проведения двух раундов селективной ПЦР был получен ампликон, обогащенный фрагментами бактериальной кДНК. Высокая степень обогащения клонированного ампликона подтверждена результатами сиквенса выборки из 70 клонов: лишь 24% вставок обнаружили (фрагментарную) гомологию с мышиными транскриптами, а 76% вставок оказались идентичны по нуклеотидным последовательностям различным участкам генома M. tuberculosis H37Rv. Наличие разнотипных супрессионных адаптеров на противоположных концах вставок всех микобактериальных клонов свидетельствует о транскрибируемости найденных последовательностей M. tuberculosis в зараженных мышиных клетках.Сравнительную оценку содержания различных типов транскриптов в исходном образце кДНК и в результирующем СС ампликоне провели для 16 генов M. tuberculosis методом полуколичественного ПЦР-анализа кДНК. Анализ выявил три группы транскриптов: слабо транскрибируемые гены (6 из 16) не детектируются в исходном образце, но достоверно представлены (28-39 цикл ПЦР) в ампликоне; умеренно- (5 генов, детектируемых на 35-36 циклах ПЦР для образца кДНК и 8-20 циклах для ампликона) и средне- (5 генов, детектируемых на 39-40 и 22-28 циклах соответственно) транскрибируемые гены приблизительно сохраняют соотношение представленности в обоих сравниваемых образцах. Таким образом, продемонстрировано, что процедура СС в целом сохраняет не только качественный, но и количественный профиль транскриптома, кроме того, чувствительность метода позволяет анализировать даже самые низкопредставленные- транскрипты (на примерах транскриптов, не детектируемых в образце кДНК).Масштабный анализ полученного ампликона проводился проведено методом параллельного пиросеквинирования с использованием геномного анализатора GS FLX (Roche) в Центре Биоинженерии РАН†. Нуклеотидные последовательности были определены в 98 692 независимых реакциях. 75 436 последовательностей (76,4 %) имели гомологию с последовательностью генома M. tuberculosis. Таким образом, в результате СС произошло обогащение бактериальной кДНК более чем в 1 000 раз.2.5.1. Анализ транскриптов M. tuberculosis, транскрибирующихся в мышиной легочной тканиВ результате секвенирования получена информация о транскрипции 536 генов, что составляет около 14% от общего количества белоккодирующих генов (Приложение к диссертации). Такое небольшое количество транскрибирующихся генов можно объяснить недостаточным объемом секвенирования, что приводит к потере информации о† Список транскрибирующихся генов с указанием количества транскриптов приведен в Приложении к диссертации39низкопредставленных транскриптах, однако, возможно, таким образом, проявляется факт общего уменьшения количества транскрибирующихся последовательностей при хронизации инфекции. Согласно (Talaat et al, 2007) и (Sohaskey, 2008) в хронической фазе туберкулеза происходит снижение общего уровня синтеза белка и РНК.Из-за высокой степени идентичности нуклеотидной последовательности генов транспозаз не удалось провести однозначное отнесение фрагментов кДНК к генам этой функциональной категории (insertion sequences and phages), которую не учитывали в дальнейшем анализе транскриптома.Гены, для которых были найдены кДНК, были отнесены к основным биохимическим категориям согласно (http://genolist.pasteur.fr/TubercuList), и определена доля транскрибирующихся генов в каждой категории. Для большинства категорий доля транскрибирующихся генов не отличается достоверно от среднего по геному (табл. 4). Исключение составляет категория генов липидного метаболизма.Табл. 4. Аннотация транскрибирующихся генов к биохимическим категориям.Категория(http://genolist.pasteur.fr/TubercuList)Всего геновэкспрессируется%0virulence, detoxification, adaptation1111614,41lipid metabolism2264921,72information pathways2232611,73cell wall and cell processes69810515,06PE/PPE1311712,97intermediary metabolism and respiration86913115,18Unknown2422912,09regulatory proteins1842312,510conserved hypotheticals101813813,516conserved hypotheticals with an orthologue in M. bovis3226,2TOTAL3734536 ‡14,3При анализе генов M. tuberculosis, транскрибирующихся в легких инфицированной мыши, наибольший интерес вызывают следующие группы:Гены липидного метаболизма. Существенно увеличено количество генов, вовлеченных в липидный метаболизм (экспрессируются 49 из 226 генов), при этом экспрессируются как компоненты каскадов биосинтеза жирных кислот (например 9 из 34 генов семейства fadD, кодирующих ацил-КоА-синтетазы), так и их деградации (10 из 33 генов fadЕ, кодирующих‡ Без учета категории «insertion sequences and phages»40ацил-КоА-дегидрогеназы). Очень высок уровень экспрессии генов семейства pps, кодирующих ферменты синтеза фтиоцерола, необходимого для синтеза основного компонента клеточной стенки микобактерии – димикоцерозатов фтиоцерола (PDIMs). Из 5 генов семейства ppsA-E экспрессируются 3, причем ppsC и ppsD с очень высоким уровнем экспрессии.Среди генов семейства mmaA1-4, кодирующих синтетазы метоксимиколовой кислоты (methoxy mycolic acid synthase), экспрессируются 3 гена из 4.В геноме M. tuberculosis выделяется кластер генов поликетидсинтаз, pks1-17, белковые продукты которого также вовлечены в процесс синтеза фтиоцерола или фенилфтиоцерола, хотя их точная функция не установлена. В нашем эксперименте получены данные об экспрессии 6 из 16 генов этого семейства.Чрезвычайное значение для функционирования микобактерий имеют белки, ассоциированные с поликетидсинтазами (polyketide synthase associated proteins, гены papA1-5), продукты которых являются ацилтрансферазами. Предполагается, что они могут осуществлять этерификацию трегалозы или её производных. В геноме эти гены существуют в виде нескольких функциональных оперонов, содержащих также гены семейства pks и семейства мембранных белков mmpL. Нами показана экспрессия 3 генов из 5, входящих в это семейство.Гены метаболизма дыхательных путей Несмотря на то, что резкого увеличения количества транскрибирующихся генов этой категории не отмечено, наблюдается перераспределение транскрипции генов, соответствующих переходу микобактерии с аэробного дыхания на анаэробный. (Gennaro et al, 2005). Отмечается экспрессия генов, входящих в narGHIJ operon, кодирующий нитрат-редуктазы (экспрессируются гены narH, narI, narJ ), а также narX и narK3, кодирующие переносчики нитратов. Для такого сдвига в дыхании бактерии, находящейся в хронической фазе инфекционного процесса, характерно снижение активности ATФ-синтезирующего аппарата, что проявляется в снижении транскрипции генов, находящихся в кластере atpA-H, транскрибируется только ген aptD.Гены информационных путей (вовлеченные в репликацию, репарацию и транскрипцию ДНК)Транскрипция генов, кодирующих рибосомальные белки, и вовлеченных в биосинтез ДНК, немного понижена по сравнению со средним значением, что может указывать на замедление репликации бактериальных клеток. По-видимому, этот факт отражает свойства хронической стадии инфекционного процесса, связанной с ослаблением бактериального роста. Такой факт отмечают ряд авторов, например, при сравнении транскрипции генов этой категории в дендритных клетках по сравнению с in vitro (Tailleux et al, 2008).41Таким образом, в целом, проанализированный бактериальный транскриптом действительно качественно и количественно соответствует хронической фазе инфекционного процесса и адаптации M tuberculosis к иммунной системе хозяина.3. ИСПОЛЬЗОВАНИЕ ОЛИГОНУКЛЕОТИДОВ С ПОВЫШЕННЫМ СРОДСТВОМ К КОМПЛЕМЕНТАРНОЙ МАТРИЦЕ КАК ЗОНДОВ В МОЛЕКУЛЯРНОЙ БИОЛОГИИПринципиальной основой использования олигонуклеотидов как зондов в молекулярной биологии является образование стабильного дуплекса с комплементарной последовательностью ДНК. Возможность варьирования, то есть увеличения или уменьшения стабильности таких дуплексов позволяет существенно увеличить их потенциал в исследованиях структуры и функций генетического материала.Существует много возможностей модифицировать углеродно-фосфатный остов, фосфатные группы или гетероциклические основания. В нашей работе использован опыт синтеза олигонуклеотидов с модифицированными гетероциклическими основаниями, полученный в группе проф. В.К. Потапова.Нами исследованы олигонуклеотиды, содержащие 5-метилцизозин (me5C) и 2-аминоаденин (am2A) вместо цитозина и аденина соответственно. Известно, что стабильность пары диаминопурин-тимидин увеличивается за счет появления дополнительной водородной связи (Cheong et al,1988), а пары 5-метилцитозин-гуанин – за счет гидрофобных взаимодействий метильной группы в большой бороздке спирали ДНК (Hoheinsel et al, 1990), при этом происходит увеличение температуры плавления комплементарного дуплекса примерно на 1ºС на модифицированное звено в обеих случаях (рис. 13).Нами было впервые осуществлена характеристика таких олигонуклеотидов (Strongly Binding Oligonucleotides, SBO) с точки зрения их сродства к комплементарной ДНК матрице в матричном синтезе. При этом было показано, что:а) модифицированные олигонуклеотиды более эффективно праймируют матричный синтез ДНК по сравнению с немодифицированными олигонуклеотидами той же структуры, при этом сохраняется специфичность синтеза.б) определена минимальная длина олигонуклеотида, способного эффективно праймировать синтез. Чтобы ответить на этот вопрос, мы провели измерение эффективности синтеза ДНК, праймированного модифицированными и немодифицированными пента-и гексамерами. Анализ включения ά[P32]-dATP во вновь синтезированную цепь продемонстрировал, что пентамеры, как нормальной структуры, так SBO, не эффективны в качестве праймеров, гексамеры продемонстрировали достаточно хорошую эффективность затравки, однако, SBO42более эффективны, даже при повышенных температурах (данные приведены в тексте диссертации)А3.1. Комбинации SBO в качестве объединенных праймеров для секвенированияПолученные результаты позволили нам пользовать SBO как компоненты длинного праймера в упорядоченном секвенировании primer walking (рис. 14). В 1992 г. группой W. Studier’a было продемонстрировано, что вместо длинного 15-17-ти звенного олигонуклеотида можно использовать комбинацию трех 6-ти звенных составляющих его олигонуклеотидов. Праймирование подобным «составным» праймером происходит в присутствии белка SSB, специфически связывающего одноцепочечные ДНК. Стэкинг-взаимодействия концевых звеньев коротких олигонуклеотидов, прилегающих друг к другу, приводят к повышенной стабильности образуемых ими дуплексов. Нами показано, что использование SBO в качестве коротких модулей составного праймера приводит к существенному увеличению эффективности праймирования в случае гексамеров и даже праймированию комбинацией пентамеров, что невозможно при использовании немодифицированных олигонуклеотидов (рис. 15)Рис. 13 Модифицированные гетероциклические основания5-метилцитозин (А),2-аминоаденин (Б) и их взаимодействие с комплементарной матрицейБ43Рис. 14. Primer walking (А) и стратегия составных праймеров (В)Рис. 15. Определение первичной структуры ДНК бактериофага М13 с помощью комбинированного праймера, состоящего из немодифицированных (1+2+3) и модифицированных (1м+2м+3м) пентамеров. Модифицированные основания выделены подчеркиванием.5’- GTAAAACGACGGCCAGT1 CCAGT1м CCAGT2 GACGG2м GACGG3 AAAAC3м AAAACss- одноцепочечная матрица; ds – двуцепочечная матрицаДанный подход был успешно применен для определения первичной структуры областей 19-й хромосомы человека, содержащих длинные концевые повторы (LTR) в рамках проекта «Геном Человека».443.2. Использование модифицированных олигонуклеотидов в ПЦРНами были исследованы преимущества SBO в ПЦР-амплификации, а именно:а) влияние температуры отжига на ПЦР (рис. 16). Использование SBO позволяет проводить амплификацию при более высоких температурах отжига. Как немодифицированные, так и SBO праймеры были эффективны при температуре отжига 57ºС (данные не приведены), однако, только SBO были эффективны при температурах 65ºС и выше. Полученные результаты демонстрируют преимущество SBO в условиях амплификации матриц со сложной вторичной структурой, требующих повышенных температур амплификации.Рис. 16. Зависимость эффективности ПЦР амплификации от температуры отжига при использовании немодифицированных (N) и модифицированных (М) олигонуклеотидных праймеров. Олигонуклеотиды M13dir (GTAAAACGGCCAGT) и M13rev (CAGGAAAACAGCTATGAC) были использованы для амплификации вставок длиной 1.1. kb и 2.5.kb при различных температурах отжига.б) SBO позволяет преодолевать эффект супрессии ПЦР на матрицах со вторичной структурой (рис. 17). Известно, что такие структуры подавляют амплификацию с обычных олигонуклеотидных праймеров независимо от температуры отжига (Lukyanov,1996). Мы использовали две ДНК-матрицы, различающиеся длиной и структурой центральных участков, и для обоих случаев было показано, что модифицированные олигонуклеотиды способны вытеснять немодифицированную цепь из дуплекса, тем самым обеспечивая амплификацию.5’GTAAAACGACGGCCAGT a 528 bp5’GTAAAACGACGGCCAGTTTTTTTTTTTTTNNNNAAAAAAAAAAAAACTGGCCGTCGTTTTAC 3’3’CATTTTGCTGCCGGTCAAAAAAAAAAAAANNNNTTTTTTTTTTTTTGACCGGCAGCAAAATG 5’b 312 bpTGACCGGCAGCAAAATG5’Melting, annealing5’GTAAAACGACGGCCAGT 5’GTAAAACGACGGCCAGTTTTTTTTTTTTT3’CATTTTGCTGCCGGTCAAAAAAAAAAAAANNNN“Frying pan”structure528 bp312 bp20 cycles 25 cyclesNa NbMa MbNa NbMa Mb5’MbРис. 17. ПЦР амплификация фрагментов ДНК, образующих вторичную структуру в месте посадки праймера. А – структура ДНК Б – Разделение продуктов ПЦР в агарозном геле после 20 (слева) и 25(справа) циклов амплификации. N и M – результаты, полученные для немодифицированных и модифицированных праймеров, соответственно.Эти свойства SBO могут быть использованы в случаях, если ограничено количество нуклеотидного материала; чрезвычайно желательно уменьшение количества циклов ПЦР, в частности для уменьшения накопления артефактов, связанных с ПЦР-селекцией, а также в тех случаях, когда сайт посадки праймера для ПЦР находится в области со стабильной вторичной структурой.3.3. Использование модифицированных олигонуклеотидов в случайно праймированной полимеразной цепной реакции (RAPD)Случайно праймированная ПЦР нашла широкое применение для молекулярной дактилоскопии геномов различных уровней сложности (Williams et al, 1990; Akopyants et al, 1992). Использование максимально коротких олигонуклеотидных праймеров дает возможность увеличивать информативность получаемой картины случайного праймирования за счет большей частоты встречаемости коротких последовательностей в геноме. Однако уменьшение длины праймера должно приводить к уменьшению его46эффективности, что может быть компенсировано увеличением прочности связывания праймера с матрицей путем введения в него модифицированных звеньев.Для сравнения эффективности нормальных и модифицированных праймеров в условиях RAPD нами был использован 10-тизвенный праймер в модифицированном и нормальном вариантах (рис.18 ). RAPD проводили на различных бактериальных геномныхРис. 18. RAPD с использованием немодифицированного (ACGGTACACT) или модифицированного (ACGGTACACT) праймеров. а, б – температура отжига 37ºС; – 50ºС. Дорожки: 1 – маркер длин. В качестве матриц использованы бактериальные геномные ДНК дорожки 2, 3 – S. typhimurium, 4, 5 – E. coli K802, 6, 7- H. pylori NTCT11638. Образцы 2, 4, 6 получены с помощью немодифицированного праймера, образцы 3, 5, 7 – с помощью его модифицированного аналога.ДНК в качестве матрицы и разных температурах отжига (рис.18). При сравнительно низкой температуре отжига (рис 18, а) видно, что оба праймера дают полосы амплификации. При повышении температуры отжига праймера (рис. 18, б) только модифицированные праймеры сохраняют способность к амплификации, при этом увеличивается резкость полос и меняется их распределение. Различные паттерны в случае модифицированных и немодифицированных праймеров могут отражать сложную систему взаимодействий праймеров с матрицей ДНК. Эти взаимодействия могут, в частности, включать конкуренцию праймеров с собственной вторичной структурой одноцепочечных ДНК, в результате которой более прочно932 bp932 bp735735bpbp47связывающиеся праймеры могут взаимодействовать с ДНК в областях существующих внутримолекулярных шпилек. Этот результат показывает принципиальную возможность использования модифицированных праймеров в RAPD.ВЫВОДЫ1. Для проведения полногеномного сравнения близкородственных бактериальных штаммов разработан оптимизированный метод ПДРФ-вычитающей гибридизации. Эффективность метода продемонстрирована на примере сравнения геномов штаммов M. tuberculosis HN878 и CDC1551, вызывающих различные клинические формы заболевания туберкулезом. Идентифицировано и охарактеризовано 9 нуклеотидных последовательностей, отличающих геном штамма HN878 от генома штамма CDC1551. Проведено сравнение геномов четырёх российских клинических штаммов M. tuberculosis с геномом штамма H37Rv. Идентифицировано и охарактеризовано 12 нуклеотидных последовательностей, отличающих геномы российских штаммов от секвенированного генома штамма H37Rv.2. Предложен способ генотипирования штаммов M. tuberculosis методом геномной ПЦР 12 локусов (ID-типирование). Эффективность и надежность метода показана на коллекции из 172 штаммов M. tuberculosis, циркулирующих в центральных регионах Российской Федерации. Обнаружен новый характеристический геномный локус, присутствующий только в геномах штаммов M. tuberculosis семейства W/Beijing. Концепция ID-типирования носит универсальный характер и может использоваться как стандартный подход при проведении эпидемиологических исследований и анализа популяций любых бактериальных патогенов.3. Методом ПДРФ-вычитающей гибридизации впервые полногеномном уровне исследованы различия близкородственных представителей байкальских сиговых рыб– озерного сига (C. lavaretus baicalensis Dybovsky) и омуля (C. autumnalis migratorius Georgi). Показано, что данным методом не обнаруживаются устойчивые межвидовые различия. Все найденные нуклеотидные последовательности соответствуют полиморфным некодирующим участкам геномов, варьирующим в результате однонуклеотидных замен и коротких делеций. Многие из них картируются вблизи генов иммунной системы и имеют участки, идентичные широко распространенным среди рыб Тс1-подобным транспозонам, транскрипционная активность которых может влиять на экспрессию близлежащих генов. Отсутствие устойчивых различий48между геномами этих сиговых свидетельствует об их высокой близости, возможно связанной с их недавней эволюционной дивергенцией.4. Разработана концепция анализа паттернов метилирования протяженных областей геномов. Концепция предполагает возможность влияния на экспрессию генов метилирования протяженных участков генома, включающих эти гены, а не только метилирования их регуляторных участков. Усовершенствован метод клонирования последовательностей, идентичных в двух сравниваемых геномах или транскриптомах, на его основе разработан новый метод анализа распределения тканеспецифического метилирования на протяженных участках геномной ДНК. Предложен принципиально новый методический подход к экспресс-картированию сайтов расщепления протяженных фрагментов генома (на примере картирования сайтов расщепления метилчувствительной эндонуклеазой рестрикции HpaII).5. Впервые проведен подробный анализ распределения метилирования в локусе FXYD5– COX7A1 19-ой хромосомы человека длиной 1,02 млн. п.о. для различных образцов геномной ДНК (паренхимы и семиномы яичка, нормальной и опухолевой тканей легкого, клеточной линии A549). Показано, что различия между паттернами метилирования локуса FXYD5– COX7A1 в исследованных нормальных и опухолевых тканях минимальны. Показано, что для клеточной линии А549 характерно гиперметилирование протяженной, содержащей гены, области длиной 30 тыс. п.о., не обнаруженное в других исследованных тканях. Сравнительный анализ транскрипционной активности генов MAG и HAMP, содержащихся в данной области, в разных тканях продемонстрировал ее независимость от метилирования ДНК. Полученные данные ставят под вопрос универсальность принятой точки зрения о роли метилирования в регуляции генов.6. Разработан метод получения кДНК, представляющей полный транскриптом бактериального патогена, из пораженной ткани организма хозяина. Применение метода позволяет получать новые данные о механизмах патогенеза инфекционного заболевания и изменении регуляции экспрессии геномов патогенов при инфекции организмов Эффективность метода продемонстрирована на примере получения кДНК M. tuberculosis из легочной ткани инфицированных мышей. Проведен анализ последовательностей, транскрибирующихся в легочной ткани мыши на 9-ой неделе развития инфекции. Показано, что для исследованных генов наблюдается качественное и количественное соответствие паттерна экспрессии паттерну, наблюдаемому при хронической фазе туберкулеза.497. Предложены новые способы применения модифицированных олигонуклеотидов, содержащих 5-метилцизозин и 2-аминоаденин, и обладающих повышенным сродством к комплементарной матрице, в качестве праймеров для секвенирования и ПЦР. Продемонстрирована их повышенная эффективность праймирования при сохранении специфичности гибридизации. Разработан метод определения первичной структуры с использованием набора коротких модифицированных олигонуклеотидов в качестве праймера. Разработан вариант молекулярной дактилоскопии, RAPD, с использованием таких олигонуклеотидов.Список литературыОбзоры:1.Гайнетдинов, И. В., Ажикина, Т.Л., Свердлов Е.Д. (2007). Короткие репрезентативные последовательности в геномных исследованиях. Биохимия 72(11): 1179–86.2.Ажикина, Т.Л., Свердлов, Е.Д. (2005). Изучение тканеспецифического CpG метилирования ДНК в протяженных геномных локусах. Биохимия 70(5): 596–603.3.Ажикина, Т.Л., Монастырская, Г.С., Свердлов, Е.Д. (2004). Полногеномные несеквенирующие анализы патогенов – неотъемлемый компонент мероприятий биобезопасности. Молекулярная медицина 3: 33–404.Sverdlov, E. and Azhikina Т. (2005). Primer Walking. Encyclopedia of Life Sciences: DOI: 10.1038/npg.els.00053825.Azhikina, T. (2000). Sequencing Strategies and Tactics in DNA and RNA Analysis. Encyclopedia of Analytical Chemistry. R. A. Meyers. Chichester, John Wiley&Sons Ltd.6.Potapov, V., T. Azhikina, Demin, V.V., Limborskaja, S.A. and Sverdlov E.D. (1996). Modified oligonucleotides as a tool for DNA sequencing, fingerprinting and mapping. Pure&Appl Chem 68 (6): 1315–1320.Статьи:7.Быченко, О.С., Суханова, Л.В., Уколова, С.С., Скворцов, Т.А., Потапов, В.К., Ажикина, Т.Л., Свердлов, Е.Д. (2009) Геномная близость байкальского омуля и сига. Биоорганическая Химия, 35, 95–102.8.Gvozdevskiy, N.A., Azhikina, T.L., Botvinnik, A.O., Evsyukova, I.Y., Shemyakin, I.G. and Sverdlov, E.D. (2006) New approach aimed at investigation of genomic polymorphism of the Russian M. tuberculosis population. FEBS Journal, 273, 2709.Гвоздевский, Н.А., Ажикина, Т.Л., Свердлов, Е.Д. (2006) Делеционно-инсерционные различия геномов высоковирулентного штамма HN878 Mycobacterium tuberculosis и менее вирулентного штамма CDC1551. Журнал Микробиологии Эпидемиологии и Иммунологии, 1, 10–1510.Azhikina, T., Gvozdevsky, N., Botvinnik, A., Fushan, A., Shemyakin, I., Stepanshina, V., Lipin, M., Barry, C., 3rd and Sverdlov, E. (2006) A genome-wide sequence-independent comparative analysis of insertion-deletion polymorphisms in multiple Mycobacterium tuberculosis strains. Res Microbiol, 157, 282–290.11.Azhikina, T., Gainetdinov, I., Skvortsova, Y. and Sverdlov, E. (2006) Methylation-free site patterns along a 1-Mb locus on Chr19 in cancerous and normal cells are similar. A new fast50approach for analyzing unmethylated CCGG sites distribution. Mol Genet Genomics, 275, 615–622.12.Azhikina, T., Gainetdinov, I., Skvortsova, Y., Batrak, A., Dmitrieva, N. and Sverdlov, E. (2004) Non-methylated Genomic Sites Coincidence Cloning (NGSCC): an approach to large scale analysis of hypomethylated CpG patterns at predetermined genomic loci. Mol Genet Genomics, 271, 22–32.13.Kurdyukov, S.G., Lebedev, Y.B., Artamonova, II, Gorodentseva, T.N., Batrak, A.V., Mamedov, I.Z., Azhikina, T.L., Legchilina, S.P., Efimenko, I.G., Gardiner, K. and Sverdlov, E.D. (2001) Full-sized HERV-K (HML-2) human endogenous retroviral LTR sequences on human chromosome 21: map locations and evolutionary history. Gene, 273, 51–61.14.Kostina, M., Azhikina, T., Gorodentseva, T., Berg, D. and Sverdlov, E. (2000) Contiguous strings of strongly binding short oligonucleotides as a useful tool for completing sequencing experiments. DNA Seq, 10, 355–364.15.Kurdjukov, S., Azhikina, T., Lebedev, Y., Gardiner, K. and Sverdlov, E. (1999) Mapping of endogenous retroviral LTRs on Chr21-concentration of the regulatory elements within the gene-enriched 21q22 region. Cytogenet Cell Genet, 86, 17.16.Чернов, И.П., Поляков, А.С., Акопов, С.Б., Николаев, Л.Г., Ажикина, Т.Л., Костина, М.Б., Свердлов, Е.Д. (1999) Идентификация и картирование на хромосоме 19 человека хромосомспецифического повторяющегося элемента, предпочтительно связывающегося с ядерным матриксом. Биоорганическая Химия, 25, 242–247.17.Хиль, П.П., Костина, М.Б., Ажикина, Т.Л., Колесник, Т.Б., Лебедев, Ю.Б., Свердлов, Е.Д. (1997) Структурные характеристики четырех длинных концевых повторов (LTR) эндогенных человеческих ретровирусов и особенности участков их интеграции. Биоорганическая Химия 23, 434–440.18.Lebedev, Y., Akopyants, N., Azhikina, T., Shevchenko, Y., Potapov, V., Stecenko, D., Berg, D. and Sverdlov, E. (1996) Oligonucleotides containing 2-aminoadenine and 5-methylcytosine are more effective as primers for PCR amplification than their nonmodified counterparts. Genet Anal, 13, 15–21.19.Azhikina, T., Kostina, M., Skaptsova, N., Potapov, V., Berg, D. and Sverdlov, E. (1996) Factors affecting the priming efficiency of short contiguous oligonucleotide strings in the primer walking strategy of DNA sequencing. DNA Seq, 6, 211–216.20.Azhikina, T., Veselovskaya, S., Myasnikov, V., Potapov, V., Ermolayeva, O. and Sverdlov, E. (1993) Strings of contiguous modified pentanucleotides with increased DNA-binding affinity can be used for DNA sequencing by primer walking. Proc Natl Acad Sci USA, 90, 11460–11462.21.Ажикина, Т.Л., Шевченко, Ю.О., Лебедев, Ю.Б., Веселовская, С.В., Мясников, В.А., Потапов, В.К., Свердлов, Е.Д.(1993) Олигонуклеотиды, образующие высокостабильные дуплексы, их использование в качестве праймеров при секвенировании и в полимеразной цепной реакции. Докл Акад Наук 330, 642–645.22.Ажикина, Т.Л., Потапов, В.К., Веселовская, С.В., Мясников, В.А., Свердлов, Е.Д.(1993) Комбинации коротких олигонуклеотидов с повышенной прочностью образования дуплексов в качестве объединенных праймеров в секвенировании. Докл Акад Наук, 331, 751–753.Работа выполнена при финансовой поддержке российской программы «Геном человека», программы Президиума РАН «Молекулярная и клеточная биология», программы «Ведущие научные школы РФ», Российского Фонда Фундаментальных Исследований, программы INTAS, программы МНТЦ, гранта HHMI.

Комментариев пока нет.

Добавить комментарий


About Беркегейм Михаил

Я родился 23 ноября 1945 года в Москве. Учился в школе 612. до 8 класса. Мама учитель химии. Папа инженер. Я очень увлекался химией и радиоэлектроникой. Из химии меня очень увлекала пиротехника. После взрыва нескольких помоек , я уже был на учете в детской комнате милиции. У меня была кличка Миша – химик. Из за этого после 8 класса дед отвел меня в 19 мед училище. Где меня не знали. Мой отчим был известный врач гинеколог. В 1968 году я поступил на вечерний факультет медицинского института. Мой отчим определил мою профессию. Но увлечение электроникой не прошло, и я получил вторую специальность по электронике. Когда я стал работать врачом гинекологом в медицинском центре «Брак и Семья» в 1980 году, я понял., что важнейшим моментом в лечении бесплодия является совмещение по времени секса и овуляции. Мне было известно, что овуляция может быть в любое время и несколько раз в месяц. И самое главное, что часто бывают все признаки овуляции. Но ее не происходит. Это называется псевдоовуляция. Меня посетила идея создать прибор надежно определяющий овуляцию. На это ушло около 20 лет. Две мои жены меня не поняли. Я мало времени уделял семье. Третья жена уже терпит 18 лет. В итоге прибор получился. Этот прибор помог вылечить бесплодие у очень многих женщин…