Курсовая работа по биоинформатике


Подборка по базе: Экзаменационные вопросы для студентов лечебного факультетаКонтро, 02.11 Куликова Виктория Сергеевна 412 лечебный факультет (иммуно, Биохимия мышц 2021. ЛЕЧ.ИНОСТРАННЫЙ ФАКУЛЬТЕТ..pdf, Учебное пособие по химии для студентов факультета ВСО.docx, ДОГОВОР-ШАБЛОН НА ПРАКТИКУ (экономический факультет) 22.docx, Перевод с другого факультета (1).pdf, Частное учреждение высшего образования «московская академия пред, ДОГОВОР-ШАБЛОН НА ПРАКТИКУ (экономический факультет) 22.docx, Частное учреждение высшего образования «московская академия пред, Частное учреждение высшего образования «московская академия пред


Федеральное государственное бюджетное образовательное учреждение высшего образования «Волгоградский государственный медицинский университет» Министерства здравоохранения Российской Федерации

Медико-биологический факультет

Кафедра фармакологии

Сравнение первичных аминокислотных последовательностей фермента фосфодиэстеразы 8А (PDE-8A) человека и других животных. Поиск 3D-моделей фермента и сравнение 3D-модели PDE-8A человека с наименее похожим по первичной структуре фермента животным

Выполнила:

студентка 3 курса 1 группы

специальности

«Медицинская биохимия»

Соколова Елена Вячеславовна

Проверил:

Доц. д.б.н. Васильев П.М.

Волгоград, 2016

Оглавление

Биоинформатика 3

Цели и задачи биоинформатики 3

Этапы развития биоинформатики 4

Основные направления биоинформатики 4

Фосфодиэстеразы 5

Фосфодиэстераза 8А 6

Основные программы сравнения аминокислотных и нуклеотидных последовательностей 7

Описание работы 9

1. Поиск в UniProt своего белка для человека и других организмов: 9

2. Скачивали FASTA-формат для каждого организма: 9

3. Попарные сравнения: 10

4. Обработка результатов 13

5. Сравнение пиков липофильности, обеспечивающие связывание белка 14

14

14

6. Поиск 3D-моделей белка и сравнение 3D модели PDE-8A человека с наименее похожей по первичной структуре (крысой). 15

15

15

7. Определение сайтов связывания 18

18

8. Определим доверительный интервал 20

Вывод: 20

Биоинформатика

Биоинформатика (bioinformatics) — быстро развивающаяся отрасль информатики (теории информации), занимающаяся теоретическими вопросами хранения и передачи информации в биологических системах.

Эта наука возникла в 1976-1978 годах, окончательно оформилась в 1980 году со специальным выпуском журнала «NucleicAcidResearch» (NAR).

Цели и задачи биоинформатики

Целью биоинформатики является, как накопление биологических знаний в форме, обеспечивающей их наиболее эффективное использование, так и построение и анализ математических моделей биологических систем и их элементов.

Задачи:

  • Разработка алгоритмов для анализа биологических данных большого объема:
    • Алгоритм поиска генов в геноме;
  • Анализ и интерпретация различных типов биологических данных таких, как нуклеотидные и аминокислотные последовательности, домены белков, структура белков и т.д.:
    • Изучение структуры активного центра белка;
  • Разработка программного обеспечения для управления и быстрого доступа к биологическим данным:
    • Создание банка данных аминокислотных последовательностей. 

Таким образом, основными задачами биоинформатики являются: распознавание белок-кодирующих участков в первичной структуре биополимеров, сравнительный анализ первичных структур биополимеров, расшифровка пространственной структуры биополимеров и их комплексов, пространственное сворачивание белков, моделирование структуры и динамики биомакромолекул, а также создание и сопровождение специализированных баз данных.

Этапы развития биоинформатики

В 1962 году была придумана концепция «молекулярных часов», в 1965 была секвенирована т-РНК, определена ее вторичная структура, в это же время были созданы базы данных PIR для хранения информации об аминокислотных последовательностях. В 1972 году было придумано клонирование. В 1978 году были разработаны методы секвенирования, была создана база данных пространственных структур белков. В 1980 был выпущен спецвыпуск журнала NAR, посвященный биоинформатике, затем были придуманы некоторые алгоритмы выравнивания последовательностей, о которых речь пойдет дальше. Дальше был придуман метод ПЦР (полимеразная цепная реакция), а в биоинформатике — алгоритмы поиска похожих фрагментов последовательностей в базах данных. В 1987 году оформился GeneBank (коллекция нуклеотидных последовательностей) и т.д. 

Основные направления биоинформатики

В зависимости от исследуемых объектов

1) Биоинформатика последовательностей — этот раздел биоинформатики занимается анализом нуклеотидных и белковых последовательностей;

2) Структурнаябиоинформатика — занимается анализом пространственных структур, уже определённых экспериментально;

3) Компьютерная геномика.

С другой стороны биоинформатику можно условно разделить на несколько направлений в зависимости от типа решаемых задач:

  • Применение известных методов анализа для получения новых биологических знаний;
  • Разработка новых методов анализа биологических данных;
  • Разработка новых баз данных.

Наиболее известной и наиболее эффективной областью применения биоинформатики в настоящее время является анализ геномов, тесно связанный с анализом последовательностей.


1 чел. помогло.

скачать
ГЛЮКОЗО-ЗАВИСИМЫЕ ГЕНЫ NEUROSPORA CRASSA

Курсовая работа по биоинформатике

студентки факультета биоинженерии и биоинформатики

МГУ им. М.В. Ломоносова

Сычёвой Лады.

Тьютор: д.б.н. Потапова Татьяна Васильевна

Аннотация

В работе рассмотрены некоторые особенности функционирования прекрасной модели организации многоклеточного организма – гриба Neurospora crassa. N. crassa чутко реагирует на присутствие в окружающей среде глюкозы, т.к. для нее это самый выгодный источник питания. Был проведен информационный поиск и серия экспериментов, ориентированных на выяснение механизмов и функциональной роли усиленного образования вакуолей, когда гриб растет в среде без глюкозы. С помощью банка генов изучаемого объекта были найдены те гены, экспрессия которые непосредственно или каким-либо другим образом зависят от глюкозы. Среди них оказалось много генов, обеспечивающих транспорт различных веществ, функционирование энергетической системы, а также несколько генов, отвечающих за рост и ветвление, из чего и были сделаны определенные выводы. В экспериментах было обнаружено, что в течение 2-5 часов после удаления глюкозы гриб растёт почти так же, как в контрольных условиях. Из литературы, посвящённой питанию N. crassa было выяснено, что в качестве резервных (внутренних) источников углерода могут выступать тригалоза, гликоген и полифосфаты. В ходе решения данной проблемы также была выдвинута гипотеза, что в условиях недостатка источников питания гриб гидролизует хитин собственной клеточной стенки. Важно отметить, что гены, кодирующие хитин-синтазы и хитиназы, оказались в списке глюкозо-зависимых, так же, как гены, кодирующие ферменты, расщепляющие запасные питательные вещества. Т.о. влияние содержания глюкозы в среде на жизнь гриба – сложное комплексное явление, включающее изменения активности многих генов.

Введение

Основная цель данной работы – провести самостоятельное исследование с использованием знаний и навыков, полученных в курсе биоинформатики.

Объект исследования – многоклеточный микроорганизм Neurospora crassa (Lineage: Eukaryota, Fungi, Ascomycota, Pezizomycota, Sordariomycetes, Sordariales, Sordariaceae, Neurospora). Neurospora crassa — центральный организм в истории генетики, биохимии и молекулярной биологии двадцатого столетия. Почему Neurospora занял столь важное место в современной науке, можно объяснить несколькими причинами.

Во-первых, это гриб. С одной стороны, его биология сходна с биологией животных, т.к. он не синтезирует самостоятельно питательные вещества, а потребляет их в готовом виде (он сапротроф). С другой стороны, его биология сходна с биологией растений, т.к. он обладает клеточный стенкой, что является для него жизненно важным, потому что внутриклеточное давление у него очень высоко — до 15-17 атмосфер (Robertson & Rizvi, 1963), и клеточная стенка обеспечивает прочность и целостность его клеток. Из описанных сходств можно заключить, что некоторые важные открытия в биологии данного организма могут пролить свет и на особенности биологии, как животных, так и растений.

Во-вторых, данный организм достаточно удобен для экспериментов, т.к. легко его обеспечить всеми необходимыми питательными веществами, легко хранить его культуры и менее трудно, чем, например, за мышами или плодовыми мушками, за ним наблюдать в ходе эксперимента, потому что он ограниченно подвижен.

В-третьих, N. crassa близок к родам Aspirgillus и Penicill, а эти роды имеют важное значение для промышленности и жизни людей. Они используются в биотехнологии. Некоторые представители рода Aspirgillus – паразиты теплокровных животных, в том числе и человека. А представители рода Penicill, в отличие от первых, играют положительную роль в жизни человека. Открытие пенициллина, впервые полученного лордом Флемингом из этих грибов в 30-е годы XX века, инициировало переворот не только в фармакологии, но и в медицине в целом.

И наконец, в-четвёртых, недавно был завершён проект по расшифровке генома Neurospora crassa (J.E. Galagan et al., 2003).

Основными источниками углерода для N. crassa служат глюкоза, сахароза, мальтоза, фруктоза и манноза (R.H. Davis, 2000). Тригалозы, ксилозы, галактозы, лактозы и рибозы хватает для отличного роста, тогда как другие обыкновенные сахара (арабиноза, маннитол, глицерол, сорбоза) способствуют только медленному росту и накоплению биомассы. 4 транспортных системы моносахаридов были описаны для N. сrassa.

Изначально целью моей работы было выяснить, каким образом взаимосвязаны у N. сrassa образование вакуолей и голодание по глюкозе.

Эта задача была поставлена Т.В. Потаповой (отдел математических методов в биологии НИИФХБ им. А. Н. Белозерского) в рамках исследования механизмов увеличения количества вакуолей в клетках N. crassa после 2 и более часов инкубации гриба в среде без глюкозы, ведущегося совместно с лабораторией проф. Клиффорда Слэймана (Медицинская школа Йельского университета, США).
^
В работе проводился анализ литературных данных: были использованы журнальные публикации, посвящённые рассматриваемому объекту, материалы из электронных библиотек (Medline), а также данные из банков генов, EMBL и банков белковых последовательностей Swiss-Prot, SWALL. Важным источником информации послужил собственный банк генов Neurospora crassa

http://www-genome.wi.mit.edu/annotation/fungi/neurospora. Таким образом, исследование осуществлялось, в основном, информационными методами, т.е. с использованием знаний, полученных на занятиях по биоинформатике: работа с электронными базами данных, поиск гомологов белка и т.д.

Информационный поиск проводился согласованно с ходом экспериментальных исследований, которые параллельно проходили в группе Т.В.Потаповой.

^
Хронология открытий (Rowland H. Davis & David D. Perkins, 2002)

 В 1843 г. пекарни во Франции были заполнены плесенью, которая продуцировала пышные грозди пылящих оранжевых спор – конидий. Эту плесень, известную как Monilia sitophila, в основном, обнаруживали на хлебе и других богатых углеводами пищевых продуктах, а также на осадке, оставшемся после обработки сахарного тростника. Кроме того, этот вид первым обживал остатки сгоревшей растительности. Основное питание рассматриваемого объекта составляют сахара, особенно глюкоза. Они могут запасаться в виде гликогена и полифосфатов внутри клеток гифы гриба (Беккер, 1963).

 Веком раньше открытие половых плодовых тел (перитеций) позволило микологам Cornelius L. Shear и Bernard O. Dodge отнести этот гриб к новому роду Neurospora. Dodge был пионером в использовании его в качестве объекта генетических исследований. Он занимался скрещиванием штаммов. Он же впервые доказал, что инактивированные аскоспоры могут быть активированы температурным воздействием. Dodge выделил два физиологически сопряжённых штамма и показал, что они детерминированы генами, делящимся в отношении 4 : 4.

 Результаты генетических исследований были дополнены открытиями в цитологии, раскрывшими механизмы развития аскоспор. Dudge убедил своего коллегу из Колумбийского университета и исследователя генетики дрозофилы Thomas Hunt Morgan адаптировать Neurospora для генетических исследований.

 В начале XX века Neurospora стала книжным примером, иллюстрирующим сегрегацию и кроссинговер в клетках, претерпевающих мейотическое деление. Позже George Beadle и Edward Tatum использовали Neurospora для получения первых биохимических мутантов.

 В 1945 г. Barbara McClinlock обнаружила семь хромосом, в которые упаковано всё ДНК в ядрах клеток Neurospora, описала мейоз и постмейотический митоз. Кроме того, она обнаружила явление транслокации.

 В середине прошлого столетия были обнаружены гены индивидуальной гетерокариотической несовместимости.

 В 1955 г. Mary Mitchel предъявила первое убедительное доказательство конверсии генов, проанализировав аскоспоры.

 В середине XX века был открыт принцип «один ген – один фермент» (см. /Casselton & Zolan, 2002/).

 В 1964 г. было показано, что гены ‘rcc’ по-разному контролируют рекомбинацию в локальных участках во время мейотического деления.

 Годом позже было описан скоординированный контроль несвязанных генов в процессе биосинтеза, а также открыт механизм перекрёстного контроля синтеза аминокислот.

 В 1965 г. Клиффорд Слэйман с помощью микроэлектродов доказал существование протонных насосов в клеточной мембране. (C. Slayman, 1965)

 В 1972 г. измерили длину периода спороношения в циркадном цикле у изолированных мутантов.

 В конце 70-х гг. были открыты факторы, убивающие споры, которые подавляют управляющие мейозом элементы в диких популяциях дрозофилы и мыши.

 В 1979 г. показано, что 5S РНК-гены разбросаны по геному отдельными копиями.

 В 1982 г. были составлены физические и генетические карты митохондриального генома.

 В 1987 г. было показано, что гены в дуплицированных сегментах ДНК подвергаются мутации в премейотической стадии по механизму индуцированной повторением точечной мутации.

 В 1988 г. было показано, что сопряжённые типы генов представлены одиночными копиями. Например, для генов maiA и maia: они не гомологи, поэтому их следует называть идиоформами, а не аллелями.

 В 1992 г. было установлено, что гены в дуплицированных сегментах ДНК эпигенетически блокируются в вегетативных клетках.

 В 1994 г. было показано, что авторегуляция частоты гена циркадных часов включает в себя негативную обратную связь.

 В 1996 г. было показано, что гены в распаренных сегментах ДНК инактивируются при мейозе.

 В конце 90-х гг. прошлого века с помощью мутантов, у которых почти отсутствовал процесс подавления активности генов в течении вегетативной фазы, было показано, что для этого процесса необходима РНК-зависимая РНК-полимераза.

 Недавно были получены доказательства того, что метилирование ДНК зависит от присутствия функционального гистона H3 метилтрансферазы.

 В 2001 г. было показано, что за блокирование не спаренных генов в стадии мейоза отвечает ген, регулируемый РНК-зависимой РНК-полимеразой.

^ (J.E. Galagan et al., 2003)

Последовательность генома была получена при помощи программы Arachne package, из секвенированных от разных особей кусочков ДНК, последовательно соединённых друг с другом.

В общей сложности 10 082 кодирующих белок гена (9 200 длиннее, чем 100 аминокислот) были предсказаны, что почти в два раза больше, чем у S. pombe (приблизительно 4 800) и S. cerevisiae (приблизительно 6 300), и почти в два раза меньше, чем у D. melanogaster (приблизительно 14 300). Средняя длина гена Neurospora больше, чем в этих организмах, что обусловлено большим числом интронов в генах Neurospora — среднее число 1.7 интронов на ген со средним размером интрона 134 нуклеотидов.

В общей сложности 4 140 (41%) белков Neurospora не имеют сходства с белками других грибов, что вполне может быть объяснено недостаточной изученностью биологии грибов.

Кроме того, 5 805 (57%) белков Neurospora не имеют существенного сходства с генами любого из секвенированных видов дрожжей. По сравнению с секвенированными эукариотами, в общей сложности 1 421 (14%) генов Neurospora показывает значительные сходства BLASTP с белками растений и животных. Из них 584 белка с высоким процентом сходства принадлежат секвенированным видам дрожжей. Эти данные показывают, что биология мицелиальных грибов ближе к биологии высших эукариот, чем к таковой дрожжей.

Neurospora — важная модель для исследования эпигенетических явлений, т.к обладает широким разнообразием эпигенетических механизмов и связанных механизмов защиты генома. Самые замечательные из этих механизмов — индуцированные повторением точечные мутации (RIP); этот процесс уникален, он есть только у грибов.

Впервые RIP был обнаружен у Neurospora. Это процесс, который эффективно обнаруживает и видоизменяет обе копии дуплицированной последовательности путём замены CG на TA. Для того, чтобы копии подверглись этому, нужно, чтобы их длина была не меньше, чем 400 пар оснований и чтобы они обладали 80%-ой идентичностью. ДНК последовательностей, подвергнутых RIP, часто подвергается метилированию.

Присутствие RIP, таким образом, имеет глубокие последствия для развития генома Neurospora, т.к., предполагается, что RIP может предотвращать инновации во время дуплицирования гена.

Гены Neurospora трудно распределить по семействам, т.к. они мало сходны между собой. Neurospora содержит только восемь генов, имеющих пары с большей, чем 80%-ая, идентичностью кодирующих последовательностей. Эта оценка существенна, потому что, как описано выше, RIP видоизменяет дуплицированные последовательности, которые демонстрируют большую, чем приблизительно 80%-ую, нуклеотидную сходность. Таким образом, маленькое количество генов в мультигенных семействах и почти полное отсутствие очень сходных генов может быть обусловлено RIP.

Одно большое суперсемейство представляют собой транспортёры сахаров Neurospora, все они имеют аналоги у S. cerevisiae и у S. pombe. Тем не менее, у Neurospora они менее сходны друг с другом, чем у этих организмов. Скорее всего, это потому, что у S. cerevisiae и у S. pombe схожие последовательности получены дуплицированием, а у Neurospora RIP препятствует этому процессу.

RIP имел мощное воздействие в подавлении создания новых генов или частей генов через дуплицирование ДНК. После дупликации гена каждая копия имеет 80%-ую вероятность приобретения в структуре стоп-кодонов TAA и TAG после только единичного действия RIP.

Эти результаты поднимают критический вопрос того, встречалась ли какая-либо существенная дупликация гена в Neurospora после появления RIP.

Дупликация гена, как думают, играет первостепенную роль в появлении новых генов. Согласно гипотезе, большинство, если не все, гены-паралоги Neurospora были дуплицированы и «сдивергировали» до появления RIP, и, начиная с этого события, эволюция новых генов через дупликацию гена была фактически остановлена. Это заключение поднимает вопрос, способна ли Neurospora эволюционировать с появлением новых генов и как. Тем не менее, наши результаты указывают, что цена повышенной защиты генома Neurospora, осуществляемая RIP, и есть значительное влияние на эволюцию функций новых генов путём дупликации гена.

Единственные большие повторяющиеся последовательности у Neurospora, о которых известно, что они пережили RIP, — это приблизительно 175-200 копий большого тандемного повторения рДНК. Эти тандемные повторения происходят на участке, организующем ядрышко, что, предположительно, и защищает их от RIP. Последовательность рДНК сама по себе не оказывает сопротивления RIP.

Neurospora интенсивно используется как модель для изучения метилирования ДНК у эукариот. Геном Neurospora имеет два потенциальных гена цитозин-ДНК-метилтрансферазы: dim-2, который требуется для обычного метилирования ДНК, и rid, который нужен для RIP и является членом семейства, найденного к настоящему времени только у мицелиальных грибов. У Neurospora, приблизительно 1.5 % цитозинов метилированы. Это подтверждает гипотезу, что почти во всех случаях метилирование ДНК является результатом. RIP.

Из двух штаммов E. coli, отличающихся по устойчивости ДНК к метилированию, были выделены плазмиды, которые затем внедрили в Neurospora. С помощью сравнительного анализа последовательностей были предсказаны участки, где ДНК должно быть подвергнуто метилированию, что и произошло в ходе эксперимента. Метилированные области соответствуют дуплицированным и подвергнувшимся RIP областям. Полностью 85 % соответствуют предсказанным последовательностям, подвергнувшимся RIP. Однако маленькая часть (10 %) соответствует предсказанной неповторяющейся и не подвергнувшейся RIP последовательности. В двух из десяти таких случаев было экспериментально проверено, что эти последовательности неповторяющиеся и подверглись метилированию. Это повышает шансы на то, что метилирование в Neurospora может выполнять не только защитную функцию, как и у более продвинутых организмов.

Контроль экспрессии генов у эукариот может осуществляться не только на уровне ДНК, но и на уровне РНК, когда уже пройдена стадии транскрипции. Предположительно блокирующие РНК механизмы — унаследованные естественные системы защиты, направленные против вторжения нуклеиновых кислот, поэтому они включают в себя схожие компоненты. Neurospora обладает двумя путями блокирования РНК: подавление, которое действует в течение вегетативного роста (в нём задействованы три гена: qde-1, qde-2 и qde-3, кодирующих соответственно РНК-зависимую РНК-полимеразу (RdRP), argonaute и RecQhelicase) и «мейотическое заглушение», которое действует в течение периода половой репродукции (в нём задействован ген sad-1, кодирующий RdRP). Однако есть несколько дополнительных генов, участвующих в блокировании РНК, которые можно разделить на два набора паралогов, функции которых соответствуют первому либо второму из рассмотренных выше путей.

«Мейотическое заглушение» и подавление представляют собой два филогенетически отличных РНК-зависимых механизма, блокирующих РНК. Но оба, возможно, развились из единственного унаследованного блокирующего РНК механизма.

Синий свет — важный регулятор роста и развития Neurospora, поэтому неудивительно, что обнаружено много генов, сходных с чувствительными к синему свету генами. К сожалению, никакая фотобиология красного света не описана пока для Neurospora, что является существенным пробелом, потому что недавно было показано, что это имеет значение для чувствительности к синему свету и сигнальных механизмов.

Среди сигнальных систем особое место занимают двухкомпонентные сигнальные системы, основа которой состоит из гистидинкиназы и сходного с ней регулятора ответа. Девять белков, обеспечивающих функционирование сигнальной системы, гены которых обнаружены в геноме Neurospora, имеют аналоги у S. pombe и S. cerevisiae, что указывает на консервативность основы данного механизма у этих видов. У Neurospora 11 гистидин-киназ, что гораздо больше по сравнению с одной у S.cerevisiae и тремя у S. pombe. Одна треть их подобна белкам Aspergillus fumigatus и A. nidulans, которые влияют на процесс образования конидий (L. A. Alex and M.I. Simon, неопубликованные наблюдения), а другие, возможно, участвуют в реакции на кислород и свет. Это число гистидинкиназ играет большую роль и показывает, что мицелиальные грибы более похожи в этом отношении на растения, обладающие в изобилии двухкомпонентными системами, чем на животных, где эти системы отсутствуют.

Эукариотические клетки чувствительны ко многим раздражителям окружающей среды благодаря семи рецепторам, сопряжённым с G-белком. У Neurospora найдено 10 таких белков, три из которых не имеют аналогов у других грибов, но сходны с цАМФ Dictyostelium discoideum, Polysphodylium pallidum, а также белками Arabidopsis thaliana и Caenorhabditis elegans. Все эти данные склоняют к предположению, что цАМФ или похожая молекула могут служить для передачи внеклеточных сигналов у Neurospora.

Многие данные, прежде всего из фармакологических исследований, указывают, что Ca2+ -сигнальная система регулирует многие процессы у мицелиальных грибов. Однако механизм функционирования этой системы до сих пор до конца не ясен. Тем не менее, обнаружено около 25 генов в геноме Neurospora, играющих роль в этой системе. Важный аспект Ca2+-сигнальной системы в растительных и животных клетках — пополнение запасов Ca2+ из внутренних источников. Это обычно опосредовано вторичными мессенджерами инозитол-1,4,5,-трифосфатом и цАДФ- рибозой, или индуцированным Ca2+ пополнением запасов Ca2+.

Настоящие гифы, продуцируемые мицелиальными грибами, — трубчатые структуры, состоящие из клеточных компартаментов, которые обычно разделяются септальной перегородкой, имеющей септальную пору, которая обеспечивает прямую диффузионную и электрическую связь между соседними компартаментами (Чайлахян и др., 1984). Псевдогифы, продуцируемые дрожжами, состоят из цепей одноядерных удлиненных клеток без видимой непрерывности цитоплазмы. Молекулярные механизмы, лежащие в основе этих двух способов роста, изучены недостаточно.

Две сигнальных системы, которые регулируют псевдогифальный рост в ^ – модули двухкомпонентных сигнальных систем и цАМФ — являются консервативными в геноме Neurospora. У Candida albicans обе системы требуются для образования истинных гиф и предположительно выполняют ту же функцию и у Neurospora. Однако три фактора транскрипции, регулирующие образование псовдогиф– Tec1p, Flo8p и Sfl1p, не были обнаружены у Neurospora. Но Neurospora обладает геном, подобным фактору транскрипции, необходимому для гифального роста C. albicans. Этот фактор транскрипции не требуется для псевдогифального роста C. albicans, так же, как и соответствующий белок у S. cerevisiae (Phd1p). Требуется более детальное исследование сложных систем, лежащих в основе этих способов роста. Тем не менее, эти данные частично разъясняют различия и сходства сигнальных систем и регуляторных компонентов гифального и псевдогифального роста.

Макроконидии — неполовые споры, характерные для мицелиальных грибов, но отсутствующие у дрожжей. Компоненты системы макроконидий были обнаружены, как у Neurospora, так и у мицелиального гриба A. nidulans, но гены, участвующие в этой сисетеме, очень различны у этих организмов, из чего можно заключить, что молекулярные механизмы, лежащие в основе образования макроконидий у Neurospora значительно отличаются от этих механизмов у A. nidulans.

Царство грибов производит обширное множество биологически активных веществ, называемых вторичными метаболитами, среди них более всего известны пигменты, антибиотики и микотоксины. За исключением синтеза пигментов каротиноидов и меланина, было показано, что Neurospora не обладает вторичным метаболизмом. Таким образом, удивительно, что в последовательности генома Neurospora обнаружено множество предполагаемых генов для производства вторичных метаболитов.

Три предсказанных гена не рибосомальных пептид-синтаз (Non-Ribosomal Peptide Synthetase) и один родственный им ген были обнаружены в последовательности генома Neurospora. Согласно филогенетическому анализу, один ген не рибосомальной пептид-синтазы – ортолог не рибосомальной пептид-синтазы Aureobasidium pullulans. Функция этих генов неизвестна. Например, у Ustilago maydis такой ген отвечает за производство hydroxamate siderophores. А у Cochliobolus heterostrophus, C. victoriae и Gibberella zeae похожий ген имеет 66%-ую идентичность аминокислот в образующимся белке с продуктом гена CPS1, который отвечает за вирулентность.

Семь генов поликетидсинтаз были обнаружены в геноме Neurospora, они могут быть классифицированы в три группы на основе доменной области. При сравнении обнаруженные сходные гены в других организмах позволяют предположить, что первая группа генов отвечает за синтез меланина, а вторая и третья – ловастатина.

Присутствие генов, необходимых для синтеза гибереллиновой кислоты, у Neurospora указывает на то, что многие компоненты, необходимые для производства гибереллиновой кислоты, имелись у предков Neurospora и G. fujikuroi. Найденные гены вторичного метаболизма могут играть роль в морфогенезе и хемотропизме, межвидовой коммуникации и возможно даже в противохимической защите. Обнаружение этих генов в геноме Neurospora указывает на то, что очевидные главные различия в образе жизни среди родственных грибов, типах патогенности, могут сформироваться частично из-за незначительных модификаций функций и экспрессии генов.

Последовательность генома включает в себя довольно большое количество генов, необходимых для растительного патогенеза, имеющихся у грибов-патогенов. Эти гены не имеют у других организмов никаких других функций кроме патогенеза. Neurospora также обладает широким диапазоном внеклеточных ферментов, способных к перевариванию полимеров растительной клеточной стенки, хотя нет очевидного гомолога кутиназы. Кутин — один из главных слоев, защищающих эпидерму листьев растений, и многие, но не все, растительные патогены используют кутиназу. Neurospora имеет широкий диапазон ферментов цитохрома P450, которые являются важными в некоторых системах «патоген – хозяин» для детоксификации противогрибковых веществ, выделяемых растением. Кроме того, большое количество идентифицированной ABC (ATP-binding cassette) и системы утечки препарата MFS могло играть роль в борьбе с ядовитыми веществами растения. Есть способность вырабатывать членов вторичного метаболизма семейств PKS, NRPS и терпеноидов, как описано выше. Кроме того, Neurospora содержит все компоненты трансдукции сигнала, вовлеченные в патогенез аскомицетов, которые были описаны до настоящего момента. Таким образом, хотя Neurospora, как известно, не является патогеном, последовательность генома показала много генов, схожих с теми, что необходимы для патогенеза.
^
На сайте www-genome.wi.mit.edu/annotation/fungi/neurospora был найден список генов N. crassa, экспрессия которых тем или иным образом зависит от присутствия глюкозы в окружающей среде. После удаления тех генов, функции которых определялись словами “hypothetical protein” или “predicted protein”, из списка, содержащего более 800 генов, осталось 389 генов. Поскольку отправной точкой исследования было объяснение механизма усиления образования вакуолей при голодании по глюкозе, в первую очередь из этих 389 генов были отобраны те, что связаны с вакуолями (Табл. 1). Эти гены кодируют белки комплекса, с помощью которого синтезируется АТФ. Это неудивительно, если учесть, что основная функция вакуолей – запасать определённые вещества против градиента их концентрации в цитоплазме, — происходит с затратами энергии АТФ.

Таблица 1. Гены N. crassa, кодирующие вакуолярные белки.

^

Ген Neurospora

Длина гена Neurospora

Hit length

Счёт BlastP

(AF330696) Протеолипидная субъединица вакуолярной АТФазы

976

161

214

(NCU01332.1) Протеолипидная субъединица вакуолярной АТФ-синтазы (16 кДЖ)

581

146

224

^

(NCU02273.1) Предшественник вакуолярной протеазы

1323

391

480

(NCU03395.1) Вакуолярная АТФ-синтаза

1287

341

395

(NCU03463.1) Субъединица вакуолярной АТФ-синтазы (98 кДЖ)

2872

807

781

^

(NCU04192.1) Предшественник, родственный вакуолярной аминопептидазе yscl

1762

457

358

(NCU04387.1) Субъединица F вакуолярной АТФ-синтазы

592

116

145

(NCU07446.1) Субъединица E вакуолярной АТФ-синтазы

860

229

187

(NCU08515.1) Субъединица B вакуолярной АТФ-синтазы

1841

502

832

Кроме того, из конечного списка были выбраны те гены, которые отвечали за рост и ветвление. Оказалось, что среди глюкозозависимых генов их не так уж и много (Табл.2).

Таблица 2. Гены, отвечающие за рост и ветвление.

Ген Neurospora Длина гена Neurospora Hit length Счёт BlastP
(NCU03515.1) возможно контролирующий деление клетки белок 10 1130 317 395
(NCU05429.1) возможный фермент ветвления 2626 666 906
(NCU06454.1)

гомолог контролирующего деление клетки белка 42

993 187 303
(NCU09778.1) контролирующий деление клетки белок 2 1153 291 432

Вообще, гриб старается расти всегда, даже когда это сопряжено с такими трудностями, как недостаток строительного материала из-за нехватки питательных веществ. Сильнее всегда растёт главная гифа (ее называют лидирующей), а боковые ветви растут медленнее. Если посчитать соотношение суммы длин выросших за определённые промежуток времени гиф к числу этих гиф, то оно будет равным 350 мк (Robertson & Rizvi, 1968), эта величина называется гифальной единицей роста. Видимо, это соотношение – результат решения организмом какой-то сложной задачи, если оно соблюдается в большинстве случаев.

В безглюкозной среде гриб вынужден потреблять запасённые питательные вещества – гликоген, трегалозу, полифосфаты и даже, возможно, собственную хитиновую стенку. С помощью SRS в банке SWALL были найдены данные о ферментах, которые расщепляют гликоген, трегалозу и хитин (Табл. 3,4,5).

Таблица 3. Ферменты, расщепляющие гликоген, – гидролазы.

AC белка Название белка
P15937 Белок утилизации ацетата (EC 3.1.2.1)
Q9C2G8 Предполагаемая гидролаза гидроксиацилглютат-ионов
Q8X0D8 Родственный аминоацил-тРНК гидролазе белок
Q8X052 Родственный диаденозингексофосфатгидролазе белок
Q9HE24 Родственный сопряжённой с 26S протеосомой карбоксил- терминирующей гидролазе белок
CAD70903 Родственный эпоксид-гидролазе белок
CAD79687 Родственный карбоксил-терминирующей гидролазе белок

Таблица 4. Ферменты, расщепляющие трегалозу, — трегалазы.

AC белка Название белка
O42783 Нейтральная трегалаза (EC 3.2.1.28)
Q8NIK6 Нейтральная трегалаза

В росте Neurospora, кроме достаточного питания, большую роль играет и «родительская поддержка». Имеется в виду то, что для растущего кончика гифы является важным транспорт органелл и различных необходимых для роста и развития веществ, поступающих из более старых клеток мицелия.

Оказалось, что вдоль гифы существует градиент количества вакуолей (Robertson & Rizvi, 1963). В 1-5 верхушечных (только что образованных) клетках гифы вакуолей нет вообще, в следующих 6-30 клетках присутствует только 1 вакуоль, прижатая к апикальной септе, и в следующих 30-100 клетках наблюдаются множественные вакуоли, увеличение количества которых и наблюдала Т.В. Потапова в лаборатории проф. Клиффорда Слэймана (Йельский университет, США).

В наших экспериментах оказалось, что в первые 2 часа инкубации без глюкозы характер роста почти не меняется. Мы обратили внимание на тот факт, что после 4-5 часов инкубации без глюкозы наблюдается важное морфологическое изменение: гифы становятся морщинистыми. Мы предположили, что эта «морщинистость» обусловлена тем, что истончается хитиновая стенка, и, видимо, уже не справляется с выполнением такой задачи, как обеспечение прочности клетки с высоким внутренним тургорным давлением. (При нормальном питании гифы гриба вытянуты и как бы напряжены).

В то же время, поскольку верхушечный рост в условиях голодания N. crassa продолжается, это значит, что на верхушке гифы постоянно образуется новая хитиновая стенка.А в более старой части гифы стенка как будто истончается. Возможно, это говорит о том, что пока на кончике гифы хитин синтезируется, в основании он гидролизуется.

Таким образом, возникает ещё один интересный вопрос: какие гены активируются во время голодания по глюкозе, кодирующие хитин-синтазу (или хитин-синтазы), когда образуется хитиновая стенка растущей гифы? Интересно также, расщепляет ли гриб клеточную стенку в «старых» клетках гифы. В табл. 5,6 представлены данные о соответствующих ферментах.

Таблица 5. Ферменты, расщепляющие хитин, — хитиназы.

AC белка Название белка
Q9P3F4 Родственный предшественнику хитиназе 3 белок
CAD70866 Родственный хитиназе белок

Таблица 6. Ферменты, синтезирующие хитин, — хитинсинтазы.

SWISSPROT:CHS1_NEUCR Chitin synthase 1 (EC 2.4.1.16) (Chitin-UDP acetyl-glucosaminyl transferase 1).
SWISSPROT:CHS2_NEUCR Chitin synthase 2 (EC 2.4.1.16) (Chitin-UDP acetyl-glucosaminyl transferase 2).
SWISSPROT:CHS3_NEUCR Chitin synthase 3 (EC 2.4.1.16) (Chitin-UDP acetyl-glucosaminyl transferase 3). (Class-III chitin synthase 3).
SWISSPROT:CHS4_NEUCR Chitin synthase 4 (EC 2.4.1.16) (Chitin-UDP acetyl-glucosaminyl transferase 4). (Class-IV chitin synthase 4).

Хитин-синтазы классифицируются на три различных класса (Bowen, 1992). Данная классификация – результат сравнения генов, кодирующих хитин-синтазы CHS1 и CHS2, которые принадлежат дрожжам Saccharomyces cerevisiae, и CHS1 — белок Candida ablicans. Candida ablicans – близкородственный организм Neurospora crassa. В этих генах были обнаружены консервативные участки, которые позволили установить гомологию хитин-синтаз у ещё 14 видов грибов. Эти фрагменты были секвенированы, и полученные последовательности — выравнены. Последовательности за исключением CHS1 (S. cerevisiae) распались на три различных класса, которые отражают три отдельных функциональных группы. В пределах каждого класса был представлен филогенетический анализ. Этот анализ подтвердил таксономические группы, существующие в настоящее время.

Таблица 7. Глюкозозависимые гены, кодирующиефермент, участвующий в расщеплении глюкозы – гидролазу, и фермент, участвующий в синтезе полимера N-ацетилглюкозамина – хитина.

Neurospora gene Saccharomyces gene Neurospora gene length Hit length BlastP score % ID
(NCU01517.1) glucoamylase precursor (glucan 1,2-alpha-glucosidase) (1,4-alpha-d-glucan glucohydrolase) YIL099W SGA1 intracellular glucoamylase 1943 415 189 34%
(NCU04251.1) chitin synthase 3 (chs-3) [MIPS] YNL192W CHS1 chitin synthase 1 2783 741 711 48%

Как видно из таблицы, совсем немного генов, кодирующих гликозозависимые белки, являются глюкозозависимыми сами. Из этого можно заключить, что активность остальных ферментов – остальных гидролаз, трегалаз, хитиназ и других хитин-синтаз может меняться, когда сами ферменты уже синтезированы. Активность же глюкоамилазы и хитин-синтазы 3 может варьироваться не только после окончания синтеза фермента, но и на уровне генов, т.е. присутствие глюкозы в среде регулирует экспрессию этих генов. Примечательно, что аналогичная хитин синтазе 3 Neurospora crassa хитин-синтаза S. cerevisiae относится не к 3-ему, а к 1-ому типу.

В процессе экспериментальной работы в группе Т.В. Потаповой и изучения литературы выяснились новые факты, которые усложнили задачу.

Были проведены эксперименты, когда в отличающихся по содержанию глюкозы условиях среды выращивались примерно одинаковые по количеству клеток фрагменты гифальных верхушек, отделённых от родительского мицелия. Образец, растущий в условиях достатка глюкозы, в первый момент после отделения сохраняет высокую скорость роста и ветвления, но примерно через 40 мин. она уменьшается и становится примерно равной той, которой обладает «безглюкозный» образец. В среде без глюкозы рост останавливается сразу после отделения от мицелия, но примерно через 40 минут оба фрагмента растут примерно с одинаковой скоростью. Непонятно, почему лишённый основного источника питания образец с течением времени мобилизует силы для роста и ветвления.

Кроме того, некоторые исследователи наблюдали и отразили это в своих работах, что ток цитоплазмы вместе с питательными веществами, везикулами и органеллами к кончику гифы, осуществляется не только в данном направлении, но и назад. Можно предположить, что данный факт может интерпретироваться как аналог гуморальной регуляции у человека. Таким образом клетки гифы могут «общаться» друг с другом, в смысле, ток цитоплазмы может содержать биохимические маркеры, которые влияют на основные процессы в клетке. Однако это всего лишь гипотеза, которая пока не получила ни одного подтверждения.

Заключение

Таким образом, исследование, осуществлённое с использованием знаний, полученных в течение года в курсе биоинформатики, привело к интересным результатам, которые хорошо совпадают с экспериментальными данными. Рост гриба – некая генетическая программа, защищённая несколькими степенями защиты. Эта программа выполняется всегда. При этом в экстремальных условиях жизни (например, при уменьшении содержания глюкозы в среде) она выполняется на фоне заметного изменения активности генетического аппарата и метаболизма не растущих клеток.

Гипотеза о том, что рост гифы исследуемого объекта отчасти обеспечивается расщеплением собственной хитиновой стенки, пока не подтвердилась, планируется ряд экспериментальных исследований для её проверки.

Литература

  1. З.Э. Беккер, «Физиология грибов и их практическое использование», издательство Московского университета, 1963г, стр.76-81.
  2. C.L. Slayman. Electrical properties of Neurospora crassa. Respiration and the intracellular potential. J. Gen. Physiol. 1965. V.49. p.93-116
  3. N.F. Robertson & S.R.H. Rizvi. Some observations on the hyphae of Neurospora crassa. Ann Bot: 32, 279-91, 1968.
  1. Л.М. Чайлахян, Т.В Потапова, Н.Н. Левина, Т.А. Белозерская, М.С. Крицкий. Изучение межклеточных взаимодействий у мицелиального гриба N.crassa в связи с фотоэлектрическими изменениями в мембранах. Биологические мембраны, т.1, 1984, с. 44-55.
  1. Bowen.A R., ChenWu.J L., Momany.M., Young.R., Szaniszlo.P J., Robbins.P W.
  2. Classification of fungal chitin synthases. Proc Natl Acad Sci U S A 1992, 89 (2):519-23
    Center for Cancer Research, Massachusetts Institute of Technology, Cambridge 02139
  1. R.H. Davis. Neurospora: contributions of a model organism. Oxf. Univ. Press. 2000.
  1. В.Ю. Соколовский, Т.А. Белозерская. Действие стрессоров на дифференциальную экспрессию генов в ходе развития Neurospora crassa. Успехи биологической химии, т.40, 2000, с. 85-152.
  2. [http:\www.inbi.ras.ru/ubkh/ubkh.htm1]
  1. 8. L. Casselton & M. Zolan. The art and design of genetic screens: filamentous fungi. Nature Reviews Genetics. Vol. 3, 683 -697 (2002).
  1. 9. Rowland H. Davis & David D. Perkins. Neurospora: a model of model microbes. Nature Reviews Genetics. Vol. 3. May 2002. p.7
  1. 10. J.E. Galagan et al. The genome sequence of the filamentous fungus Neurospora crassa. Nature. Vol. 422. 24 April 2003. p. 859
Дата 18.10.2011
Размер 245,67 Kb.
Тип Курсовая, Образовательные материалы

Скачай Курсовая работа по биоинформатике и еще Рефераты в формате PDF Биоинформатика только на Docsity! Федеральное государственное бюджетное образовательное учреждение высшего образования «Волгоградский государственный медицинский университет» Министерства здравоохранения Российской Федерации Лечебный факультет Кафедра фармакологии и биоинформатики Сравнение первичных аминокислотных последовательностей фермента Фосфодиэстеразы типа 1 (PDE-1B) человека и других животных. Поиск 3D-моделей фермента и сравнение 3D-модели PDE-1B человека с наименее похожим по первичной структуре фермента животным Выполнила: студентка 2 курса 22 группы специальности «Лечебное дело» Гусева Мария Проверил: Ассистент Захарьящева О.Ю. 1 Волгоград, 2018 Оглавление 1. Биоинформатика………………………………………………………………………………………………………… 3 2. Цели и задачи биоинформатики…………………………………………………………………………………..3 3. Этапы развития биоинформатики………………………………………………………………………………..4 4. Основные направления биоинформатики……………………………………………………………………. 4 5. Персонализированная медицина………………………………………………………………………………….5 6. Теория 4P……………………………………………………………………………………………………………………5 7. Основные программы сравнения аминокислотных и нуклеотидных последовательностей………………………………………………………………………………………………….. 8 8. Описание работы……………………………………………………………………………………………………… 10 9. Вывод:………………………………………………………………………………………………………………………20 10. Список литературы:…………………………………………………………………………………………………..21 2 Персонализированная медицина Персонализированная медицина — также называемая персонифицированная медицина, прецизионная медицина, индивидуализированная медицина, — представляет собой совокупность методов профилактики патологического состояния, диагностики и лечения в случае его возникновения, основанных на индивидуальных особенностях пациента. К подобным индивидуальным особенностям относят генетические, эпигенетические, транскриптомные, протеомные, метаболомные и метагеномные маркеры, а также совокупность вариативных фенотипических признаков — как всего организма пациента, так и его отдельных тканей или клеток. Теория 4P 4П-медицина основывается на четырех базовых принципах: – предиктивности (предсказательности), позволяющей прогнозировать заболевания на основе индивидуальных особенностей генома (создание вероятностного прогноза здоровья на основании генетических исследований); – превентивности (профилактики), работающей на опережение и позволяющей предотвращать появление заболеваний с помощью их профилактики, а также вакцин и препаратов для ремонта поврежденных генов; – персонализации, основанной на индивидуальном подходе к каждому больному (создание уникального генетического паспорта для лечения и контроля за здоровьем пациента); – партисипативности (участия, партнерства), основанной на широком сотрудничестве различных врачей-специалистов и пациентов, а 5 также на превращении пациента из субъекта лечения в объект лечебного процесса. Медицина будущего включает в себя все – от клеточной терапии, инжиниринга тканей до создания новых медицинских препаратов и устройств – все, что позволит выявить и предупредить болезнь. Фосфодиэстеразы ФОСФОДИЭСТЕРАЗЫ циклических 3′, 5′-нуклеотидов (3′,5′- циклонуклеотид 5′-нуклеотидгидролазы), ферменты класса гидролаз, катализирующие гидролиз циклич. 3′, 5′-аденозин- и 3′, 5′- гуанозинмонофосфатов, а также некоторых др. циклич. нуклеотидов в присут. Mg2+: Фосфодиэстеразы присутствуют практически во всех исследованных тканях, а также в клетках бактерий. Функционирование фосфодиэстераз обусловливает снижение внутриклеточной концентрации циклич. нуклеотидов, в частности, после гормональной стимуляции аденилатциклазы. Фосфодиэстеразы могут также участвовать во внутриклеточной передаче сигнала. Известно большое кол-во изоферментов фосфодиэстераз, различающихся по структуре, ферментативной активности, субстратной специфичности и зависимости от коферментов. По последним двум св-вам их делят на 4 осн. группы: Са2+-кальмоду-линзависимые, цГМФ- модулируемые, цАМФ- и цГМФ-спе-цифичные (цАМФ и цГМФ — соотв. циклич. аденозинмоно-фосфат и циклич. гуанозинмонофосфат). 6 цАМФ Фосфодиэстеразы первой группы присутствуют в сердечной мышце и в мозговой ткани. Их активность значительно возрастает в присут. Ca2+. Фосфодиэстеразы второй группы широко распространены в тканях нервной системы, в корковом в-ве надпочечников, где они, возможно, участвуют в регуляции биосинтеза стероидных гормонов. цГМФ обычно увеличивает скорость гидролиза ферментом цАМФ. В сердечной мышце, в нек-рых типах гладкой мускулатуры, в тромбоцитах, жировых клетках и гепатоцитах присутствуют фосфодиэстеразы этой группы, к-рые ингибируются цГМФ. Фосфодиэстеразы третьей группы обнаружены в половой системе, где их экспрессия может индуцироваться цАМФв нервной ткани, в почках и лимфоцитах. У дрозофилы показана центральная роль фосфодиэстераз этой группы в биохим. механизмах, определяющих поведенческие р-ции. Фосфодиэстеразы четвертой группы присутствуют в легких и тромбоцитах, а также в клетках палочек и колбочек сетчатки. Наиб, изучена фосфодиэстераза из клеток палочек сетчатки. Она участвует в передаче зрительного сигнала. Этот фермент состоит из трех субъединиц — 7 Описание работы Выбрана группа организмов: Bovin Crigr Rat Mouse Поиск в UniProt своего белка для человека и других организмов: На сайтеUniProtKB (http://www.uniprot.org/uniprot/) набирали в поиске свою мишень (BTK), далее из списка выбрали нужные организмы, у которых есть этот белок, взяли для сравнения дополнительные организмы. Скачивали FASTA-формат для каждого организма: 10

упгемемед (ТТЕМВЬ) — СотриаНопайу апаузе4

ив рллироидыини Фнар @очргоккВ вер удео 8 Офег Виочаю ап Мфесз 3. Оонтюз4е.

РАНег Бу. ___ МВТ > оо Фе ронтовв ФА Ава ло баке Сите > 1105015 Звои 25 у

‘бепе патез | Ограпет т

® ронпоаа заескей (1)
бониуоад а! (5)

Роршаг огдапьте = © 91065 РЕЦ т РаеЗЬ РФеЛЬ: — Миз тизолив (Моше) 535
вое З 901066 РОЕЦ © Согтриеннед ® Упсоттргевнед ель РЧеЛЬ — КаНыз погиедсия (Ва) 535
Нитая (1) Реемен г 10 в

# 901054 РОЕЦ РОЕЗВ РОЕ1В1, —Ното зарете (нитап) 536
Мошзе (1) РОЕБЛВ
ак (1) О 901061 РОВ ВОМН Ву сыйет/сатовийит. РОЕЗВ РОЕ1В1 — Вослаштие (вомпе) 534

ерепдеги 3′,5°

смся (1) › 964395 РОВ АА Во Сысит сию РЕВ ‘спсевлив деи (СРулеве Ватикег) 19
. ерепдеги 3′,5° (Сисешия Багабелав дпвемя)
Мем Бу

>5р1091964 |РОЕЗВ_НИМАМ Са1сЗип/са]поби4п-дерепдепе 3′,5′-сус14с писЛеот4е рвозрвой4ехегазе 18 О5=Нопо зар1епз 0Х-966 СЕРОЕ1В Р:
НЕГРАЗРРЕМЦЕЕЗОСРЗРСЕСК ЗАРЗККИИТКЫВЗЫ АУМУКОГЕМФЕТИТЕЕЕ ККМ.

ЕУТАЗНЕАУУТОЕТВОТЕОТЕОЕЦОЕАЗОАУРЗЕУОМ АТР ООАЯАКСАЯДЕЕКР.

КЕЯЗТУНАУОАСТЕУЕЙНЕВЯТУТ $УВРТУЗТАУ МСЕКМИРИНСЕРУЕ ОААБОНАЕ

ТТМЕЕЦ ТАНМ.ТВЕКТРТМЕЦ ИЕР ОАСЕТСУСКУКИРУНМОТНААРУТОТУНСРЫЕ

ВТЕИУНСЗЕТЕИ ГАТТРААТНОУЕНТОТТЫЗЕНТОТКЗЕСАТУУНОВМ.ЕНННТЗЗУ

ЕВИМОООЕИНТЕ ТМЕТКОЕРУЕ ВАГУТЕММУ АТОИЗСНЕООУКТИКТАГОО-ЕАТОКРК,

АСЗ НААОТНРТКОНЕМНЗЕМТКАГМЕЕРРАООКЕАЕЕЧРЕЗРЕСОЯТТЕМАО5

‘ОТЕТОЕТУЕРТЕЗАИ ТОМАЕКЗМОРЕАОЕОЗКЗКМОРЗЕОНАОРИОМЕУВОРИРОМ/5

РЕТНУКАТОЕНКОКИКЕВАДУВТТМОНТОЕ $РСЕЕЕАРРРАЕРЕНАОЧЕМИО

Попарные сравнения

— в Сша!

11

1 Сыма 21 ох
Ре Е4Я Аболтет вез сою Ош у Нер

мове: [Мире Аюптепе Мобе > | Ропе: [10 =

СЫ Е Е Е
Ее

СЦУ$ТАЕ-АПоптеп! Ме сгеапед [С:Л)зегмАзизЛезмор/ли. аи]

Загружали ЕАЗТА-формат человека и ЕАЗТА -формат анализируемого
организма. Программа попарно сравнивала две последовательности,

выделяя совпадения цветом и символами.

12
Обработка результатов Данные (Score, Expect, Identities, Positives) занесли в таблицу документа MicrosoftExcel и рассчитали ранги для каждого параметра. Таким образом, из таблицы мы видим, что данный белок (PDE-1B) человека наиболее сходен с таким же белком Bovin (clustal=0.01779, общий ранг 1,4) и менее схож с белком Crigr (clustal=0.020101, общий ранг 1,3). 15 Поиск 3D-моделей белка и сравнение 3D модели PDE-8A человека с наименее похожей по первичной структуре (крысой). Для человека: Для сравнения 3D моделей белка, скачаем их с сайта UniProt. Для человека нам необходимо выбрать 3Dструктуру, которая проверена x-ray и имеет разрешение наименьшее (в Å), т.е нам подходит 1TAZ. 16 ит

Ргоет Ва ВапКк т Ечгоре

Випойпо ЭБтисвиге ко Воду, «вто запож ВАСАН_НМАН

Х-гау ЧИ тасцоп

РОВ › (а? пк

Вефеавед: 03 Аи 2004

Сайайуёс ботат О! Нитап Рпозрпофезегазе 1В. _# паг оуегием
сито оградит Ното зарля Моды двотеьу ира — °, слить
това р — о
Рипоагу рмьвсавол: 9 эише апауыа
Ср Аовлапиое внвав тесвалет бо падеонае эаесьыку БУ ррогонофеннегнея, т
пу КУ, Сы С. Завша У, Аз ОВ, Рор9 О, цене 5, Ней О, Неитап 3, ея ВЕ, {2 Бала вод Епугогтегкя
лапу ©, МАъат МУ, Кип 5, севытаез, Во1ад 6 а | Брент зпа айданол
«мой Сей 15 279-86 (2004)
РМО: 15260978
мен
ь. В ронтоваь
30 Увшвзвол
Рипсйоп апа Вююду Боеав — Цдапаз апд Епмгоптепв

Скачиваем ЗП) структуру и открываем ее с помощью программы

Свет3О О]ва 9.0.

17
001065 (РОЕЛВ_МОЧЗЕ) миз пизолиз (моизе)

Са!сит/сайтодийп-дерепдеп! 3′,5’-сусйс пицеонае рпозрпофезегазе 1В

535 ва; Зедиепое (Рака)

1001065
«топот 148-505

«Сабитикатодиит-дерепдеге 3:5-
суейе пицвовае рвозрродеегазе 18»

5525ЛА
94.67%
059

1х(иВ.158}4-14-6-Поогоруваи-2-
У)рпепутеи-8-тету,5-
(фвепИатито)-1.3.4.8.10-

региаалайенасусюГ 60.026011.15речадесь
2.59-цег-7-оле

МТ. Мега 2019-01-02
ботов Мода +
«моде ОшаНу Ето, у

О ини |

Критерии качества модели: модель считается качественной, если

показатель

надежный (зеленый),

некачественной,

если показатель

ненадежной (красный). Скачиваем подходящую модель и открываем с

помощью программы Срет3О вла 9.0.

20
Определение сайтов связывания Человек: На модели белка человека можно выделить специфические сайты связывания, которые можно найти на сайте UniProt. На картинке мы можем видеть двадцать специфических центров связывания белка с лигандом: Tyr 222 (A), His 223 (A), Asp 370 (A), Ile 371 (A), His 373 (A), Leu 388 (A), Met 389 (A), Phe 392 (A), Leu 409 (A), Gln 421 (A), Phe 424 (A) сайты, которые связывают двухвалентный катион металла. 21

зил
т

А

т

7

[зы зави)

ОМК 60 (А) @»

22

Курсовая работа: «Биоинформатика: современное состояние и перспективы»

БЕЛОРУССКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

Выпускная работа по

«Основам информационных технологий»

Магистранта

кафедры генетики

биологического факультета

Панкратова Василия

Руководители:

член-кор. НАН Беларуси, профессор, д.б.н. Давыденко О. Г.,

старший преподаватель Шешко С.М.

Минск – 2010 г.

Оглавление

Оглавление. 2

Список обозначений ко всей выпускной работе. 3

Реферат на тему «Биоинформатика: современное состояние и перспективы». 4

Введение. 4

Глава 1. Обзор литературы… 5

Работа с геномными и протеомными базами данных. 6

Выравнивание последовательностей. 7

Поиск генов и регуляторных элементов. 9

Моделирование пространственной структуры биомолекул. 10

Поиск лекарственных средств. 13

Молекулярная фиолгения. 13

Обработка цифровых изображений. 15

Системная биология. 16

Глава 2 Методика исследования. 18

Глава 3 Результаты и их обсуждение. 20

Поиск нуклеотидной последовательности гена ND6. 20

Подбор праймеров для амплификации гена ND6. 25

Сравнение полученной последовательности со стандартной. 27

Выявление функциональной значимости найденных замен. 28

Заключение. 32

Список литературы к реферату. 32

Предметный указатель к реферату. 33

Интернет ресурсы в биологии. 34

Ресурсы для поиска биологической информации. 34

http://www.ncbi.nlm.nih.gov/pubmed. 34

http://blast.ncbi.nlm.nih.gov/Blast.cgi 35

http://www.ncbi.nlm.nih.gov/sites/gquery. 35

http://www.mitomap.org/MITOMAP. 36

Ресурсы для работы с нуклеотидными и аминокислотными последовательностями 36

http://www.bioinformatics.org/sms2/ 36

http://expasy.org/tools/ 37

http://biotools.umassmed.edu/bioapps/primer3_www.cgi 38

Действующий личный сайт в WWW… 39

Граф научных интересов. 40

Вопросы по основам информационных технологий. 41

Вопрос по специальности. 41

Вопрос по общему курсу. 42

Презентация магистерской диссертации. 44

Список литературы к выпускной работе. 45

Приложение. 47

Список обозначений ко всей выпускной работе

БИ

Биоинформатика

ДНК

Дезоксирибонуклеиновая кислота

ПО

Программное обеспечение

ПЦР

Полимеразная цепная реакция

РНК

Рибонуклеиновая кислота

СБ

Системная биология

Реферат на тему «Биоинформатика: современное состояние и перспективы»

Введение

Бурное развитие молекулярной биологии и генетики в конце 20го – начале 21го веков привело к накоплению огромного массива экспериментальных данных, в первую очередь последовательностей ДНК, РНК и белков, цифровых биологических изображений и структур сигнальных сетей, хранение и анализ которых не возможен без применения соответствующего ПО. Хотя и раньше информационные технологии использовались биологами, например, для статистической обработки полученных данных, именно бум молекулярной биологии вызвал у специалистов-биологов потребность в специализированных инструментах для решения конкретных задач по обработке биологической информации. Как раз с этим связано возникновение БИ как самостоятельной области науки [6]. Уже сейчас большинство исследователей в области молекулярной биологии и генетики пользуются биоинформационными инструментами на этапе планирования эксперимента и обработки полученных экспериментальных данных. Более того, имеется большое количество опубликованных работ, полностью основанных на применении БИ для решения конкретных биологических проблем [7]. Вполне вероятно, что в перспективе будет возможным компьютерное моделирование биологических систем различной сложности, что позволит вывести биологию на принципиально иной уровень.

Кроме рассмотрения основных направлений развития, достижений и перспектив БИ, данной работе будет представлен конкретный пример использования биоинформатических средств в молекулярно-генетической работе. В рамках данной работы необходимо проверить, имеет ли больной Х мутацию в гене ND2, приводящую к нарушению его функции. Для достижения этой цели необходимо

1. Подобрать праймеры для амлификации и секвенирования гена ND2

2. Провести его амплификацию и секвенирование

3. Сравнить полученную последовательность со стандартной последовательностью гена ND2 человека и выявить отличия

4. Проверить, являются ли эти отличия уже описанными мутациями или полиморфизмами

5. Если найденная мутация окажется ранее не описанной, то необходимо проверить, скажется ли она на функционировании белка

На этапах 1,3,4,5 использовались те или иные биоинформатические инструменты.

Глава 1. Обзор литературы

Несмотря на непродолжительное время существования БИ, в этой сфере уже выявились конкретные направления и во многих из них уже имеются ощутимые достижения. Далее кратко будут рассмотрены основные задачи, которые могут быть решены с использованием биоинформатического подхода. К их числу относятся следующие [1,5]:

· Работа с геномными и протеомными базами данных

· Выравнивание (alighnment) нуклеотидных или аминокислотных последовательностей

· Поиск генов и различных регуляторных последовательностей в данном геноме

· Моделирование вторичной, третичной и четвертичной структур белков на основании их аминокислотной последовательностей

· Поиск функциональных доменов в молекулах белков (реакционных центров, трансмембранных доменов, сигнальных последовательностей и т.д.)

· Предсказание внутриклеточной локализации белка и характера его взаимодействия с другими белками

· Поиск лекарств

· Молекулярная филогения

· Обработка цифровых изображений

· Системная биология и моделирование биологических систем

Работа с геномными и протеомными базами данных

Первый геном бактерии был полностью секвенирован в 1995 году. С тех пор, благодаря развитию методов секвенирования ДНК, определены нуклеотидные последовательности геном многих видов живых организмов, в том числе человека, шимпанзе, нескольких видов растений, дрозофилы, пекарских дрожжей и многих бактерий.

С точки зрения БИ геном любого живого организма представляет собой последовательность длиной от 106 (бактерии) до 1011 (некоторые растения) символов (нуклеотидов), состоящую из четырех различных нуклеотидов (А, Т, Г и Ц). Очевидно, что само по себе создание геномных баз данных, в которых пользователи могли бы легко найти интересующий их участок генома конкретного организма, – это уже довольно непростая задача [6]. Тем не менее, в настоящее время существует довольно много баз данных, доступных в интернете, позволяющих работать с нуклеотидными последовательностями различных геномов. В зависимости от типа информации, хранящихся в них, все базы данных делятся на архивные, курируемые и интегрированные. В первые из них любой пользователь может добавить определенные им последовательности без какой-либо проверки их достоверности. Соответственно, такая база будет более полной, но менее достоверной. При подаче новой последовательности в курируемую базу происходит оценка достоверности как самой последовательности, так и найденных в ее составе генов и регуляторных последовательностей. Следовательно, такая база будет более надежной. Третий тип, интегрированные базы данных, такие как NCBI Entrez, предоставляют возможности поиска по многим как архивным, так и курируемым базам. Кроме того, базы можно разделить на специализированные, в которых хранятся последовательности генома только одного вида, но по этому геному представлена более подробная информация (например, есть специализированные базы данных по геномам дрозофилы, дрожжей, кишечной палочки и других организмов), и общие – в таких базах можно получить информацию о геномах многих организмов. Работа с геномными базами данных осуществляется через программы, называемыми геномными браузерами, многие из которых доступны он-лайн (например, Ensemble, UCSC Genome Browser и другие). С помощью геномного браузера можно найти участок генома с заданными координатами, ген по его названию или нуклеотидной последовательности, узнать предполагаемую или подтвержденную функцию данного участка ДНК и т.д.

Кроме геномных, существуют еще и протеомные базы данных, хотя иногда два этих типа баз могут быть объединены в один. В протеомных базах данных (наиболее известная и качественная из них – Swiss-Prot) можно найти аминокислотную последовательность белка по его названию и наоборот, вторичную, третичную и четвертичную структуру, если для данного белка они известны, и информацию о функции белка, его внутриклеточном расположении, взаимодействии с другими белками и т.д.

Выравнивание последовательностей

Следующей задачей БИ, для решения которой уже имеется большое количество эффективных программных средств, является выравнивание (в том числе и множественное) нуклеотидных или аминокислотных последовательностей [1,5,6]. Оно представляет собой запись последовательностей друг над другом таким образом, чтобы число соответствий было максимальным. При этом необходимо учитывать, что гомологичные («родственные») последовательности могут отличаться друг от друга в результате замены одного нуклеотида (аминокислоты) на другой или вставки/выпадения нуклеотида или аминокислоты. Решение этой задачи требуется в следующих случаях: для поиска нуклеотидной (аминокислотной) последовательности в геномной (протеомной) базе данных, сравнение двух или нескольких соответствующих последовательностей (при филогенетическом анализе, поиске эволюционно консервативных участков и предсказании функций генов и белков).

Для выравнивания используют алгоритмы динамического программирования, подобные алгоритмам поиска оптимального пути на графе. Они дают правильные решения, но, особенно при выравнивании фрагмента ДНК и целого генома, занимают много времени. Поэтому наиболее часто для поиска нуклеотидной последовательности в геноме применяют алгоритм BLAST (basic local alignment search tool) [6]. Суть его работы заключается в том, что он сначала создает кеш-таблицу. В ней для каждой последовательности длиной 7-13 нуклеотидов указываются точки, в которых она встречается в данном геноме. При выравнивании искомой последовательности (длина которой, как правило, значительно превышает длину табличных последовательностей) она разбивается на короткие фрагменты, расположение которых в геноме определяется с использованием кеш-таблицы. После этого проводится выравнивание с помощью алгоритмов поиска путей на графе, однако, так как поиск соответствия проводится не по всей базе, а только по тем ее участкам, которые были отобраны на первом этапе, результат достигается значительно быстрее.

В том случае, если требуется провести выравнивание сразу нескольких похожих последовательностей, для экономии времени пользуются несколько упрощенным подходом, называемым прогрессивным выравниванием [5,6]. Суть его состоит в том, что сначала выравниваются две наиболее похожие последовательности и на основании результатов этого выравнивания строится суперпоследовательность, которая на следующем шаге заменяет те две последовательности, на основании которых она была построена. Снова ищутся две самые похожие последовательности и т.д. В конечном итоге получают выравнивание всех введенных последовательностей.

Поиск генов и регуляторных элементов

Еще одна интересная и до конца пока не решенная задача – это анализ имеющихся последовательностей геномов с целью обнаружения генов и различных регуляторных участков и выявления их функций [5,7]. Еще до секвенирования первого эукариотического генома, было ясно, что у этих организмов, в отличие от бактерий-прокариот, далеко не весь геном представлен генами, а имеются и значительные по своему размеру межгенные участки. Таким образом, само по себе определение нуклеотидной последовательности геномов эукариот дало исследователям сравнительно мало информации. Во всем этом массиве данных предстояло найти участки, соответствующие генам, и участки, регулирующие их работу (в геноме человека в совокупности они составляют не более 30%), определить какую функцию выполняет тот или иной ген и в каких условиях он работает, а в каких – нет. Решение такой задачи стало возможным благодаря тому, что имеются экспериментальные данные о последовательности и функции различных генов различных организмов. Проанализировав их можно постараться выявить маркеры, характерные для всех генов или большой их группы, которые позволяли бы отличать их от негенной ДНК. Для большинства генов такие маркеры были найдены. Они представляют собой более-менее консервативные нуклеотидные последовательности в начале гена. Если, вдобавок к этим маркерам, проанализировать наличие некоторых других последовательностей, обычно ассоциированных с генами, а также проверить, может ли предполагаемый ген транскрибироваться и транслироваться, то в любом геноме можно оценить общее количество генов и найти их расположение. Так, благодаря этому подходу было установлено, что у человека примерно 22 тысячи генов. Однако это только начало работы. После обнаружения гена встает вопрос о его функции (что он делает?) и особенностях его регуляции (когда, в каком типе клеток и при каких условиях этот ген работает?). Для выяснения функции гена его последовательность сравнивают с последовательностями других генов (как того же, так и других организмов) с известной функцией. Если обнаруживается существенная гомология, значит, скорее всего, характеризуемый ген имеет такую же функцию, как и тот, на который он оказался похожим. При создании подобных программ качество их работы проверяют, вводя в них последовательности генов, функции которых были уже определены экспериментально. Если программа правильно определяет функцию такого гена, значит, она работает надежно.

Однако подход, основанный на сравнении нуклеотидных последовательностей, сталкивается с определенными трудностями: во-первых, реальную работу в клетках выполняют не сами гены, а их продукты, как правило, это белки. Из-за вырожденности генетического кода два гена с весьма отличающейся нуклеотидной последовательностью могут давать белки, схожие по своей аминокислотной последовательности. Во-вторых, функция белка определяется не столько его аминокислотной последовательностью (первичной структурой), сколько его пространственной организацией (вторичной, третичной и четвертичной структурами). Соответственно, наиболее правильный подход к выявлению функции гена – сравнение потенциальной трехмерной структуры его белкового продукта и белков с известной трехмерной структурой и функцией [3]. А это уже куда более сложная задача, чем сравнивание последовательностей, так как, с одной стороны, существующие ныне математические модели далеко не всегда правильно строят трехмерную структуру белка по имеющейся аминокислотной последовательности, а, с другой стороны, количество белков, для которых экспериментально выявлена трехмерная структура, не очень велико. Таким образов, моделирование трехмерной структуры белков (о чем речь еще пойдет ниже) и определение функций генов – это задачи, которые являются одними из перспектив развития вычислительной биологии и БИ.

Моделирование пространственной структуры биомолекул

Очень важным является моделирование пространственных структур молекул РНК и белков [3,5]. Для белков эта задача, с одной является, с одной стороны, более сложной, а, с другой, — более важной, так как белков с функциональной структурой гораздо больше, чем РНК, поэтому именно о белках и пойдет речь. Изучением и предсказанием пространственных структур белков занимается структурная геномика, объединяющая в себе как экспериментальный, так и биоинформатический подходы.

Как уже было отмечено, очень многие функции в клетках выполняются белками. Свойства и биологические функции белка определяются не только его аминокислотной последовательностью, но и пространственной структурой. Обе эти характеристики в совокупности определяют наличие у белка различных доменов (функциональных участков), таких как реакционные и регуляторные центры ферментов, сайты связывания с ДНК и другими белками, сайты химической модификации, сигналы внутриклеточной локализации, трансмембранные домены и т.д. Так как аминокислотная последовательность белка устанавливается экспериментальным путем, то первой биоинформатической задачей при характеристике белка является построение его трехмерной структуры. Предпосылкой, делающей решение такой задачи возможным, является тот факт, что пространственная организация белка во многом определяется его первичной структурой. Иными словами, в первом приближении можно считать, что аминокислотная цепь сама принимает наиболее стабильную конформацию, поэтому моделирование пространственной структуры белка сводится к поиску варианта его упаковки с минимальной внутренней энергией. Для малых молекул, число конформационных вариантов которых относительно невелико, эта задача является простой. Однако для белков, состоящих из сотен, а то и десятков тысяч аминокислотных остатков, сделать это значительно сложнее, и построение всех возможных конформаций и их сравнение займет много времени. Поэтому для такой цели используются специальные алгоритмы, которые находят наиболее стабильные структуры быстрее, хотя и с меньшей точностью. Однако, несмотря на внешнюю легкость данной задачи, развитие программ, моделирующих трехмерную структуру белков, активно продолжается, и оптимального решения пока найдено не было. Дело в том, что, во-первых, стабильность пространственных структур зависит от физико-химический условий, которые различаются в различных типах клеток и их компартментах, и в различные моменты времени. Во-вторых, в белки в клетках могут существовать не только в виде самой стабильной конформации, а в нескольких субоптимальных конформациях. В-третьих, конформация молекулы белка может меняться в зависимости от его взаимодействий с другими белками.

Как уже говорилось, попытаться обойти проблему можно, сравнивая последовательности данного белка, и белков, для которых пространственная структура установлена экспериментально. Но и этот подход имеет ограничения, которые уже упоминались. Таким образом, для правильного моделирования структуры белков необходимо учитывать не только их аминокислотную последовательность, но и тип клеток и внутриклеточных органелл, в которых располагается этот белок, и возможность различных взаимодействий между белками, а также сравнивать исходные последовательности и полученные структуры с экспериментально определенными. Решение такой задачи возможно только в рамках системного подхода.

С предыдущей задачей связан поиск различного рода функциональных участков в молекуле белка. Хотя некоторые из них представляют собой фрагмент аминокислотной цепи (например, сигнальные последовательности и различные типы доменов) и их можно обнаружить без знания пространственной структуры, такие важные участки, как каталитические и регуляторные центры или сайты связывания с нуклеиновыми кислотами и белками, представляют собой совокупность аминокислотных остатков, расположенных в первичной структуре белка довольно далеко друг от друг и сближающихся только при переходе белка в нужную конформацию. Соответственно их обнаружение не возможно без знания пространственной структуры белка. Если же она известна, то, сравнив ее со структурой тех белков, для которых экспериментально показано наличие того или иного домена, можно делать выводы о наличии такого же домена в изучаемом нами белке.

Поиск лекарственных средств

Особой областью применения БИ является поиск новых лекарственных средств против тех или иных заболеваний [1,4]. Механизм действия большинства лекарств заключается в связывании с каким-либо белком организма хозяина или патогена, в результате чего может либо нарушатся взаимодействия белка патогена и хозяина, или белок патогенного организма теряет способность выполнять свою функцию в результате изменения конформации или других каких-то событий. Таким образом, идеальное лекарственное средство должно связываться только с целевым белков и вызывать строго определенное изменение его свойств. Раньше поиск лекарств происходил путем проверки огромного спектра соединений сначала in vitro на предмет взаимодействия с нужным белком, затем на лабораторных животных на предмет токсичности и других побочных действий, и потом уже шел этап клинических испытаний. Разумеется, это связано со значительными затратами времени и средств. Хотя на настоящий момент биоинформатические инструменты не позволяют сократить поиск лекарств лишь до этапа клинических испытаний (что является перспективой развития этого направления БИ), все же уже есть ПО (например, Hex, Argus Lab, и Autodock), которое позволяет определить, будет ли данное вещество связываться с активным центром белка-мишени. А благодаря этому можно исключить из испытаний вещества, которые не будут связываться и тем самым значительно сократить список кандидатов и время, необходимое для поиска.

Молекулярная фиолгения

Молекулярная филогения занимается выяснением степени эволюционного родства между различными видами живых организмов, построением естественной систематики и воссозданием эволюционных событий на основании данных о нуклеотидной последовательности геномов. В первом приближении эта задача довольно таки проста: нужно выполнить множественное выравнивание анализируемых геномов и найти отличия. Те организмы, которые меньше отличаются друг от друга, являются эволюционно более близкими и должны быть объединены в таксон меньшего порядка (вид, род, семейство). Те же из них, геномы которых различаются разительно, являются очень далекими эволюционными родственниками и могут принадлежать лишь к одному отряду или типу. Однако, если взглянуть на проблему более пристально, все оказывается не так просто. Во-первых, множественное выравнивание целых геномов – технически крайне непростая задача. Поэтому проводят сравнение не всего генома, а его определенных участков. Следовательно, успех во многом зависит от выбора участка для сравнения. Во-вторых, на настоящий момент для биологов очевидно, что отличия в разных участках генома имеют неодинаковый эволюционный «вес», так как изменения в генах или регуляторных элементах могут повлечь за собой изменения в свойствах организма (т.е. именно такие изменения эволюционно значимы), в то время как изменения в некодирующих участках генома могут никак не сказаться на признаках организма и, соответственно, не иметь эволюционного значения. Значит, такие различия не следует учитывать при выяснении филогенетического родства организмов. Кроме того, как уже говорилось, даже изменения в нуклеотидной последовательности генов могут по-разному проявлять себя: с одной стороны, сравнительно большое число нуклеотидных замен может никак не повлиять на функционирование белка, а одна-единственная замена, влекущая за собой появление другой аминокислоты в функционально важном участке белка, может полностью изменить свойства вплоть до полной потери функции. Соответственно, одна такая замена при выяснении филогении должна иметь больший вес, чем множество замен, не влияющих на функцию белка. Еще более интересным и важным для построения естественной систематики является тот факт, что, как оказалось, многие сильно отличающиеся друг от друга организмы (к примеру, мышь и человек), мало отличаются по набору генов и их последовательностям. Оказалось, что фенотипические различия между мышью и человеком объясняются тем, что регуляция работы генов у двух организмов сильно разнится [7]. Следовательно, занимаясь выяснением вопросов молекулярной филогении, стоит обращать внимание не только на набор и нуклеотидную последовательность генов, а еще и на наличие рядом с ними тех или иных регуляторных элементов, таких как промотеры, энхансеры, сайлансеры и т.д. и особенности их структуры. Также взаимное расположение различных генетических элементов может иметь эволюционный смысл и должно быть принято во внимание.

В целом, эта область БИ остается одной из самых сложных и, в то же время, одной из самых перспективных. Возможно, именно успехи в этом сфере смогут приблизить нас к более полному пониманию механизмов эволюционного развития живой природы.

Обработка цифровых изображений

В настоящее время в биологии широко применяются методы исследования, выходными данными для которых являются цифровые изображения. Это, в первую очередь, микроскопия, но также и микро-эрей и сходные методики [1,5]. Так как объем этих данных стремительно увеличивается, встает проблема их автоматической обработки. В случае микрофотографии существуют следующие задачи, требующие автоматического решения: 1) отделение шумового сигнала от значимого; 2) определение структур, интересующих исследователя (выявление клеток и их частей, различение различных типов клеток и т.д.); 3) сопоставление интенсивности и расположения флуоресцентных сигналов между собой и с результатами светлопольной микроскопии (необходимо для внутриклеточной локализации молекул, несущих флуоресцентные метки, а также для предсказания межмолекулярных взаимодействий).

Применение ДНК-микрочипов позволяет изучать экспрессию генов на геномном уровне или сравнивать экспрессию при разных условиях или в разных типах клеток. ДНК-микрочип представляет собой небольшой твердый носитель с огромным количеством (десятки тысяч) ячеек, в которые нанесены фрагменты ДНК, соответствующие известным генам данного организма. Если на микрочип нанести кДНК, несущую флуоресцентную метку, она образует комлементарную пару с соответствующей ДНК на чипе, о чем будет свидетельствовать флуоресценция после отмывки чипа. После гибридизации ДНК чип сканируется лазером и получается цифровое изображение. В случаях, если сравниваются два типа клеток или одни и те же клетки, но при различных условиях, кДНК из одних клеток метится, например, зеленой флуоресцентной меткой, а из других – красной. Потом пробы смешиваются и наносятся на один микрочип. Поэтому при обработке полученного изображения необходимо не только найти те ячейки, в которых произошла гибридизация, но и оценить ее количественно, а также, во многих случаях сравнить интенсивность красного и зеленого сигналов. Для решения всех этих задач на настоящий момент уже создано соответствующее ПО, позволяющее проводить анализ с использованием микрочипов в большом масштабе.

Системная биология

СБ – это новая биологическая дисциплина, развитие которой невозможно без тесного взаимодействия с БИ. СБ занимается количественным (а не качественным, как классическая молекулярная биология) описанием биологических систем с целью их последующего моделирования [1,4]. Типичным вопросом СБ является, например, следующий: если концентрация ионов кальция в цитоплазме клетки увеличится в два раза, как изменятся основные параметры (концентрации различных веществ, транмембранный потенциал и т.д.) во всех компартментах клетки и как отреагирует клетка в целом? Другой пример: как количественно изменится сродство ДНК-связывающего белка к ДНК при изменении конкретной аминокислоты в его составе или одного нуклеотида в определенном участке ДНК, и как это скажется на концентрации продукта соответствующего гена? Разумеется, решение задач СБ невозможно без накопления экспериментальных количественных данных, но для их последующей обработки необходимо использование биоинформатических инструментов, особенно для моделирования биологических процессов. В этой связи стоит упомянуть японский проект e-cell (электронная клетка), в рамках которого коллектив биологов и программистов занимаются созданием программы для моделирования живой клетки. Уже сейчас имеется версия этой программы, позволяющая моделировать некоторые клеточные процессы. Предполагается, что в перспективе, когда данная модель достигнет достаточной степени точности, ее можно будет использовать для решения многих теоретических и практических задач, вплоть до проведения экспериментов in silico, поиска лекарств и проверки способов профилактики и лечения некоторых заболеваний.

Таким образом, наиболее перспективными сферами применения БИ являются следующие:

Моделирование структуры белков и предсказание их функций на основании нуклеотидной последовательности соответствующих генов в масштабах целых геномов. В перспективе такой подход позволит характеризовать свойства организмом, зная только последовательность их геномов. Учитывая, что секвенирование геном становится все более и более дешевым, такой подход позволит значительно расширить спектр видов живых организмов, охарактеризованных на молекулярном уровне.

Поиск и характеристика регуляторных элементов в ДНК. Известно, что человек и мышь очень мало отличаются между собой по набору генов и их нуклеотидной последовательности. Большинство различий между этими двумя видами обусловлены именно особенностями регуляции работы генов. Поэтому, если появятся биоинформатические инструменты, позволяющие с высокой степенью надежности находить регуляторные элементы в геноме и определять, как, при каких условиях и на какие гены они влияют, это позволит сделать существенный шаг в развитии биологии.

Успехи в предыдущих двух пунктах могут быть применены в изучении эволюции и систематики живой природы. Сравнивая геномы разных организмов, при условии, что мы знаем, как каждое из найденных отличий сказывается на функции белка и его концентрации клетке, мы сможем не только построить наиболее точную систему живых организмов, но и глубже понять механизмы биологической эволюции.

Наиболее амбициозной задачей является моделирование биологических систем различного уровня, начиная с клетки и субклеточных систем и заканчивая биосферой в целом. Успехи в этом направлении позволят проводить многие виды биологических экспериментов на таких моделях, а не на реальных биологических объектов. Это, в первую очередь, касается тестирования различных лекарственных и других препаратов, что в настоящее время связано с большими материальными и временными затратами, а также с этическими проблемами.

Глава 2 Методика исследовани я

Для разработки праймеров для амплификации и секвенирования гена ND6 сначала была найдена его последовательность в базе данных, содержащей информацию о геноме человека. Поисковая система Entrez Pubmed, в которой можно найти нуклеотидную последовательность практически любого гена по его названию, база данных Mitomap, в которой представлена наиболее полная информация о митохондриальном геноме человека, и геномный браузер USCS, позволяющий работать с последовательностью генома человека (все эти ресурсы свободно доступны он-лайн).

Далее, зная нуклеотидную последовательность гена ND6 и прилегающих участков, мы подбирали праймеры для его амплификации. Это можно делать либо вручную, выбирая праймеры и проверяя их свойства, такие как температура плавления, вероятность образования шпилек, гомо- и гетеродимеров, специфичность и т.д. с помощью таких средств, как сервер IDTDNA, либо использовать программу Primer3, которая сама подбирает праймеры к данной последовательности, учитывая заданные требования.

Затем, используя разработанные праймеры, проводили сначала амплификацию, а затем секвенирование данного гена. Хотя здесь также было использовано специальное программное обеспечение, в частности, для программирования секвенатора и для интерпретации полученных с его помощью «сырых» данных, такое применение ИТ не совсем соответствует определению БИ.

Следующий этап, на котором было необходимо применение биоинформатических технологий – это сравнение нуклеотидной последовательности гена ND6 больного Х со стандартной последовательностью. Для этого можно применять любую программу для выравнивания последовательностей ДНК, которая воспринимает как файлы в текстовом формате, так и так и файлы, полученные от секвенатора. Нами для этой цели применялась программа Chromas.

Далее, в тех случаях, если при сравнении стандартной ДНК и ДНК больного Х были обнаружены различия, мы определяли, были ли такие замены описаны ранее. Для этого мы обращались к списку мутаций и полиморфизмов митохондриального генома в базе данных Mitomap. Если такая замена уже описана, то для нее будет приведена ее функциональная значимость (оказывает ли она негативное действие на работу белка, и, соответственно, может ли она быть причиной наблюдаемой клинической картины).

В тех же случаях, когда найденная нами нуклеотидная замена не была ранее описана, мы выясняли, может ли она сказаться на работе белка ND6. Для этого существуют различные программы, мы, в частности, использовали программу SNAP.

Глава 3 Результаты и их обсуждение

Поиск нуклеотидной последовательности гена ND6

Для поиска нуклеотидной последовательности гена ND6 использовались три геномных базы данных. В базе UCSC этого гена не оказалось вовсе, хотя митохондриальный геном в ней представлен и, более того, другие гены ND семейства в этой базе найти можно. Разумеется, для дальнейшей работы эта база данных не использовалась. В базе Mitomap, посвященной исключительно митохондриальному геному человека, также обнаружился недостаток, который делает ее использование для наших целей, хотя и возможным, но крайне неудобным. Дело в том, что этот ресурс не позволяет напрямую по названию гена получить его нуклеотидную последовательность. Вместо этого приходится сначала из списка с названиями всех 37 генов координаты начала и конца нужного нам гена, а затем по этим координатам вручную выделить из всего митохондриального генома (длиной 16569 нуклеотидов) нужный участок.

Рисунок 1 – Результат поиска в системе Entrez Pubmed для запроса “mtnd6”. Вторая запись – ссылка на страницу с информацией о гене ND6 человека.

Наиболее удобным инструментом для поиска необходимой последовательности оказалась поисковая система Entrez Pubmed, осуществляющая поиск по базе данных NCBI, в которой представлены большинство секвенированных на настоящий момент геномов. Работа с поисковой системой проста и удобна: вводим в строку поиска название гена, результат получаем разделенный по группам (статьи, последовательности генов, белков, геномов, структура белков и многое другое), выбираем раздел «гены» (рисунок 1), в этом разделе выбираем ген ND6 нужного нам организма (Homo sapiens). Попадаем на страницу с различной информацией об этом гене (рисунок 2), где в разделе Genomic sequence, перейдя по ссылке Fasta или GeneBank, мы попадаем на страницу (рисунок 3), где представлена нуклеотидная последовательность искомого гена. Важным положительным моментом является то, что данная поисковая система предоставляет возможность изменения координат изображаемого геномного региона. Благодаря этому мы получили последовательность не только самого гена ND6, но и прилегающих к нему с двух сторон участков длиной 100 нуклеотидов, что необходимо для разработки маркеров.

Аминокислотную последовательность белка ND6 довольно легко можно найти в базе Mitomap – в ней после нуклеотидной последовательности всего митохондриального генома приведены координаты и аминокислотные последовательности всех митохондриальных генов.

Рисунок 2 – Изображение участка митохондриального генома человека, содержащего ген ND6.

Таким образом, хотя для работы с митохондриальными генами наиболее полная информация представлена в специализированной базе Mitomap, механизмы поиска в ней требуют улучшения, в частности, в ней не хватает инструмента для поиска нуклеотидной последовательности гена по его названию.

Рисунок 3 – Нуклеотидная последовательность гена ND6.

Подбор праймеров для амплификации гена ND6

Для подбора праймеров к данной нуклеотидной последовательности существует множество программ, в том числе и доступных он-лайн. Для решения нашей задачи мы использовали программу Primer3. Все, что требуется для работы с программой – вставить нуклеотидную последовательность и выделить квадратными скобками ту ее часть, которая является целевой для амплификации. Далее выбираем необходимые параметры праймеров (длина, температура отжига, содержание Г и Ц нуклеотидов, участки матрицы, к которой запрещен подбор праймеров, допустимый уровень самокомплементарности и т.д.) и на выходе получаем наилучшую из пар праймеров, соответствующих данным условиям, а также длину амплифицируемого фрагмента (рисунок 4).

Рисунок 4 – Результат подбора праймеров к гену ND6 с помощью программы Primer3

Далее полученную пару праймеров мы проверили с помощью другой программы (Oligoanalyzer на сайте eu.idtdna.com) для того, чтобы оценить их качество по различным параметрам. Эта программа позволяет определить температуру плавления пары праймер-матрица, стабильность (выраженную в изменении стандартной энергии Гиббса) шпилечных, гомо- и гетеродимерных структур, образуемых данным праймером и их специфичность путем выравнивания с различными геномами с использованием алгоритма BLAST (рисунок 5). Важным преимуществом этой программы перед некоторыми аналогами является то, что вводными данными являются не только последовательность праймеров, но и концентрации других компонентов ПЦР-смеси (в некоторых других программах для расчетов используются стандартные концентрации этих компонентов, и они не могут быть изменены пользователем). В результате проверки обоих праймеров с помощью этой программы было показано, что ни один из них не образует стабильных шпилечных или гомодимерных структур, образующийся гетеродимер также не является стабильным при температуре плавления праймеров, которая оказалась равной температуре, рассчитанной программой Primer3. Более того, оба праймера оказались специфичными в отношении гена ND6 именно человека.

Обе программы хорошо подходят для разработки или оценки качества праймеров. Главное преимущество Primer3 заключается в том, что она автоматически подбирает праймеры для данного участка ДНК, тогда как различные олигоаналайзеры, в том числе и рассмотренный здесь, позволяют только проверить соответствие праймеров определенным требованиям, тогда как выбор праймеров необходимо проводить вручную. Однако стоит отметить, что при некоторых специфических задачах без ручного подбора праймеров обойтись нельзя

Рисунок 5 Результат анализа праймера с помощью программы Oligoanalyzer.

Сравнение полученной последовательности со стандартной

После амплификации и секвенирования гена ND6 из образца ДНК больного Х, мы получили его последовательность в виде файла хроматограммы, в котором пики уже обработаны, и по ним определена нуклеотидная последовательность. Необходимо определить, имеет ли этот ген какие-либо замены по сравнению с кэмбриджской референсной последовательностью (rCRS) митохондриальной ДНК, принятой исследователями в этой области в качестве стандартной. Для этого мы загружаем rCRS с сайта mitomap.org в виде текстового файла, а потом открываем ее и файл с хроматограммой в программе ChromasPro. Кроме того, что эта программа может воспринимать данные о нуклеотидных последовательностях в разных форматах, она предоставляет ряд возможностей работы с этими последовательностями, в первую очередь выравнивание, в том числе и множественное, и поиск несоответствий в полученном выравнивании, а также поиск открытых рамок считывания, рестрикционных сайтов, трансляция нуклеотидной последовательности в аминокислотную и редактирование нуклеотидных последовательностей в режиме хроматограммы. С помощью ChromasPro мы нашли, что последовательность гена ND6 у больного Х отличается от rCRS по двум позициям: 14456 и 14582 (в обоих случаях выявлена замена А на Г) (рисунок 6).

Рисунок 6 – Результат сравнения последовательности гена ND6 больного Х и rCRS. На консенсусной последовательности, приведенной вверху, темным выделен нуклеотид, по которому сравниваемые последовательности различаются.

Основным достоинством программы ChromasPro, наряду с многофункциональностью, является ее удобный, интуитивно понятный интерфейс. Для пользования ей практически не требуется обучение или опыт работы с аналогичными программами.

Выявление функциональной значимости найденных замен

На следующем этапе мы определяли, могут ли обнаруженные замены приводить к нарушению функционирования белка ND6 и, соответственно, вызывать наблюдаемые у больного симптомы. Сначала был проведен поиск этих замен в базе данных Mitomap, в которой собраны все описанные мутации (замены, приводящие к нарушению функции) и полиморфизмы (замены, не сказывающиеся на активности того или иного белка). Среди описанных мутаций ни одна из двух замен не была найдена, а в списке полиморфизмов была обнаружена замена А-14582-Г. Следовательно, она не может являться причиной наблюдаемой клинической картины.

Для того, чтобы получить представление о возможной роли замены А-14456-Г в возникновении заболевания, мы сначала определили, приводит ли эта нуклеотидная замена к изменению аминокислоты в белке. Для этого использовалась он-лайн программа Virtual Ribosome (виртуальная рибосома). Важным преимуществом этой программы является то, что она может транслировать ДНК не только в соответствии с классическим генетическим кодом, но и в соответствии с 22 отличных от него вариантов генетического кода. Так как мы работали с митохондриальным геномом, то эта функция нам была необходима, ведь в этом случае мы имеем дело с неканоническим генетическим кодом. В результате мы получаем аминокислотную последовательность белка в однобуквенном формате. Далее, чтобы определить, имеются ли отличия в последовательности аминокислот между «нормальным» белком ND6 и тем белком, который образуется в организме больного Х, мы провели выравнивание этих двух аминокислотных последовательностей с помощью программы SIM, в которую просто вводятся две аминокислотные последовательности, требующие выравнивания. В результате программа выдает две выровненные последовательности, при этом позиции, одинаковые в обоих из них, помечаются знаком «*» (рисунок 8). В нашем случае белки отличаются по 2 позициям (рисунок): V31A и M73T. Первое отличие вызвано полиморфизмом А-14582-Г, о котором уже шла речь. Вторая замена – как раз та, функцию которой мы определяли с использованием программы SNAP [2]. Говоря о программе SIM, стоит отметить одно ее существенное неудобство – координаты позиций, по которым сравниваемые последовательности приходится отсчитывать вручную, так как никакого способа получить ее автоматически программа не предоставляет.

Рисунок 7 – Результат выравнивания двум аминокислотных последовательностей в программе SIM.

В качестве входных данных программой SNAP используются аминокислотная последовательность «нормального» белка (в нашем случае – белка, соответствующего rCRS) и аминокислотные замены в формате XposY, где X – аминокислота в «нормальном» варианте белка, pos – ее порядковый номер в последовательности и – аминокислота, на которую она заменилась в результате мутации (в нашем случае мы ввели в программу обе замены V31A и M73T, чтобы заодно проверить программу, предложив ей заведомо нейтральную замену). При предсказании последствий аминокислотной замены для функционирования белка программа основывается на смоделированной на основе его аминокислотной последовательности вторичной структуре, доступности данного участка белковой молекулы для растворителя и степени сходства между двумя аминокислотами. Особенностью программы SNAP является то, что результат она выдает не в окне браузера, а отправляет на введенный пользователем адрес электронной почты. Это связано со значительным временем, необходимым для проведения анализа, и, таким образом, позволяет, позволяет продолжить работу с браузером, не дожидаясь окончания анализа. К тому же, благодаря этому снижается вероятность случайной потери результатов.

Рисунок 8 – Результат оценки функциональной значимости двух аминокислотных замен в белке ND6 с помощью программы SNAP

Через некоторое время после подачи запроса нам на электронную почту пришел результат анализа, изображенный на рисунке 9. Он содержит следующую информацию: характеристику каждой из замен (нейтральная или нет), а также индекс надежности результата (отражает уровень «уверенности» программы в данном результате») и ожидаемая точность. Сразу стоит отметить, что пояснения касательно того, что представляют собой эти численные параметры, приведены только в статье с описанием программы, но не на сайте [2]. Тем не менее, по результатам SNAP анализа было показано, что замена V31A является нейтральной (что соответствует экспериментальным данным), а замена M73T вызывает нарушение функционирования белка ND6, причем этот результат имеет высокий индекс надежности. Следовательно, можно считать, что именно эта аминокислотная замена является причиной клинических проявлений, наблюдаемых у больного Х.

Заключение

Биоинформатика является молодой, но перспективной областью биологической науки, основной задачей которой является работа с большими массивами молекулярно-генетических данных, а также моделирование и предсказание свойств отдельных биологических молекул и целых биологических систем. Подходы, разработанные для применения в биоинформатических исследованиях, такие как методы работы с геномными базами данных, алгоритмы выравнивания последовательностей и предсказания вторичной структуры молекул нуклеиновых кислот и белков и их термодинамических параметров, могут применяться не только в биоинформатических ислледованиях, но и быть полезными в лабораторной молекулярно-генетической работе. В частности, подобные подходы были использованы нами в работе по поиску и функциональной характеристике мутаций в гене ND6 митохондриального генома человека. Применение биоинформатических инструментов позволило сравнительно быстро и эффективно найти в базе данных нужную нуклеотидную последовательность, подобрать к ней праймеры, проанализировать полученную в результате секвенирования последовательность и оценить влияние обнаруженных замен на функционирование соответствующего белка. В будущем можно ожидать интенсивного развития БИ, особенно в таких направлениях, как моделирование биологических систем, предсказание функций генов, систематика биологических объектов и выявление механизмов эволюции органического мира.

Список литературы к реферату

1. Achuthsankar SN, Computational Biology & Bioinformatics: A Gentle Overview. // Communications of the Computer Society of India, January 2007.

2. Bromberg Y and Rost B, SNAP: predict effect of non-synonymous polymorphisms on function. // Nucleic Acids Research – 2007, Vol. 35, No. 11, 3823–3835.

3. Doolittle RF, The Roots of Bioinformatics in Protein Evolution // 2010 PLoS Comput Biol 6(7)

4. Drubin DA et al., Designing biological systems. // Genes Dev. 2007 21: 242-254

5. Xuhua X, Bioinformatics and the cell. // Springer, 2007, 363

6. bio.fizteh.ru/student/files/biology/biolections/lection25.html

7. elementy.ru/lib/430895

Предметный указатель к реферату

B

BLAST · 8, 22

M

Mitomap · 2, 19, 20, 21, 23, 24

Б

базы данных · 2, 5, 6, 7, 19, 20, 21, 24, 26

биоинформатика · 3, 4, 5, 6, 7, 11, 13, 15, 17, 19, 27

В

выравнивание · 2, 5, 7, 8, 14, 19, 22, 23, 24, 26

Г

геном · 6, 8, 9, 14, 18, 19, 20, 21, 26

М

моделирование · 2, 4, 5, 6, 11, 12, 17, 18, 26

модель · 10, 17

С

системная биология · 2, 3, 6, 17

структура · 2, 10, 11, 12, 13, 15, 18, 21, 26

Интернет ресурсы в биологии

Ресурсы для поиска биологической информации

http:// www.ncbi.nlm.nih.gov/pubmed

Pubmed является самой популярной интернет базой ссылок на биологическую и медицинскую литературу. Она содержит примерно 20 млн ссылок на статьи из биологических журналов, литературу из национальной медицинской библиотеки США и он-лайн книги. Как правило, для каждой статьи (книги) приводится название, фамилии авторов, год публикации, название журнала и издательства, аннотация и ссылка на сайт издательства, по которой можно найти электронную версию статьи или книги. Кроме того, для каждой статьи эта база предлагает список статей сходной тематики или содержащие ссылку на рассматриваемую статью.

Pubmed позволяет осуществлять поиск по ключевым словам, имени и инициалам одного или нескольких авторов, году публикации, названию журнала, а также по комбинации этих характеристик.

Pubmed предоставляет пользователям и ряд дополнительных возможностей. Перейдя по ссылке My NCBI, можно создать свой аккаунт, в котором можно завести и редактировать свою коллекцию ссылок, а также сохранять поиск с возможностью получать на электронную почту обновление его результатов. С помощью Pubmed можно сохранять ссылки в формате, позволяющем импортировать их в программы управления библиографической информацией (например, Bibus, JabRef, CiteULike и др.).

Кроме того, имеется текстовое и анимированное руководство по пользованию базой.

Основным неудобством Pubmed является то, что, в базе представлены только англоязычные источники или те, которые имеют перевод названия и резюме на английский.

http:// blast.ncbi.nlm.nih.gov/Blast.cgi

BLAST (Basic Local Alighnment Search Tool) − это еще одна поисковая система, предоставляемая сайтом национального центра биотехнологической информации NCBI. База содержит нуклеотидные последовательности 1400 прокариотических геномов и 225 геном эукариот. С помощью BLAST можно осуществлять поиск конкретной нуклеотидной последовательности во всех или в выбранных геномах, представленных в базе. В таком случае пользователь получает информацию о том, в геноме каких организмов встречается искомая или схожая с ней последовательность, на какой хромосоме, в каком гене или межгенном участке она находится и каковы ее координаты, а также степень соответствия искомой и найденной последовательности. Также BLAST позволяет искать белковые молекулы по последовательности аминокислот или нуклеотидов и нуклеотидные последовательности (гены) по аминокислотной последовательности.

Кроме поиска нуклеотидных или аминокислотных последовательностей, BLAST предоставляет возможности для разработки ПЦР праймеров для определенной последовательности нуклеотидов; выравнивания 2х и более нуклеотидных последовательностей; поиска консервативных доменов в нуклеотидных последовательновтях и других операций.

Хотя для поиска последовательностей BLAST является одной из самых удобных и популярных он-лайн баз, дальнейший анализ последовательностей лучше осуществлять в геномных браузерах, так как они представляют последовательности в более наглядном, удобном и информативном виде (например, трудно выделить экзоны или какие-нибудь регуляторные элементы в последовательности гена).

http:// www.ncbi.nlm.nih.gov/sites/gquery

Entrez cross-database search – объединяет в себе возможности сразу нескольких поисковых систем, в том числе и двух описанных выше. Используя ключевые слова (например, название гена, вид организма, функция или заболевание), можно соответствующие литературные источники, связанные с ключевыми словами нуклеотидные последовательности ДНК и РНК, аминокислотные последовательности и 3D-структуру белковых молекул, возможные вариации в соответствующих генах и много другой полезной информации. Из недостатков данной поисковой системы можно отметить то же, что и для BLAST – некоторое неудобство работы с нуклеотидными последовательностями.

http:// www.mitomap.org/MITOMAP

Mitomap – специализированная база данных для работы с митохондриальным геномом человека. Позволяет просмотреть как весь митохондриальный геном целиком, так и любой его ген или некодирующий участок, аминокислотную последовательность того или иного белка, загрузить последовательность митохондриальной ДНК для работы в различных программах. Кроме того, с помощью Mitomap можно обнаружить описанные мутации различных типов и точки полиморфизма (и определить соответствующую им гаплогруппу) в любом участке митохондриального генома. Эта база является очень удобной в использовании и позволяет получить практически любую информацию, необходимую тем, кто работает с митохондриальной ДНК человека.

Ресурсы для работы с нуклеотидными и аминокислотными последовательностями

http:// www.bioinformatics.org/sms2/

Sequence Manipulation Suite – интернет ресурс, позволяющий осуществлять различные операции с нуклеотидными и аминокислотными последовательностями. Например, пользуясь этим сайтом, можно изменять формат нуклеотидной последовательности, избавляться от символов, не встречающихся в ДНК и белках, разделять последовательности ДНК на триплеты, получать комлементарные молекулы ДНК, переводить однобуквенные обозначения аминокислот в трехбуквенные и обратно.

С помощью этого ресурса можно также выравнивать нуклеотидные и аминокислотные последовательности, переводить нуклеотидную последовательность в аминокислотную и наоборот, искать определенные домены, в том числе CpG островки и открытые рамки считывания в ДНК. Sequence Manipulation Suite предоставляет возможности вычисления молекулярной массы и изоэлектрической точки белковых молекул, построения рестрикционных карт молекул ДНК и разработки ПЦР праймеров. Этот сайт будет полезен любому молекулярному биологу для планирования экспериментов и простой обработки результатов. Главное преимущество ресурса – его многофункциональность. Однако для многих из предоставляемых функций существуют другие, более совершенные программы с большими возможностями.

http://expasy.org/tools/

ExPASy Proteomic tools – самое полное (из известных мне) собрание компьютерных инструментов для анализа аминокислотных последовательностей и протеомных данных, созданное Швейцарским Институтом Биоинформатики (SIB). Кроме программ, разработанных в самом SIB и хранящихся на сервере института, на сайте представлены и ссылки на программы других разработчиков. Здесь можно найти инструменты для анализа данных масс-спектрометрии и двумерного электрофореза, определения белка по аминокислотной последовательности, молекулярной массе и изоэлектрической точке, расчета молекулярной массы и изоэлектрической точки белка по его аминокислотной последовательности, в том числе с учетом посттрансляционных модификаций. Есть также группа программ для перевода нуклеотидной последовательности в аминокислотную и обратно; поиска сходства между определенной последовательностью и последовательностями, представленными в базах данных; предсказания вторичной, третичной и четвертичной структуры, сигналов внутриклеточной локализации, сайтов посттрансляционных модификаций белков; визуализации третичной и четвертичной структуры белков, сравнения аминокислотной последовательности и третичной структуры двух или более белковых молекул и многого другого.

Важной положительной характеристикой сайта является то, что представленные программы разделены на группы, в зависимости от выполняемых ими функций. Кроме того, рядом с каждой гиперссылкой есть краткое описание программы и области ее применения.

Таким образом, данный ресурс предоставляет максимально широкие возможности работы с белковыми молекулами. Этот сайт будет полезен практически любому биологу, занимающемуся молекулярно-биологическими исследованиями.

http://biotools.umassmed.edu/bioapps/primer3_www.cgi

Primer3, по моему мнению, является наиболее удобной он-лайн программой для разработки ПЦР-праймеров к определенной последовательности ДНК. Она предлагает пары праймеров, удовлетворяющие параметрам, заданным пользователем. К числу варьируемых параметров относятся длина праймером, температура отжига, их расположение на введенной последовательности ДНК, размер ПЦР-продукта, содержание Г-Ц пар, степень самокоплементарности и комплементарности праймеров друг другу. Программа позволяет быстро и качественно подбирать праймеры для амплификации нужного участка ДНК.

Действующий личный сайт в WWW

vasilipankratov.narod.ru/

Граф научных интересов .

магистранта биологического факультета Панкратова В.С.

специальность биология

Смежные специальности

03.00.26 – молекулярная генетика

Молекулярная организация ядерного генома и структура гена.

Молекулярная организация геномов митохондрий и хлоропластов, молекулярные механизмы ядерно-цитоплазматических взаимодействий.

Секвенирование ДНК, генов, геномов

03.00.04 – биохимия

Макромолекулярная структура ДНК. Редупликация ДНК. ДНК-полимеразы. Функции ДНК.

Основная специальность

03.00.15 – генетика

Мутагенез и антимутагенез. Мутагенез как многокомпонентный и поэтапный процесс возникновения мутаций.

Нехромосомная наследственность. заимодействие ядерного и митохондриального геномов в процессе развития признаков. Полиморфизм хлоропластной и митохондриальной ДНК.

Популяционная и эволюционная генетика.

Медицинская генетика. Наследование признаков человека. Хромосомные мутации и наследственные болезни человека.

Сопутствующие специальности

нет

Вопросы по основам информационных технологий

Вопрос по специальности

<questiongroup groupname=«122BF-2» no=«122» mark=«1» amountrate=«1»>

<questions>

<question type=«sequence»>

<text>В какой последовательности нужно выполнять данные действия при поиске патогенной мутации в конкретном гене?</text>

<stoptime>false</stoptime>

<attachfile>false</attachfile>

<answers type=«request»>

<answer num=«5» right=«1»>Проверить наличие найденных замен в соответствующей базе данных</answer>

<answer num=«7» right=«1»>сделать вывод о наличии патогенных замен в изучаемом гене</answer>

<answer num=«2» right=«1»>подобрать праймеры для амплификации изучаемого гена</answer>

<answer num=«1» right=«1»>найти последовательность нужного гена в геномной базе данных</answer>

<answer num=«3» right=«1»>провести амплификацию и секвенирование</answer>

<answer num=«6» right=«1»>если найденная замена не описана — оценить ее влияние на функцию белка с помощью специального ПО</answer>

<answer num=«4» right=«1»>сравнить полученную последовательность с эталонной</answer>

</answers>

</question>

</questions>

</questiongroup>

Вопрос по общему курсу

<questiongroup groupname=«122BF-2» no=«622» mark=«1» amountrate=«1»>

<questions>

<question type=«correspondence»>

<text>Для каждого атрибута тега body подберите соответствующее свойство из языка CSS</text>

<stoptime>false</stoptime>

<attachfile>false</attachfile>

<answers type=«request»>

<set setsid=«1» setnumber=«1» no=«2»>bgcolor</set>

<set setsid=«2» setnumber=«1» no=«1»>vlink</set>

<set setsid=«3» setnumber=«1» no=«4»>text</set>

<set setsid=«4» setnumber=«1» no=«3»>alink</set>

<set setsid=«1» setnumber=«2» no=«1»>background</set>

<set setsid=«2» setnumber=«2» no=«2»>:visited</set>

<set setsid=«3» setnumber=«2» no=«3»>color</set>

<set setsid=«4» setnumber=«2» no=«4»>:active</set>

<reference setsfrom=«1» setsto=«1»/>

<reference setsfrom=«2» setsto=«2»/>

<reference setsfrom=«3» setsto=«3»/>

<reference setsfrom=«4» setsto=«4»/>

</answers>

</question>

</questions>

</questiongroup>

Презентация магистерской диссертации

Особенности митохондриального генома у больных анеуплоидиями

Список литературы к выпускной работе

1. Access 2000: самоучитель / П.Ю.Дубнев. – М.: ДМК Пресс, 2004. – 313 с., ил.

2. Access 2000: справочник / Гюнтер Штайнер; науч. ред. С.И.Молявко. – М.: Лаборатория Базовых Знаний, 2000. – 474 с.

3. Excel 2000 / Марк Зайден; науч. ред. А.Плещ, С.Молявко. – М.: Лабо-ратория Базовых Знаний, 1999. – 328 с., ил.

4. Microsoft Office 2000 / Стив Сагман; пер. с англ. А.И.Осипова, П.А.Мерещук. – М.: ДМК, 2002. — 669 c., ил.

5. Microsoft Office XP в целом: наиб. полное рук-во. Для широкого круга пользователей / Ф.Новиков, А.Яценко. – Спб: БХВ-Петербург, 2002. – 917 с., ил.

6. Microsoft PowerPoint 2003: самоучитель / М.В.Спека. – Москва, Санкт-Петербург, Киев: Диалектика, 2004. – 363 с., ил.

7. Microsoft Word 2003 в теории и на практике / С.Бондаренко, М.Бондаренко. – Минск: Новое знание, 2004. – 336 с., ил.

8. Windows 2000: проблемы и решения. Спец. справочник / Мэтью Штре-бе; пер. с англ.П.Анджан, А.Войтенко. – Спб: Питер, 2002 – 858 с.

9. Word 2000 / Марк Зайден; науч. ред. В.Гребнев, С.Молявко. – М.: Ла-боратория Базовых Знаний, 1999. – 336с., ил.

10. Ваш Office 2000: MS Word, MS Excel, Internet Explorer и др. / С.Баричев, О.Плотников. – М.: КУДИЦ ОБРАЗ, 2000. – 318 с., ил.

11. Информатика: учеб. для студ. вузов, обуч. по естеств.-науч. напр. и спец. / В.А.Каймин. – М.: ИНФРА-М, 2000. – 232 с., ил.

12. Компьютерные презентации: от риторики до слайд-шоу / Т.М.Елизаветина. – М.: КУДИЦ ОБРАЗ, 2003. – 234 с.

13. Освой самостоятельно Microsoft Excel 2000 = Teach Yourself Microsoft Excel 2000: 10 минут на урок: учеб. пособие: пер. с англ. / Дженнифер Фултон – М.: Издательский дом «Вильямс», 2000. – 224 с., ил.

14. Технологии работы с текстами и электронными таблицами: Word, Excel / М.С.Шибут; под ред. И.Ф.Богдановой. Минск: общественное объеди-нение «Молодежное научное общество», 2000. – 142 с.

15. Шафрин Ю.А. Информационные технологии: учеб. пособие: В 2 ч / Ю.А.Шафрин. – М.: Лаборатория Базовых Знаний, 2003. – Ч.1: Основы информатики и ИТ – 316 с., ил.

16. Шафрин Ю.А. Информационные технологии: учеб. пособие: В 2 ч / Ю.А.Шафрин. – М.: Лаборатория Базовых Знаний, 2003. – Ч.1: Офис-ная технология и ИТ – 336 с., ил.

Приложени е

Курсовые работы

В программу обучения на факультете биоинженерии и биоинформатики МГУ входит выполнение четырех курсовых работ (на 2-ом, 3-ом, 4-ом и 5-ом курсе). Курсовая работа – это самостоятельный проект, выполняемый студентом в сотрудничестве с научной группой или лабораторией. Выбор места выполнения курсовой работы и научного руководителя студент также делает самостоятельно. В файле по ссылке ниже содержится подробная информация о правилах курсовых работ на ФББ МГУ и советы, которые могут помочь сделать выбор научного руководителя и успешно выполнить работу:

Ссылка на список потенциальных научных руководителей

Информация о лабораториях для студентов ФББ

Ссылка на предложения курсовых проектов в АИС ФХБ

Курсовые работы – важнейшая часть образовательной программы, дающая студенту возможность научиться правильно и четко ставить научную задачу, находить адекватные методы её решения, а также освоить на практике современные методы и экспериментальные подходы биоинженерии и биоинформатики. Насколько успешно будет реализована эта возможность – зависит как от студента, так и от научного руководителя.

От научного руководителя курсовой работы ожидается, что он

  1. Ставит перед студентом задачу, решаемую в рамках курсового проекта
  2. Помогает студенту разработать план работы
  3. Обеспечивает студента всем необходимым для решения поставленной задачи (приборы, реактивы, программы и т.п.)
  4. Помогает студенту освоить все необходимые для решения задачи методы
  5. Разъясняет возникающие в ходе выполнения работы вопросы, помогает в решении проблем, обсуждает полученные результаты
  6. Консультирует студента по поводу оформления работы и подготовки доклада.

От студента ожидается, что он

  1. Изучит современное состояние той области научных исследований, частью которых является его курсовая работа
  2. Досконально разберется в поставленной задаче, будет четко представлять ее цели и смысл
  3. Будет активно взаимодействовать со своим научным руководителем, стараться как можно больше перенять его знания и опыт, задавать вопросы и просить разъяснений трудных для понимания аспектов
  4. В конце весеннего семестра защитит сделанную работу (см. ниже)

Обязательным требованием является наличие у научного руководителя (или хотя бы одного из руководителей) ученой степени. Кроме того, если выбранный руководитель не преподает на ФББ МГУ и не является сотрудником ФББ МГУ или НИИ ФХБ им. А.Н.Белозерского МГУ, то обязательно нужно найти со-руководителя с ФББ или из НИИ ФХБ. От со-руководителя требуется как минимум быть в курсе общего хода работы студента, поддерживать контакт с основным руководителем на случай возникновения проблем или конфликтов, и прочитать и дать комментарии на итоговый текст работы.

По всем организационным вопросам, связанным с курсовыми работами, вы можете обращаться  к куратору курсовых работ Людмиле Андреевне Зиновкиной (комн. 118 корпуса «Б», тел. 939-39-45, luzinovkina@gmail.com).

Порядок действий при планировании и выполнении курсовой работы:

1. Выбор научного руководителя и темы курсовой работы – до 25 мая предыдущего учебного года (список потенциальных научных руководителей)

2. Выполнения курсовой работы – в течение учебного года

— Работа с литературой (подбор литературы и написание литературного обзора)
— Практическая часть

3. Оформление работы – печатный вариант курсовой работы сдается за неделю до защиты.
Требования к оформлению печатного варианта курсовой работы стандартны:
Работа должна быть написана грамотно, на русском языке и аккуратно оформлена.
Работа должна содержать следующие части:

  • Титульный лист (образец оформления титульного листа  см. Приложение 1);
  • Оглавление;
  • Список сокращений (включающий использованные в тексте сокращения, за исключением общепринятых);
  • Введение (в котором кратко изложено содержание работы);
  • Обзор литературы (в котором описано современное состояние исследуемой проблемы со ссылками на первоисточники);
  • Цели и задачи исследования
  • Материалы и методы (применяемые в работе методы должны быть описаны подробно и четко на столько, чтобы при необходимости их можно было повторить);
  • Результаты экспериментальной работы;
  • Обсуждение (в некоторых случаях результаты можно обсудить, сравнив их с литературными данными; иногда в обсуждении логично предложить возможное объяснение полученным результатам или выдвинуть план дальнейших экспериментов);
  • Выводы (пишутся максимально четко);
  • Список литературы (оформляется одним из общепринятых способов).

4. Получение внешней рецензии (ТОЛЬКО для студентов 4-го и 5-го курсов) – рекомендуется заранее выбрать рецензента, заручиться его согласием и  передать работу  на рецензию за несколько дней до защиты.

5. Защита курсовой работы (даты зависят от выбранной формы отчетности – см. ниже)

             
Отчетность по курсовым работам:

  1. Как только определились руководитель и тема курсовой работы, студент должен сдать заявление, содержащее информацию о теме, научном руководителе и месте выполнения работы (Приложение 2) – сдается до 15 сентября Л.А.Зиновкиной или в учебную часть.
  2. Промежуточный отчет (Приложение 3)  – сдается до 25 декабря Л.А.Зиновкиной или в учебную часть.
  3. Защита курсовой работы. На 2-ом и 3-ем курсах  за курсовую работу ставится «зачет», а на 4-ом и 5-ом – оценка. Для защиты курсовой работы необходимо:
  • сдать текст курсовой работы (печатный и электронный варианты);
  • предоставить отзыв руководителя с оценкой работы – в устной или письменной форме (письменный отзыв руководителя предоставляется обязательно на 4-ом и 5-ом курсах)
  • предоставить отзыв внешнего рецензента  (ТОЛЬКО студентам 4-го и 5-го курсов)
  • защитить работу. 

Существует три альтернативных варианта защиты:

  • В форме доклада на конференции «Ломоносов» (устный или стендовый доклад для студентов 2-го-3-го курсов, УСТНЫЙ доклад – для студентов 4-го и 5-го курса), конференция обычно проходит в середине апреля
  • В форме доклада на студенческой конференции  факультета (устный или стендовый доклад для студентов 2-го-3-го курсов, УСТНЫЙ доклад – для студентов 4-го и 5-го курсов), конференция обычно проходит в конце апреля. Для участия в конференции нужно подать заявку на участие,  сдать текст курсовой для рецензирования и отзыв руководителя в заранее объявленные сроки – следите за информацией на сайте.
  • В форме доклада перед комиссией. Защиты курсовых проводятся в конце апреля — начале мая. Тексты курсовых необходимо сдать за неделю до защиты.

Если студент до защиты на 3-ем курсе ни разу не делал постер для конференции, то результаты курсовой работы на 3-ем курсе в обязательном порядке оформляются в виду постера. Этот постер сдается в электронном виде в дополнение к докладу на защите.

Как минимум один раз на 2-ом или 3-ом курсе студент должен представить результаты своей курсовой работы в виде постера. Это является обязательным условием получения зачета за курсовую работу на 3-ем курсе.


версия для печати

 

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *