hse21_H3K36me3_G4_human

Целью работы над проектом является поиск и изучение участков генома, где гистоновая метка H3K36me3 присутствует в местах образования вторичной структры ДНК G4.

Гистограмма длин участков до конвертации (версия генома human(hg38), ChIP-seq эксперимент ENCFF655QDU)

Количество пиков - 147306

alt-text

Гистограмма длин участков после конвертации (версия генома human(hg19), ChIP-seq эксперимент ENCFF655QDU)

Количество пиков - 147202

alt-text

Гистограмма длин участков до конвертации (версия генома human(hg38), ChIP-seq эксперимент ENCFF257ZFX)

Количество пиков - 70267

alt-text

Гистограмма длин участков после конвертации (версия генома human(hg19), ChIP-seq эксперимент ENCFF257ZFX)

Количество пиков - 70246

alt-text

Установим порог на длину 7000

Гистограмма длин участков после фильтрации (ChIP-seq эксперимент ENCFF655QDU)

Количество пиков - 145784

alt-text

Гистограмма длин участков после фильтрации (ChIP-seq эксперимент ENCFF257ZFX)

Количество пиков - 70055

alt-text

Пики гистоновой метки относительно аннотированных генов (ChIP-seq эксперимент ENCFF655QDU):

alt-text

Пики гистоновой метки относительно аннотированных генов (ChIP-seq эксперимент ENCFF257ZFX):

alt-text

Объединяем два набора отфильтрованных ChIP-seq пиков с помощью утилиты bedtools merge. Перед этим сортируем единый .bed файл. Для этого используем команду "cat *.filtered.bed | sort -k1,1 -k2,2n | bedtools merge > H3K36me3_HEK293.merge.hg19.bed"

Анализ участков вторичной стр-ры ДНК

Скачиваем файл со вторичной стр-рой ДНК G4_seq_Li_K (т.к файлов несколько, необходимо объединить их командой "cat *.max.K.w50.25.bed | sort -k1,1 -k2,2n | bedtools merge > G4_seq_Li_K.bed")

Распределение длин участков вторичной стр-ры ДНК:

Количество пиков - 428624

alt-text

Расположение участков стр-ры ДНК относительно аннотированных генов

alt-text

Анализ пересечений гистоновой метки и стр-ры ДНК

Распределения длин пересечений:

alt-text

Их количество - 28624

Ссылка на сессию в геномном браузере: http://genome.ucsc.edu/s/nicka1106/hse21_H3K36me3_G4_human

Скриншоты мест, где есть пересечение между гистоновой меткой и структурой ДНК:

alt-text

Соответствующие геномные координаты: chr1:3,561,656-3,563,766

alt-text

Соответствующие геномные координаты: chr1:1,452,583-1,458,915

Ассоциация полученных пересечений с ближайшими генами

Кол-во пиков, которые удалось проассоциировать с генами - 759 Общее кол-во уникальных генов - 552

Наиболее значимые категории, найденные в ходе GO-анализа:

  1. mitochondrial translation
  2. detection of chemical stimulus
  3. mitochondrial translational termination
  4. protein-containing complex disassembly
  5. mitochondrial gene expression

Полный список категорий находится в файле pantherdb_GO_analysis.txt image