/ngs_learning

生物信息学交流资料

生物信息学交流QQ群 入群须知

目录

入群方式

  1. 可以通过在知乎购买知乎Live加群,加群验证信息在生物信息学知乎Live的最最最下面,购买地址:https://www.zhihu.com/lives/users/d75e3cc0c84c322ae56d2e010e4d8e9e

  2. 可以通过购买腾讯云课堂的付费课程入群 http://ngs.ke.qq.com/

基本内容

  1. 请大家修改自己的备注名称, 姓名-学校/工作单位-专业方向, 方便大家交流。 如果不修改的话,我们大约1周清1次人。

  2. 提问的正确姿势: 大家在问问题的时候,一定要问具体的问题,比如:我在使用XX软件的时候,输入的命令是XXX,结果报错,报错的信息是XXXX,系统是Ubuntu 16.04。 一定要给出输入,输出,报错信息!

  3. 提问的错误姿势: 不要问类似,大家有没有用过XXX?

  4. 学习建议 其实现在网上有很多资料,前期的原理入门都可以自己搞定,群里更多的是可以为你提供经验的帮助。比如,在不知道选A还是选B的时候帮助你做选择,而不是直接告诉这个题有2个选项,然后再告诉答案~

活用Google

此部分由LZ老哥编写

如何访问google [此部分感谢丽姐的帮助!]

  1. 目前google科学上网最常用的办法是修改本机的hosts,具体可以参考 https://laod.cn/hosts/2018-google-hosts.html

  2. 另外,还可以使用一些现成的工具,具体请看这里 https://mp.weixin.qq.com/s/qOZIK_6-7EHcPi6aAJUKTg

  3. 如果是windows操作系统,可以直接使用下面的工具!链接:https://pan.baidu.com/s/1siZGIQMvOcCywMpTti7GaQ 提取码:yo92 [感谢苗苗的提供!]

有问题 先google

大家遇到的问题往往在google上已经有答案了,先问问google再问人比较好,这样自己能提高检索能力,也学到姿势,还能让提问更有效率和价值

下面是检索方法,都是经验,大家有值得分享的请继续补充!

一、直接检索法

比如:今天有人问,服务器挂了怎么办? 完全就可以搜索 how to boot a linux server
或者 linux server can not start 或者 how to repait a linux server boot
往往能找到答案。

二、关键词循序渐进法

  1. 先用英语专业词汇的关键词检索,以R进行p值校正为例,使用关键词为R p value Correction填入google检索。

  2. 在结果列表找一下,发现前几个链接好像都说了怎么算 ,挨个点开看看,发现网页http://sphweb.bumc.bu.edu/otlt/MPH-Modules/BS/R/R-Manual/R-Manual22.html 上有明确的办法R语言进行p值校正的示例。这就找到了答案。

  3. 有时候找不到问题解决办法,这时要注意一下,是不是其他人描述这个问题用的英语词汇跟自己不一样,更换其他人的描述词汇再试一下,往往会搜到更多的答案。

  4. 如果遇到第一次的关键词就不会的情况,我一般先去**知网搜中文关键词,然后看对应的文献里面提到的英文关键词是啥,或者查查一下Mesh词表,根据从Mesh词表查到的关键词再去google。

三、中英文混杂检索

当你想研究某个领域或者工具的时候,不用一开始执着于英文。可以拿中文作为跳板,先掌握一些最基础的概念,然后再用英文搜索。比如你想要了解samtools,可以先搜索 samtools文档这几个字,会出来一些个人翻译的文档,了解一些最最基础的内容后,再去看原文文档。

直播录像内容

第1次Live上机录像:2017-06-26-R语言相关内容补充

网址

https://www.bilibili.com/video/av11655592/

主要内容

  • R语言背景介绍(1:00 - 24:00)
  • R studio 代码演示RNA-Seq相关图的制作 (25:00 - 75:00)

第2次Live上机录像:2017-08-04-高通量测序技术交流录像

网址

https://www.bilibili.com/video/av12969326/

主要内容

  • Linux基础操作 (1:00 - 20:30)
  • conda的安装与调试 (20:30 - 24:30)
  • 参考基因组的下载与bowtie2 index的建立 (24:45 - 41:00)
  • RNA-Seq的分析流程 (41:30 - 75:00)
  • PCA的原理与实现 (76:00 - end)

第3次Live上机录像:20170904-ChIP-Seq实验背景与数据分析

网址

https://www.bilibili.com/video/av14178191/

主要内容

  • ENCODE计划 (6:30 - 7:30)
  • ChIP-Seq技术 (7:40 - 13:00)
  • Hi-C技术(13:30 - 15:40)
  • FAIRE-Seq (15:40 - 24:00)
  • CLIP 技术(24:00 - 26:00)
  • 从ENCODE上下载数据 (26:40 - 33:00)
  • ChIP-Seq的标准分析流程 (34:00 - 100:00)

第4次Live上机录像:2017-10-09-UCSC Genome Browser 和 WashU Genome Browser

网址

https://www.bilibili.com/video/av15253446/

主要内容

  • Vim的介绍与配置(1:00 - 21:00)
  • 数据的标准格式fasta,fastq,bed,bam,sam,bigwig (22:00 - 40:00)
  • 数据库的选择(42:00 - 46:00)
  • 千人基因组数据库 (48:00 - 54:00)
  • TCGA数据库 (55:00 - 60:00)
  • GTEx (60:00 - 66:00)
  • UCSC genome browser (66:00 - 86:00)
  • Wash U genome browser (87:00 - 110:00)

第5次Live上机录像(第1部分):20171030-学习Python做生信-Python基础入门

网址

https://www.bilibili.com/video/av15887563/

主要内容

  • Python的安装[linux,windows](0:00 - 5:00)
  • Python的基础操作[赋值,加,减,乘,除,乘方,取余等] (5:00 - 14:00)
  • Python的数据类型与基本操作[int,str,list,dict等] (14:00 - 54:00)
  • Python的循环语句与判断[while,for,if...elif...else] (54:00 - 68:00)
  • Python的自定义函数[def](69:00 - 79:00)
  • Python的文件读写[open] (80:00 - 95:00)

课程PPT及第1部分作业要求及答案:


第5次Live上机录像(第2部分):20171030-教你用snakemake搭pipeline

网址

https://www.bilibili.com/video/av15908415/

主要内容

  • snakemake的优势(00:00-03:00)
  • snakemake的基础格式(03:00-09:00)
  • 一个简单的snakemake流程(09:00-12:34)
  • 如何运行一个snakefile(12:34-17:51)
  • 把tophat2-cufflinks-cuffdiff写成一个snakemake流程(22:20-50:00)

第5次Live上机录像(第3部分):20171106-学习Python做生信-实战练习

网址

https://www.bilibili.com/video/av16064125/

主要内容

  • 第1次直播作业的讲解,统计人类线粒体序列中长度及各种碱基的个数(0:00 - 22:00)
  • FASTQ格式转到FASTA格式(22:00 - 45:00)
  • FASTA格式的读取(45:00 - 59:00)
  • 探索人类基因组的长度,N区域,GC含量等信息,提取基因组的序列(59:00 - 97:00)
  • 探索人类转录组的exon总长度(98:00 - 128:00)

视频番外1:20171026-基于BWT算法的比对软件原理解析(BWA & Bowtie & Bowtie2)

网址

https://www.bilibili.com/video/av15743137/


第6次Live上机录像(第1部分,共2部分):2017-11-30-R语言入门与基础绘图系统 Part I

网址

https://www.bilibili.com/video/av16817175/

主要内容

  • R 语言的入门 (8:00 - 40:00)
  • R 语言基础绘图系统,绘制histgram和barplot (40:00 - 66:00)
  • R 语言绘制RNA-Seq两个样本FPKM的Scatter plot (67:00 - 77:00)

第6次Live上机录像(第2部分,共2部分):2017-12-03-R语言基础绘图详解heatmap与volcano plot

网址

https://www.bilibili.com/video/av16922046/

主要内容

  • 手把手教你,用R语言绘制RNA-Seq中Cuffdiff结果的volcano plot(1:00 - 63:00)
  • 手把手教你,用R语言写一个画热图的函数并可视化Hi-C数据(63:00 - 127:00)
  • 手把手教你,从热图中选择感兴趣的区域(127:00 - 135:00)

视频番外2:2018-01-07 生物信息学教程-GO, KEGG, DO富集分析

网址

http://www.bilibili.com/video/av18311108/

主要内容

  • RNA-Seq的分析概览 (4:40 - 9:30)
  • 什么是Gene Ontology(GO),什么是GO富集分析 (10:00 - 26:00)
  • 使用R语言读取cuffdiff结果并选择差异表达基因 (28:00 - 40:00)
  • GO富集常用的网站工具,DAVID与EnrichR (40:00 - 50:00)
  • 安装调试做GO需要用的R包 (50:00 - 55:00)
  • 使用R语言对RNA-Seq的结果做GO,KEGG,DO富集分析 (55:00 - 80:00)
  • 对于有参非模式生物的注释文件的搜索与下载(80:00 - 90:00)

第7次Live上机录像:2018-02-05-转录组进阶分析

网址

https://www.bilibili.com/video/av19929350

主要内容

  • RNA-Seq的本质是什么?
  • RNA-Seq寻找差异基因是为了干什么?
  • Raw Count是什么东西?怎么算?
  • FPKM/TPM是什么东西?怎么算?
  • Cuffdiff的原理
  • DESeq2的原理及代码分享

第8次Live上机录像:2018-05-R与Bioconductor的入门课

网址

https://www.bilibili.com/video/av24355734

主要内容

  • Bioconductor官网中都有哪些干货,应该怎么学习?
  • 如何安装Bioconductor中的包?
  • Bioconductor分析基础之GRange到底能干点什么?
  • 如何使用BioStrings处理序列信息?
  • 如何获得任意一段human genome的序列信息?
  • 如何统计human各条染色体的长度及GC含量?
  • 如何使用rtracklayer读取文件(以GTF文件为例)?
  • 如何将不同版本的基因组坐标进行互相转换?
  • 如何将公共数据的ChIP-Seq peak信息与基因结构信息进行批量可视化?
  • 如何使用GEOquery获取发表数据信息?