/XSLab-docs

上科大刘雪松课题组基因组学分析传承与分享知识库

url public
01-readme
1

前言

All Contributors

放宽眼界,摆低姿态。认真学习,踏实研究


在正式做研究之前,读一读理查德·汉明《你和你的研究》

在提问之前,读一读《提问的艺术》


生物信息学作为一门交叉学科,所需要掌握的知识呈现多、乱、杂的状态。为增强知识的系统性学习和检索,由Liulab分析成员一起编辑本仓库,提供入门建议和分类知识的Roadmap,帮助初学者快速入门,同时也帮助自身记录和分享知识。


目录:

  • TOC {:toc}

入门建议

生物信息学学习有4块核心:

  • Linux操作系统知识
  • 数据处理编程语言
  • 统计学
  • 研究背景

研究背景是工作的方向,但对于一个研究生而言课题常常由导师指定,因此该部分的学习一般是通过阅读文献和自己对于课题的探索而逐步深入的。

统计学在生物信息学乃至生物学中都是极为核心的一部分,不过当前科学界普遍存在p值的滥用和缺乏一些深厚的统计学素养,因此学习时应当额外注意对统计基本概念的理解,应当掌握假设检验p值置信区间参数检验与非参数检验多重校正等知识。这些知识可以通过大学本科的概率论与数理统计教材以及生物统计学教材获得,另可参考生物统计学与R手册

Linux操作系统知识可以分为两块:一是基本的Linux操作与管理,可参考《鸟哥的私房菜-基础篇》进行学习;二是Linux Shell编程,用以处理文本数据流,可参考《优雅的Linux>>Shell笔记与探索》进行学习。《Linux数据处理命令工具》一文有一些重要Linux命令的讲解。

最后,学习和使用数据处理编程语言一般是工作的核心。目前主流有2门用于生信领域的语言:Python和R。学习应以其中一门为主,下面列出一些参考书目。

Python:

R:

最后推荐一些资源仓库:

Roadmap

云资源

Github仓库

基础学习

数据分析

Pipeline

贡献

本仓库只允许Liulab组内人员编辑与修改,其他人员可以提交issue进行报告,经过审核后报告人将加入Contributors。

如何添加

使用Github issue

在Github issue中新建并按下列格式评论:

@all-contributors please add <username> for <contributions>

使用命令

参考文档安装yarn,然后添加:

# Add new contributor <username>, who made a contribution of type <contribution>
yarn contributors:add add <username> <contribution>
# Example:
yarn contributors:add add jfmengels code,doc

许可协议

  • 文档: 知识共享-署名-非商业性-禁止演绎(CC-BY-NC-ND)
  • 代码: Apache

非Liulab成员的研究工作如果使用到该仓库的文档或代码,请在文章中引用Liulab最新发表文章或致谢,谢谢。

Contributors

Thanks goes to these wonderful people (emoji key):

Chauncy Wang
Chauncy Wang

💻 🤔 🚧

This project follows the all-contributors specification. Contributions of any kind welcome!