学习生信的系列教程

来源:互联网 发布:淘宝网积分换土豆会员 编辑:程序博客网 时间:2024/06/05 10:46

欢迎关注生信宝典,数万小伙伴一起学生信!http://mp.weixin.qq.com/s/VguRtaGpEcaNzmZEi48gLg

生信的作用越来越大,想学的人越来越多,不管是为了以后发展,还是为了解决眼下的问题。但生信学习不是一朝一夕就可以完成的事情,也许你可以很短时间学会一个交互式软件的操作,却不能看完程序教学视频后就直接写程序。也许你可以跟着一个测序分析流程完成操作,但不懂得背后的原理,不知道什么参数需要修改,结果可以出来,却把我不住对还是错。

学习生信从来就不是一个简单的事,需要做好持久战的心理准备。

在学习时,我们都希望由浅入深的逐步深入,不断地练习和实践,这就是为什么我们需要一本书,因为书很系统。但生信发展的历史短于计算机编程的历史,如果想要一门程序设计的入门数据,每种语言都可以找到几本。但想要一个囊括生信的书,就有些难了。本身生信跨领域,需要多学科的知识,而其内部又有不少分子,都囊括了太大,包括的少又有些隔靴搔痒的感觉。

我们当时都是零基础下自学Linux, 自学Python,自学R,自学高通量测序;这些学习经历,之前都零星地记录在博客里。现在回头去看几年前自己记录的东西,觉得好简单,而当时却费了很大的力气。这些零星的随手记,当时也只是为了自己看,到现在确实只有自己能看得懂,不便惠及更多的人。

因此我们创建了生信宝典,希望从不同的角度传播知识。这个不同有三点含义,一是形式上的不同,摒弃之前主编们单人作战想写啥就写啥,而是有组织有计划的内容聚合,提供一系列的教程,由入门到提高。二是内容的不同,不去用网上现有教程的通用数据做例子,而是拿实际生物数据,讲述如何解释生信中普遍碰到的问题,讲述如何处理自己的数据。三是立足点不同。在写作时,我们回到了当年,在回忆中用整个阶段的学习去指导当初的那个小白,从那些会了的人觉得微不足道而不会的人又迈不过的坎入手,直击痛点。知识点的收录依据不是是否炫酷,是否难,而是是否必要。如果必要,再简单,也要提及;如果不必要,再炫酷,也暂不纳入。

通过大量的生信例子、关键的注释和浓缩的语句形成下面的一系列学习教程。每一篇内容都不多,可以当做小说阅读,也可以跟着去练,反复几遍,每读一次都会有不同的收获和体会。

程序学习心得

  • 生物信息之程序学习
  • 如何优雅的提问
  • 生信宝典视频教程
  • 好色之旅-画图三字经

Linux 学习

  • 文件和目录
  • 文件操作
  • 文件内容操作
  • 环境变量和可执行属性
  • 管道、标准输入输出
  • 命令运行监测和软件安装
  • 常见错误和快捷操作
  • 文件列太多,很难识别想要的信息在哪列?
  • 文件排序和FASTA文件操作
  • 用了Docker,妈妈再也不担心我的软件安装了 - 基础篇
  • Linux服务器数据定期同步和备份方式
  • 不用Linux也可以的强大文本处理方法
  • 又双叒叕一个软件安装方法
  • 查看服务器配置信息

R统计和作图

  • 入门环境Rstudio
  • 热图绘制 (heatmap)
  • 基础概念和矩阵操作
  • 热图简化
  • 热图美化
  • 线图绘制
  • 线图一步法
  • 箱线图(小提琴图、抖动图、区域散点图)
  • 箱线图一步法
  • 火山图
  • 富集分析泡泡图 (文末有彩蛋)
  • 散点图绘制
  • 一文看懂PCA主成分分析
  • 富集分析DotPlot,可以服
  • 韦恩图
  • 柱状图
  • 图形设置中英字体
  • 教师节献礼 - 文章用图的修改和排版
  • 非参数法生存分析
  • 文章用图的修改和排版(2)

NGS基础

  • NGS基础 - FASTQ格式解释和质量评估
  • NGS基础 - 高通量测序原理
  • NGS基础 - 参考基因组和基因注释文件
  • NGS基础 - GTF/GFF文件格式解读和转换
  • 本地安装UCSC基因组浏览器
  • 测序数据可视化 (一)
  • 测序文章数据上传找哪里

NGS分析工具评估

  • 39个转录组分析工具,120种组合评估(转录组分析工具哪家强-导读版)
  • 39个转录组分析工具,120种组合评估(转录组分析工具大比拼 (完整翻译版))
  • 无参转录组分析工具评估和流程展示

癌症数据库

  • UCSC XENA - 集大成者(TCGA, ICGC)
  • ICGC数据库使用
  • TCGA数据库在线使用

Python学习

  • Python学习极简教程 (一)
  • Python学习教程(二)
  • Python学习教程(三)
  • Python学习教程 (四)
  • Python学习教程(五)
  • Python学习教程 (六)
  • Pandas,让Python像R一样处理数据,但快
  • Python解析psiBlast输出的JSON文件结果

NGS软件

  • Rfam 12.0+本地使用 (最新版教程)
  • 轻松绘制各种Venn图
  • ETE构建、绘制进化树
  • psRobot:植物小RNA分析系统
  • 生信软件系列 - NCBI使用
  • 去东方,最好用的在线GO富集分析工具

Cytoscape网络图

  • Cytoscape教程1
  • Cytoscape之操作界面介绍
  • 新出炉的Cytoscape视频教程

分子对接

  • 来一场蛋白和小分子的风花雪月
  • 不是原配也可以-对接非原生配体
  • 简单可视化-送你一双发现美的眼睛
  • 你需要知道的那些前奏

生信宝典之傻瓜式

  • 生信宝典之傻瓜式 (一) 如何提取指定位置的基因组序列
  • 生信宝典之傻瓜式 (二) 如何快速查找指定基因的调控网络
  • 生信宝典之傻瓜式 (三) 我的基因在哪里发光 - 如何查找基因在发表研究中的表达

生信人写程序

  • 生信人写程序1. Perl语言模板及配置
  • 生信人写程序2. Editplus添加Perl, Shell, R, markdown模板和语法高亮

小技巧系列

  • 参考文献中杂志名字格式混乱问题一次解决

友情链接流程

宏基因组 - 扩增子分析流程

  • 质控,实验设计,双端序列合并 查看原始数据的质量,编写合格的实验设计用于分析,双端序列合并为单端的扩增子序列;
  • 提取barcode,质控及样品拆分,切除扩增引物 将Barcode序列从序列中拆除,筛选高质量的测序结果并标记文库中每条序列中的样品来源,最后切除扩增时使用的引物;
  • 格式转换,去冗余,聚类 转换QIIME生成fasta格式为Usearch要求格式;使用Usearch对序列去冗余并筛选高丰度,极大降低下游计算量和去除噪音;最后使用用Usearch聚类生成OTU,默认会组内自动去除大量嵌合体;
  • 去嵌合体,非细菌序列,生成代表性序列和OTU表 本讲详细讲了嵌合体的概念,并使用参考数据库去除嵌合体;学习基于参数数据库筛选细菌序列,这些都是可选的操作,根据实际情况决定是否需要,最终生成高质量的OTU序列作为参考序列;
  • 物种注释,OTU表操作 这部分采于不同数据库进行细菌或真菌注释;同时根据实际情况,对OTU表进一步按样品、丰度、物种等条件筛选;
  • 进化树,Alpha,Beta多样性 将OTU多序列比对生成进化树,为依赖进化关系的计算方法提供输入文件;再进行多种Alpha和Beta多样性的计算;
  • 物种分类统计,筛选进化树和其它 对物种进行分类统计,筛选高丰度结果用于进化树展示,和其它用于R统计分析的结果生成。

生信媛 - Biostar handbook

  • 手把手教你入门生信——The Biostar Handbook
  • 课程1、2-Linux中生信分析常用命令入门
  • 课程3、4-NCBI的Entrez Direct和SRA toolkit的安装及使用
  • 课程5、6-编写可重复使用的脚本
  • 课程7、8-二代测序质控:fastqc、prinseq、trimmomatic、seqtk
  • 课程9、10-测序文件的质控&在线序列比对
  • 课程11、12-下载序列,建blast数据库以及本地blast
  • 课程13、14-常用的mapping软件bwa & sam格式简介
  • 课程15、16-samtools简介&利用readseq对GenBank文件格式转换
  • 课程17、18-awk进行简单的编程&序列比对软件bwa和bowtie2
  • 课程19、20-利用samtools mpileup和bcftools进行SNP calling
  • 课程21、22-使用samtools和FreeBayes进行变异的calling并用snpEff注释
  • 课程23、24-SNP calling
  • 课程25、26-bedtools的安装和使用
  • 课程27、28-RNAseq分析
  • 课程29、30(大结局)-差异表达分析以及用ErmineJ做GO

Biobabble - ChIP-seq

  • CS0: ChIPseq从入门到放弃
  • CS1: ChIPseq简介
  • CS2: BED文件
  • CS3: peak注释
  • CS4:关于ChIPseq注释的几个问题
  • CS5: 吃着火锅,唱着歌,还把分析给做了

招聘

  • 易汉博欢迎您加入

联系我们


学习生物学