Wenlong Shen's Blog

不宠无惊过一生

Deep Learning Book 学习笔记(5)

Machine Learning Basics

学而不思则罔,思而不学则殆。 学习算法 所谓机器学习,“学习”是什么?Mitchell提供了一个简洁的定义:“对于某个任务T和性能度量P,一个计算机程序被认为可以从经验E中学习是指,通过经验E得到改进后,它在任务T上由性能度量P衡量的性能有所提升。” 任务T从实际操作的角度来说,指的...

Deep Learning Book 学习笔记(4)

Numerical Computation

公式推导好看,数值计算好用。 上溢和下溢 数学推导是美的,连续函数是理想的,计算机却做不到完美,随机函数不随机,有限数位有误差。当操作复杂时,即使理论可行,也可能由于程序中没有考虑误差的累积而导致算法失效。上溢(overflow)是指数值过大近似为无限,进一步计算通常会成为非数字(no...

Deep Learning Book 学习笔记(3)

Probability and Information Theory

一切都是随机事件,听天由命吧~ 为什么要使用概率? 人有大概率犯傻,机器却小概率犯错,这也许是人工智能一直“不像人”的片面原因。概率论和信息论是现代工业最重要的学科,几乎所有的人类活动都面临着在不确定的情况下进行推理的需求,究其原因大抵这三种:观察的不完全性、模型的不完全性、系统的内部...

Deep Learning Book 学习笔记(2)

Linear Algebra

线性代数是基础啊,多年未看,重新翻翻书吧。 标量、向量、矩阵和张量 标量(scalar)即为单独的数。向量(vector)是一列数,有序排列,能够索引,如向量\(x\)中的第一个元素\(x_1\),需要明确表示时,可用如下形式: \[x=\begin{bmatrix} x_1 ...

Deep Learning Book 学习笔记(1)

Introduction

这本书Deep Learning来自Ian Goodfellow,Yoshua Bengio和Aaron Courville,免费开源,且有github中文版,是一本不可多得的机器学习教材,在这里留下学习笔记以勉励自己。 工具,机器,人工智能 人类之所以为人类,是因为突破了自身的体力、...

关于RPKM/FPKM和TPM

RNA-Seq数据的标准化

These three metrics attempt to normalize for sequencing depth and gene length. 测序数据的标准化/归一化是生物信息学分析的必要步骤,可根据生物问题或是技术手段的不同而采取不同的策略进行。对于RNA-seq,常见...

Phylogenetic Trees

系统发生树

一灯长夜佛前明,庭树枝多宿鸟争 生物的起源与进化,种群的分布与扩散,一直是领域内的研究热点。但是如何描述、评价多物种或基因之间的远近亲疏关系?“树”的思想很好地解决了这一问题,同时也催生了系统发生学分析方法。而对于我们来说,利用该分析方法进行基因组不同元件之间历史进化关系的鉴定和识别,是...