Wenlong Shen's Blog

不宠无惊过一生

DNA Sequence Motifs

DNA序列模体

漫天繁星,你却只寻找那偏爱的motif… 一致性序列 如果基因组DNA是生命的设计图,那转录因子(再加上核酸酶等)就像小黄人一样,将各个重要部件解构出来。然而转录因子数量众多、功能不同,他们如何知道自己应该结合于基因组的位置,这就得依靠DNA序列motif来标识。下图即是CTCF的结合...

Bayesian Networks

贝叶斯网络

互相依赖又互相独立,生物网络在混沌之中维持着平衡,一切皆是概率,一切皆有分布… 万物皆网 转录调控、代谢通路、疾病诊断…有太多的生物学系统能够以网络的形式呈现,而面对各种变量间彼此因果、依赖、独立的关系,贝叶斯当仁不让成为首选之一。 将具有因果关系的两点用箭头连接,没有箭头就视为条件...

Gene Expression Clustering

基因表达聚类分析

各位基因,请和谐表达,勿聚众闹事… 物以类聚 芯片、测序仪等高通量工具把人类对于基因的研究带入了组学时代,大量数据喷涌而来,如何解读成了重中之重。所谓物以类聚,从茫茫表达谱中抽提类似的基因,进而研究其协调/差异表达的原因和机制,考察富集的功能和通路等,不失为组学研究的好方法。 何为相...

RNA Folding Algorithms

RNA折叠预测算法

DNA靠序列传递信息,Protein靠结构发挥功能,RNA却序列、结构两手抓… 互补回文 对于RNA二级结构最基本的假设就是碱基的互补配对(在一级序列上的表现就是互补碱基的回文串儿),传统的算法实际就是在各种潜在的茎环结构中搜索最符合生物学真实特征的情况(如最低自由能)。另外一种算法思...

Hidden Markov Model

隐马模型

我女朋友是双子座的,有好多好多人格(隐藏状态),不同人格下都有各种各样的表现(观测状态),如果她今天的状态只跟昨天相关(一阶、齐次),那么这就是个HMM… 简介 日常生活中有很多事情都可以看作是一件件离散地、有序地、前后联系地发生着,像是每天的天气,女朋友的心情、赌桌上压大小,甚至如语...

Bayesian Statistics

贝叶斯统计

概率论本身源于人类对于赌博孜孜不倦的追求 -_-! 这个世界是不确定的,生命无处不是概率,也是赌博,我们看到的太少,未知的太多… 贝叶斯公式 人类对于事物的认知总是由浅入深由简入繁,当我们能够清楚观察出一个模型,或者用大量实验模拟出这个模型时,它所有的可能结果都被我们预知,于是传统概率...

Dynamic Programming

动态规划算法

好吧,其实这么炸裂的名字既不动态,也无关编程技巧,只是Richard Bellman为了吓唬人而取的,hoho… 算法思想 动态规划算法是运筹学的一个分支,最早用于解决最优化决策问题,其基本思想有点儿类似分治法,将一个大问题拆解为数个子问题,各个子问题顺序求解,最终得到整个大问题的解。...