Wenlong Shen's Blog

不宠无惊过一生

RNA大语言模型简介

A brief introduction to RNA LLMs

天地有大美而不言,四时有明法而不议,万物有成理而不说。 “Attention Is All You Need”。注意力机制、大语言模型的出现,将人工智能提升到了前所未有的高度,就此,人类社会的发展也进入了一个全新的维度。 而这一新的范式,究竟能为生物学领域的研究带来怎样的改变?答案似乎取决...

校友录更新

Alumni records update

从心所欲不逾矩? 时值高中迁校20周年,有老师急于联系问询我的现状,也辗转找了不少同学。我知道他的好意与难处,却依然不愿回信。不是每个人都需要被找到,不是每个人都需要被记得,人生海海,不过尔尔。 厌倦了去辩论活着的意义、人与社会的关系等等,抑郁越来越严重,孩子的到来尤其加重了我对于生活的无...

全基因组测序简要分析流程

A brief pipeline for wgs data analysis

中国有人焉,非阴非阳,处于天地之间,直且为人,将反于宗。 自人文哲学到生物分子,人类对于生命的追问,对于自身奥秘的探索,从未停止过。基因组,蕴含生命线索的密码书,漫漫其修远兮,吾将上下而求索。 我们知道人与人之间在基因组层面存在诸多差异,SNP、Indel、CNV、SV等,这些差异可能跟性...

关于唯一比对和序列冗余

Unique mapping & Duplicates

技术服务于思想 比对 高通量测序要么是为了拼接组装出一套完整的基因组,要么是为了得到感兴趣区域的序列信息,对于后一种情况,我们需要利用比对这一手段来确定序列在基因组的位置。二代测序常用的比对软件有BWA、Bowtie2、SOAP等。 基因组上存在大量序列重复的片段,它们在测序、比对时都会...

关于人类基因组的一些说明

Reference genome

参考参考 GRC 人类基因组计划之初,曾试图勾勒出一套完整的、一致性的基因组序列图谱,但无论是测序技术、组装算法还是基因组本身的多样性问题,都让这套“纯粹的”参考基因组无法实现。目前的人类参考基因组由Wellcome Sanger Institute、EBI、NCBI等多家研究机构成员组成...

宏基因组常用分析流程简介

Pipelines for metagenomic data analysis

比对鉴定,拼接组装,功能分析 我们简要介绍两个常用的宏基因组数据分析工具包。 bioBakery workflows bioBakery来自于The Huttenhower Lab,开发者们提供了多种多样的宏基因组数据分析工具,特别地,搭建了一套workflow以用于处理16S、宏基因组...

宏基因组分析方法初探

From sampling to analysis

探究微生物组,解构身边熟悉的陌生环境 随着测序通量越来越高,价格成本越来越低,痕量微生物也难逃深度测序的挖掘。在高通量测序技术的辅助下,宏基因组学研究飞速发展,十多年来,在环境微生物鉴定、共生菌研究、营养学研究、肠道微生物对人体生理影响等方面取得了诸多进展。 一个标准的分析流程通常包括以下...