基因组学

基因组学
全基因组测序
「遗传学」与「基因组学」

人体的构成复杂、奥妙,基本结构虽然相同,每人却是独一无二。

让我们一起探索基因组学,认识人体的奥妙。

什么是DNA?

DNA是Deoxyribonucleic Acid(脱氧核醣核酸)的缩写,存在于人体细胞之中。它的结构由两螺旋长链组成(如下图),长链上有四种像英文字母一样的「代码」,分别是:A、T、C和G。我们的身体,便是依靠这四种DNA代码以不同排序传递遗传讯息,一如在英语中,我们以26个英文字母组成不同的词汇及句子,表达各种意思。

 

么是基因(Gene)?

基因是遗传指令的基本单位,影响着每人的身体结构和功能。

 

四种DNA代码A、T、C和G环环相扣,形成DNA长链。整条长链中只有一部分盛载了特定的遗传指令,便是「基因」。若以英语作比喻的话,基因便有如一段完整的句子或文章段落,用来表达一个完整的讯息。

 

什么是基因组(Genome)?

「基因组」(Genome)是指生物体内的「所有遗传物质」,而人类的基因组内有超过两万个基因。每人的基因组都是独一无二的,犹如身体的说明书,决定了每人拥有的不同特征,例如肤色、高度及患上不同疾病的潜在风险等等。

 

如果DNA是英文字母、基因是完整的句子和段落,那么基因组便是整部书,内容包括所有章节、段落、句子、图案以至排版等等。

 

若比较两位没有血缘关系的人,两者的基因组有99.9%相同,不同之处只占0.1%;然而,这看似微细的0.1%,却已包含数以百万计基因排序上的不同,足以为每人造就不同的身体特征及功能结构。

 

基因组 英语

DNA 代码:A、T、C和G

英文字母

 

由A、T、C和G组成DNA长链,带有特定遗传指令的部分,便是基因

以英文字母组成的完整句子或段落,用以表达特定讯息
 

基因组是人体内整套DNA,包括每个基因和DNA代码

 

整部书,包含所有章节、段落、句子、图案、排版等

 

要了解每人的基因组,便需进行「全基因组测序」(Whole Genome Sequencing,简称WGS)。进行全基因组测序,主要有以下三个步骤:

 

1. 测序(Sequencing

顾名思义,测序便是把人体内超过30亿个DNA代码逐一读取,然后全部排列出来。

 

2. 数据处理(Data Processing

从测序得出大量基因组数据后,生物信息学家便要把它们转化成可被解读的资讯。

 

首先,把已排列的DNA次序,与「人类参照基因组」(Human Reference Genome)比对,找出基因序列上的不同,这些不同称为基因变异。每人的身体均有数百万个基因变异,大部分基因变异是不会致病的,反而是这些变异,令每人的身体特征及功能结构各不相同。

 

3. 数据分析(Data Analysis

要在数以百万计的基因变异中,找出有机会导致疾病的基因变异(pathogenic/likely pathogenic variant),不但需要依靠基因组医学和基因组科学的知识及发展,更需要配合大量病例,作长时间分析和研究,方有机会找出可能致病的基因变异。

 

基因组学由「人类基因组计划」开始

1990年,跨国的科学家开始研究读取人类体内所有的DNA,并展开一个名为「人类基因组计划」(Human Genome Project,简称HGP)的巨型科学探索工程。整个研究历时超过10年,而人类首个基因组蓝图终于在2003年完成。

 

同时,科学家在该研究中运用了13个匿名基因组捐赠者的数据,组成一个「人类参照基因组」,供全球科研人员在进行基因组测序时,能以此「人类参照基因组」作基准,进行比对并找出基因变异。

 

「人类基因组计划」完成后,为医学及科学界开启了一道通往崭新领域的大门,发展出基因组学。

 

从「遗传学」到「基因组学」

 

以往科学家研究遗传学(Genetics),通常只针对研究每个基因的个别功能和结构。但自「人类基因组计划」完成、「全基因组测序」技术亦渐趋成熟,基因组学(Genomics)便成为科研的新领域。科学家不再只研究个别基因,更强调解读整个基因组,以及基因与基因之间的关系,如何互相影响或合作,以发挥作用。

 

基因组数据的重要性

 

从首个人类基因组蓝图完成至今,基因组学的发展一日千里,但科学家仍未能完全了解基因组与疾病之间的关联,因此更多真实案例及基因组数据对研究发展极为重要。

 

目前, 基因组学的研究大多以西方国家的数据为主。因此香港基因组计划的其中一个目的,便是建立一个属于本地人口的基因组数据库,让科学家可运用更多本地病例及数据作研究,从而找出基因组与疾病及治疗的关系,使病人及其家属得以受惠,同时促进香港基因组学的发展。