成瘾是一个重要的医学和社会问题,对不同物质来讲,很多物质可以造成成瘾。
不同成瘾物质对身体的伤害和依赖性是不一样的,几年前成瘾领域大家都很感兴趣,这些不同的成瘾有没有共同的分子通路。
我们当时认为这个问题也许是生物信息学可以回答的一个问题
要回答这个问题,我们做的第一件事就是先要知道哪些基因和成瘾相关,所以李川昀就看了1000多篇文献。
把里面与成瘾相关的基因都总结出来,主要是分为两大类,第一类是通过遗传策略,
就是容易成瘾的人和不容成瘾的人在基因上有什么差别,还有一类是通过分子生物学的策略,比如说基因的差异表达等
当时就发现这两大类策略找到的基因只有四个overlap,的确复杂疾病遗传和分子生化领域也经常掐架,讨论我找着为什么你没找着
但是我们当时也看到这个很极端的overlap。我们觉得这两个不可能没有关系,
所以我们发现虽然这两类实验策略虽然找的基因上交叉很少,但更多地是落在
同样代谢通路和同样的蛋白相互作用网络上,经常每一个方法找到的同一个通路的不同基因。
基因上没有overlap,但在分子通路上有比较强的overlap,所以基于这个观察,所以我们就认为要想研究成瘾的分子网络,要把所有的数据整合起来。
所以我们就整合了所有的数据,就会看到在所有染色体上都有,没有任何的模式。于是我们就想换一个角度来看,是不是他们都参与某些显著的通路?
这就回到了前面所讲到的问题,刚好我们实验室有了KOBAS这个软件,于是我们就把KOBAS应用到了
前边找到的396个和成瘾相关的基因上,就找到18条在统计上非常显著的通路,就包括long-term depression ,long-term potentiation等等
这还不是最有趣的结果,因为当时我们最想回答的问题是不同的物质成瘾有没有共同的分子通路
这就涉及到生物信息学中一个概念,你在数据库存储data的同时要存储meta-data,就是说要记录下来每个基因是用什么方法和什么实验技术找到的。
所以我们当时对于每一个
和成瘾相关的基因都用了哪一个成瘾的药物做出来的,包括哪一个脑区等等
有了这样meta-data,我们就可以写一个程序要统计和Cocaine成瘾有关的基因有哪些富集的通路,和酒精成瘾相关的有哪些显著的通路
分别做完之后,就发现有5条通路是对四种物质成瘾都显著的通路,更有趣的是是一个激素的信号转导通路。
和另外一个Gap junction通路,但是两个通路之前从来没有被报道过和成瘾有关。
那么我们并没有自己实验的data,怎么会发现别人找不到的通路呢?
仔细看一下就会发现这两个通路的每一个基因都在世界上被某一个实验室用某一种技术发现和成瘾相关,
但每个实验室只看到一个基因,并不敢说和整条通路相关,但如果你用生物信息学的方法,借助今天所讲的Pathway database identification的工具
就会发现这两个通路不仅显著,而且对四种物质成瘾都显著。
所以这个工作发表之后,在国际上影响还是很大的,包括Science Signaling,
这些杂志都有长篇的报道,还有人专门写了三页纸的review建议以后我们研究复杂疾病
都要用这样的方法。后来英国的《经济学人》 有整整一页的报道我们的这个工作
如果一个生物信息学的方法用得好的话,是可以看到别人看不到的模式的,之所以能看到这种模式,就是因为有今天一直在强调的
hierarchical computer represented data。
所以把前期工作做好,后期统计方法再用得好,就会有很有趣的一些发现。总结一下,就是下面几点。
今天的课就讲到这里。