I、什么是遗传经济学?
顾名思义,遗传经济学(Genoeconomics)就是将人类分子遗传信息(i.e. 基因数据)运用到经济学中的一门交叉学科。这一领域最早由康奈尔大学经济学家Daniel Benjamin(现在南加大)、哈佛大学经济学家Edward Glaeser,冰岛大学心血管遗传学家Vilmundur Gudnason、联合学院心理学学家Christopher Chabris等学者于2007年创立。
II、基因数据对经济学家有什么用?
(1)为经济学对个体“异质性”行为的探索提供生物遗传学基础
遗传物质决定了每个人的特质。地球上几乎所有生物(除少数病毒外)的遗传物质都由脱氧核糖核酸(即DNA)构成。任何一个生物体特征首先是由遗传物质决定的。我们身体里面的各种生命活动主要是靠各种蛋白质分子来执行,而蛋白质又是由DNA来编码和控制的。DNA决定了人体在什么时间,在什么细胞里面,生产出什么种类的蛋白质,以及生产多少。
个体之间DNA的细微差别会造成生成蛋白质种类、数量、性质、出现时间/地点的微小差别。但这些细微差别累积起来会造成细胞内各种化学反应进行程度的差异,以及各种信息传递链运作状况的不同,形成人与人之间差别的遗传学基础。这与经济学家们对个体“异质性”行为的探索不谋而合。
(2)外生性
与其他我们熟悉的个体特征变量不同,每个人的基因是在个体出生之前就已经决定的。基因本身不会受到外在环境因素的影响(虽然基因表达产物会受到环境因素影响),这就使得经济学分析中的基因变量不会存在令人困扰的内生性问题。比如回归中如果以疾病基因风险作为自变量的话,它不会受到个人收入、受教育水平、家庭环境、社区环境等后天因素的影响。
(3)随机性
每个人的基因在形成时都是一个近似随机的过程(conditional on parents),这是因为来自父母的DNA会通过同源重组形成生殖细胞,而子女得到的到底是父亲还是母亲的哪一个/段基因是随机的。这个过程也被形象的称为“基因洗牌”,而基因数据在产生过程中的这种随机性已经被应用于全新的“孟德尔随机化(Mendelian Randomization,简称MR)”研究中。对于经济学家来说,MR可以作为除随机对照试验(Random Control Trial,RCT)外的另一个因果推断新选择。
(4)易用性
尽管原始基因数据的分析与获得需要很强的生物遗传学背景,但令人惊喜的是,经过处理的二手基因变量正变得越来越容易获得。比如之前推文中介绍过的美国健康与退休调查(Health and Retirement Study,简称HRS),已经向公众开放了多种个体特征和行为的多基因评分(Polygenic Score,简称PGS)变量。美国青少年成长追踪调查数据(Add Health)也自2018年开始放出多种PGS变量可供研究人员直接使用。此外,越来越多的经济学家们熟悉的大型社会经济调查正在收集和逐步开放丰富的个体基因变量。

因此,在了解了遗传数据采集和使用的基本原理后,经济学研究者们完全可以直接将基因变量当作传统变量一样使用,除了电脑外也无需额外的分析装置。与神经经济学、行为经济学等研究所需要的大笔资金或是复杂的脑成像设备使用相比,遗传数据的应用成本其实十分低廉。

III、为什么现在才开始用遗传数据?
既然基因数据有以上这些优点,为何我们现在才开始使用?这其实与测序成本密不可分。
人类基因组测序早在2001年就首次完成了,但当时分析一个人基因组的成本高达近亿美元!即使到2007年,这个价格仍在1000万美元左右,基因数据对于绝大多数研究者而言只是镜花水月。但其后随着新一代测序技术的出现,基因测序成本大幅降低,个人全基因组测序成本迅速以超“摩尔定律(Moore’s Law)”的速度下降到了2017年的1120美元(见下图NIH数据),且耗时大大缩短,大大推动了基因检测技术和遗传数据在各个领域中的应用。

2019年,个人基因组测序成本已降至大约500美元左右,是2001年成本的20万分之一!而大部分消费级基因检测服务采用的基因芯片(只检测已知基因,而非全基因组)成本则更为低廉:
如:23andMe,祖源检测99美元,祖源+健康检测199美元:

国内:微基因标准版(祖源+健康)499元:

这个价格使得我们在社会经济调查中增加遗传数据的收集变成可能。

IV、现有的遗传经济学研究
其实早在上个世纪70年代,经济学家们就开始利用双胞胎和收养实验来控制先天基因因素或后天环境因素。如Taubman(1976)、Ashenfelter和Krueger(1994)、Miller等(1995)利用双胞胎数据先后在AER上发表了测算教育成就代际遗传性以及教育回报率的一系列文章;Cesarini等(2009,JPE)讨论了通过双胞胎研究得出的个体风险和奉献偏好的继承性;Sacerdote(2007,QJE)利用美国家庭收养韩国儿童的数据讨论了先天和后天因素对(养)子女教育成就、大学选择、吸烟、饮酒等行为的不同影响。这些研究设计与行为遗传学(Behavioral Genetics,创立了经典的双胞胎和收养研究方法)一脉相承,通常将遗传禀赋(Genetic Endowments)作为一个整体来解释个体层面行为特征的差异。但受到彼时科技发展的限制,这些研究中并未出现真实的遗传基因数据,因此不能被称为真正意义上的遗传经济学研究。
Ashraf和Galor 2013年在AER上发表的论文The ‘Out of Africa’ Hypothesis, Human Genetic Diversity, and Comparative Economic Development提出了遗传多样性影响长期经济发展的假说。这不但是生物学与经济学的一次开创性结合(尽管在多个领域引发争议),而且在研究中首次使用了群体遗传数据(i.e. 群体基因多样性变量),并引发随后更多经济学家利用群体基因变量考察基因多样性对于文化分裂、矛盾冲突、区域发展、乃至企业创新、个体身高和教育成就的影响。但这些研究中所采用的基因数据都属于群体级别的集合数据(aggregate data),精准度较之个体数据(individual data)而言还较低。
真正利用个体基因数据的经济学研究近年来正逐渐增长,梳理于下表中:


V、结语
笔者敬仰的一位老师曾这样评论:
『 如果说行为经济学是经典经济学由理性领域向非理性领域的延伸,那么遗传经济学则走的更远,是经济学由精神世界向物质世界的拓展 。』
基因数据质优,价廉,是一座等待被挖掘的数据宝藏。

