vlambda博客
学习文章列表

回归分析之父是谁, 创建回归分析竟为了...


凡是搞计量经济的,都关注这个号了

投稿[email protected]

所有计量经济圈方法论丛的程序文件, 微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.

回归分析之父是谁, 创建回归分析竟为了...

之前,咱们引荐过很多计量经济学家,受到圈友的热烈欢迎。因为所有的Econometric methods都是需要理论和应用计量经济学家去构建和不断完善。以下这些文章对于增进对计量经济圈的认识大有裨益,圈友们可以粗略浏览。

1.2.3.4.

5.6.7.

今天,要引荐给圈友们的是影响了实证研究的回归分析之父,the father of regression analysis。我们天天在讲回归分析,也在做回归分析,并在社群里交流探讨得以飞速成长,但到底是谁一手建立起回归分析呢?又是在什么背景下去做两个或多个变量的回归分析呢?


回归分析之父—弗朗西斯·高尔顿

回归分析之父是谁, 创建回归分析竟为了...

在科学史上,很少有像弗朗西斯·高尔顿那样特立独行、知识渊博而又毁誉不一的科学家了。他那传奇式的经历和科学活动令人眼花缭乱;他涉猎科学范围之广被称为“维多利亚女王时代最博学的人”;对于他的某些遗传科学理论,赞扬者称之为“人类追求自身完美这一崇高目标的化身”,贬低者则说他是“种族主义者和法西斯蒂的精神领袖和鼻祖”。

 

弗朗西斯·高尔顿(Sir Francis Galton,1822-1911)于1822年2月16日出生于英格兰伯明翰一个显赫的银行家家庭,父亲特铁斯·高尔顿和祖父塞缪尔·约翰都是热爱自然的科学家。高尔顿是家中第9个孩子,他的外祖父正是达尔文的祖父,因此与达尔文是表兄弟。姐姐阿黛尔是幼年高尔顿的启蒙老师,他从小智力超常、聪颖过人,显然是一位神童。

 

高尔顿6-7岁时,就对博物学产生兴趣,并按自己的方法对昆虫、矿物标本进行分类。8岁时他被送进寄宿学校正式接受教育。13岁时就打算从事一项“高尔顿飞行计划”。15岁开始在伯明翰市立医院做了两年内科见习医生。18岁时到伦敦国王学院学习解剖学和植物学,随后又转到剑桥大学三一学院学习自然哲学和数学,但因身体原因未获学位即离开学校,后又进入圣乔治医院继续学医。与童年时代的“神童”相比,高尔顿的高等教育杂乱无章也不太成功,有人认为正是这样为他日后成为维多利亚时代最博学的学者奠定了基础。


22岁那年父亲去世之后高尔顿获得了一笔可观的遗产。他放弃医业决定过一种无拘无束的学者生活,这使他成为在自己书斋里完成科学创造的“绅士科学家”。

从1845年开始,高尔顿对地理科学发生兴趣。1850年,他与友人先后远赴马耳他、埃及尼罗河流域和南非进行科学考察,还曾只身进入巴勒斯坦腹地。这使他成为一位大无畏的知名探险家,在科考中他搜集了许多珍贵资料。1853年被选为皇家地理学会会员,1856年又被选为皇家学会会员,时年34岁。

 

1852年高尔顿返回英国后不再远游。和达尔文一样,由于远出考察患上了一种“神秘的疾病”(神经不稳症)。1853年高尔顿结婚。1857年定居伦敦,正式开始了他的书斋式的科学研究活动。


高尔顿平生著作,据皮尔逊不完全统计,著书15种,撰写各种学术论文220篇,涉猎范围包括地理、天文、气象、物理、机械、人类学、民族学、社会学、统计学、教育学、医学、生理学、心理学、遗传学、优生学、指纹学、照像术、登山术、音乐、美术、宗教等,是一位百科全书式的学者。

 

1909年,高尔顿被英国王室授予勋爵称号。1911年1月17日,高尔顿病逝于英格兰南部哈斯里梅尔,享年89岁。他虽然创立了优生学,自己却没有留下一个后代。高尔顿死后,皮尔逊被委托整理其学术遗物。1914-1930年先后出版了三卷本的《弗朗西斯·高尔顿的生平、书信和工作》留传于世。


从遗传学史的观点来看,高尔顿的主要贡献是人类遗传学。然而,他最为人们所熟知的是优生学的创始人,这使他成为科学史上毁誉参半的著名人物。

 

高尔顿虽然最早是以地理学家的名义而进入科学界,但在1859年表兄达尔文的《物种起源》发表之后高尔顿立即成了达尔文学说的信奉者,其科学兴趣也很快转到与生命有关的科学——遗传学领域中来。但是,他并没有跟在达尔文后面亦步亦趋。虽然他赞成达尔文关于生物体内“有许多有机单位,每一单位都有其自身的属性”这一说法,但对达尔文的泛生子学说是反对的。为了证明达尔文的“芽球”是不是在血液之间流通,高尔顿做了许多不同毛色兔子之间的输血试验,结果是否定的:输血并不影响下一代的性状。虽然如此,他还是相信“芽球”的存在,但他把它们——这些遗传颗粒统称之为“血统”(strip).他认为血统是保存在生殖细胞里并通过生殖细胞传递给后代的。这一遗传学说是高尔顿于1876年建立的。人们认为高尔顿的这一思想乃是魏思曼的“种质”连续见解(1892)的先驱。


1885年,高尔顿又提出了一个全然不同的遗传理论——祖先遗传律。他认为,每一个体从其父方接受了大约一半的遗传组成,从其母方接受了另一半。同样的推理应用到祖亲代:一个个体从其祖亲接受了大约1/4的遗传物质,从其曾祖亲那里接受了1/8的遗传物质,依此类推。于是,一个祖先的恩赐,每一代中都得以分享。
  

高尔顿曾对英国历史上的法官、政治家、军事家、文学家、科学家、诗人、画家、牧师等类人物的家族进行了系统的考察,力图证明智力是遗传的。例如,他考察了1660-1868年间286名英国法官和他们的亲族情况,经过统计,得出平均每100个英国法官的亲属中共有38.3个名人,而全英国平均4000人中才有1个名人。由此证明天才在法官中是遗传的。

 

在人类遗传学的研究中,高尔顿最先注意到“先天与后天”的区别和联系,并于1875年首创双生儿法。一般认为,同卵双生或一卵双生子其基因型都是一样的,同卵双生子间的差异归之于在子宫内或出生后环境的影响;异卵双生或二卵双生子间其基因型本来就不同,双生子间的差异既有遗传的也有环境的影响。通过双生儿之间的异同对比,研究遗传和环境对个体表型的影响,双生儿法成为人类遗传研究中的经典方法。


高尔顿从动植物育种工作者塑造未来世代体质构造的工作得到启发,提出了一个改造人类体质结构乃至精神特性的计划。尽管优生学的思想在很多古代文明中都可以找到,但是这一名称的正式提出却是1883年高尔顿的《人类才能及其发展研究》。他创造了“优生学”(Eugenics)这个新词,用以表述一个以人类自觉选择来代替自然选择的社会计划。他对这门学科所下的定义是:“对于社会控制下的能从体力方面或智力方面改造或损害后代的种族素质的各种动因的研究”。高尔顿先后写了很多论文和专著阐述他的思想,以极大的热情积极建议对古今各国不同社会阶层的生育情况进行广泛调查,寻找某些家庭所以昌盛的原因,深入研究影响人类婚姻状况的各种因素,普及遗传知识,向全民宣传优生学的重要意义。1904年,高尔顿出资在伦敦大学设立优生学讲座,1908年,高尔顿发起成立英国优生学教育会并出版《优生学评论》,使优生学在国际范围内得到传播。1912年,在高尔顿去世后的第一年,第一届国际优生学会议在伦敦召开,高尔顿的理想终于发展成为一种国际性的科学和社会活动。

 

高尔顿无论是在进行人类学测量、实验心理学研究还是进行遗传优生的研究中,都充分依赖于数据分析,进行了大量的计算和统计工作。用他最得意的话说就是“无论何时,能算就算。”因此,把统计学方法引入到生命和社会现象有关的领域中来,是他另一项重要的科学贡献。

   

高尔顿对统计学的最大贡献是相关性概念的提出和回归分析方法的建立,被誉为现代回归和相关技术的创始人。所有有关这方面的结果后来都总结在《自然遗传》(1889)一书中。
    

父代与子代的关系:回归

 

1875年,Galton 利用豌豆实验来确定尺寸的遗传规律。他挑选了7组不同尺寸的豌豆,并说服他在英国的不同地区的朋友每一组种植10粒种子,最后把原始的豌豆种子(父代)与新长的豌豆种子(子代)进行尺寸比较。


当结果被绘制出来之后,他发现并非每一个子代与父代一样,不同的是尺寸小的豌豆会得到更大的子代,而尺寸大的豌豆会得到较小的子代。把这一现象叫做“返祖”现象(趋向于祖先的某种平均类型),后来又称之为“向平均回归”。一个总体中在某一时期具有某一极端特征(低于或高于总体均值)的个体在未来的某一时期将减弱它的极端性(或者是单个个体或者是整个子代),这一趋势线在被称作“回归”效应。人们发现它的应用很广。


正如Galton 进一步发现的那样,平均来说,非常矮小的的父辈倾向于有偏高的子代,非常高大的的父辈倾向于有偏矮的子代。在第一次考试中成绩最差的那些学生在第二次考试中倾向于有更好的成绩(比较接近所有学生的平均成绩), 而在第一次考试中成绩最好的那些学生在第二次考试中倾向于有较差的成绩(比较接近所有学生的平均成绩)。

 

高尔顿的生物统计学思想经过他的学生皮尔逊、韦尔登的参与和发挥,一个颇有影响的生物统计学派在英国形成。1901年,高尔顿、皮尔逊、韦尔登创办《生物统计》杂志,成为生物统计学派的一面旗帜。对高尔顿的科学评价一直存在着争议,但主要是围绕优生学而展开的。应当说,高尔顿的优生学理论,其出发点并不坏。恰恰相反,他不过是追求人类和人类社会的完美。因为“优生”一词,通俗地讲就是“生一个健康的孩子”,这是保证人类种族和人类社会健康发展的首要条件。当然,高尔顿在研究这一问题时,低估了人与社会的复杂性,过分夸大了生物学原理的适用范围,他本人也带有一定的阶级偏见和种族意识的影响。但是,高尔顿的优生学尽管存在这样那样不足,仍不失为科学史上的一个正确理论。至于后来德国的法西斯分子滥用优生学来推行其反动的种族政策,在优生的名义下屠杀数百万犹太人,自有其政治、历史、文化、宗教等多方面的原因,这个账只能算在希特勒和纳粹党徒们的头上,不应当去过多责怪早已逝世多年的高尔顿。正如,诺贝尔发明了炸药,许多战争狂人用以摧毁了无数人的生命,不能因此否定诺贝尔一样。尽管第18届国际遗传学大会鉴于“优生学”这一名词的诸多岐义,在科学文献中不再提这个词,但是优生的思想早已深入人心,从历史的角度还优生学本来面目,十分必要,因为真正的历史是不可以随意改写的。


再来一篇介绍回归分析之父的文章,进一步了解Galton的天才创造和生平轶事。

回归分析之父是谁, 创建回归分析竟为了...

回归分析之父是谁, 创建回归分析竟为了...

回归分析之父是谁, 创建回归分析竟为了...

回归分析之父是谁, 创建回归分析竟为了...

回归分析之父是谁, 创建回归分析竟为了...

回归分析之父是谁, 创建回归分析竟为了...

参考:

1.http://blog.sina.com.cn/s/blog_50b6a20601008got.html

2.相关和回归分析的创始人:弗朗西斯·高尔顿,中华疾病控制杂志

Econometrics Circle

数据系列: |  工企  |   |   |   |    

计量系列: |  |  |  |   | 


计量经济圈组织了一个计量社群,有如下特征:热情互助最多前沿趋势最多、社科资料最多、社科数据最多、科研牛人最多、海外名校最多。因此,建议积极进取和有强烈研习激情的中青年学者到社群交流探讨,始终坚信优秀是通过感染优秀而互相成就彼此的。