多元正态分布的定义(多元统计分析经典例题)

《多元统计分析》是为统计、数学、大数据相关专业的学生或者在工作学习中需要面对数据分析的朋友开设的统计学课程,旨在教授分析多元数据的统计方法,特别是这些分析方法的具体实施及对应结果解释。主要内容包含多元数据的可视化、矩阵表示及数值特征、多元正态分布、多元统计检验、主成分分析、因子分析、判别分析与分类分析、聚类分析等。在本门课程中运用R作为编程语言。课程会从实际的应用场景和方法动机讲起,介绍这些多元统计分析方法的数学逻辑、编程实例、和它们背后的故事,提高学生从业务问题中提炼统计问题、并将其转化为数据可分析的问题的能力;帮助学生找到解决问题的统计方法,评估可行性、设计问卷、收集样本及数据、分析数据、解决分析过程中遇到的问题、将分析结果回归到业务场景模式中、最终回答业务问题并给出建议或预测。

1授课教师介绍:

多元正态分布的定义(多元统计分析经典例题) 刘婧媛,厦门大学经济学院统计系、王亚南经济研究院副教授,博士生导师。宾夕法尼亚州立大学统计学博士毕业。教授多元统计分析、商务统计、概率论与数理统计、实验设计与方差分析等本科及研究生课程。主要从事高维数据的统计方法、因果推断、统计咨询、统计基因学等领域的研究工作。在Journal of American Statistical Association (JASA), Journal of Business & Economic Statistics (JEBS),Statistica Sinica, Journal of Multivariate Analysis等国际权威学术期刊发表论文近20篇;主持国家自然科学基金面上项目、青年项目等国家级、省部级多项科研项目;2018年入选福建省杰出青年科研人才培育计划。教学方面曾获厦门大学教学技能大赛暨英语教学比赛特等奖、宾夕法尼亚州立大学最佳教学奖等荣誉;参与编著《数据思维:从数据分析到商业价值》、《数据思维实践:从零经验到数据英才》等教材。


钟威,厦门大学王亚南经济研究院和经济学院统计系教授、博士生导师,经济学院院长助理,国家自然科学基金优秀青年基金获得者(2019年),福建省杰出青年基金获得者(2019年),厦门大学“南强青年拔尖人才”(A类,2018年)。2012年获得美国宾夕法尼亚州立大学统计学博士学位。主要从事高维数据统计分析和理论、统计学习和数据挖掘算法、计量经济学内生问题、统计学和数据科学的应用等领域的研究。担任美国统计协会(ASA)统计学和数据科学期刊Statistical Analysis and Data Mining的副主编,在The Annals of Statistics, Journal of the American Statistical Association, Biometrika, Journal of Business & Economic Statistics, Annals of Applied Statistics, Statistica Sinica,中国科学数学等国内外统计学权威期刊发表20余篇论文,其中入选ESI前1%高被引论文2篇。兼任全国工业统计学教育研究会理事,青年统计学家协会副秘书长,中国现场统计学会资源与环境统计分会、高维数据统计分会、人工智能与数据科学分会常务理事。主要讲授《数理统计》、《广义线性模型》、《计量经济学》、《统计数据分析》等本科和研究生课程,2016年获厦门大学经济学院青年教师教学技能比赛一等奖、厦门大学第五届英语教学比赛一等奖。2如何上好统计和计量类课程?听听厦大青年教授怎么说

文:刘婧媛

我从博士第二年开始给本科生教课,到现在大概有八年时间了。比起资深教授,我显然还“道行太浅”。这里仅从个人讲授概率统计和计量经济学(英文)课程的经历中分享一点自己的教学感悟。

我想从上课时每次介绍新知识点的流程讲起。我作学生的时候,每次学到新的知识点,在我的印象里,有些老师通常都先给出概念或问题定义,然后讲解方法和技术细节(包括计算、证明等),最后加一个应用该方法的例子。用这样的方式,认真学习的好学生可能是会按部就班地接受并逐渐消化每一个知识点,但是他们通常并不知道到底为什么要学这些。没有一个明确的动机,教学就会成了传统的填鸭式,学生也很难真正地投入进去,也很容易遗忘。学生一定要认可“我需要学习这个东西,它是有用的”,才会全神贯注地带着好奇心学习。

第一步:动机(Motivation)

我的讲授流程一般是从动机讲起——抛一个问题给学生,让他们讨论可能的解决方案,发现搞不定了,自然而然地就需要新的知识了。比如概率统计课上我在讲假设检验的时候,我会问学生:苹果公司官方宣布新的 iPad 电池续航时间是 10 小时。你信吗?

这时,有 iPad 的同学就根据自己的使用情况参与讨论了。然后抛出问题,假设现在我们有 50 个 iPad 做我们的样本,它们的平均电池续航时间是 6 小时,那么你信苹果的官方宣布吗?学生会说当然不信,差得也太多了吧!我说,那如果它们的平均时间是 9.99 小时呢?——那就得信了吧?毕竟样本有随机性在。那么 7 小时呢?8 小时呢?8.5 小时呢?学生就慢慢沉默了,他们就会主动去思考:什么叫“差得多”,什么叫“差不多”。我会告诉学生,当你面对很明显的事实的时候,可能你用常识就可以判断;统计最有用的地方就是在模棱两可的边缘。就像这个问题,常识没办法告诉你 8.5 是不是还跟 10 差很远,这时,我们就需要专业的统计工具——假设检验了。

第二步:直觉(Intuition)

有了明确的动机,按理说就应该直入主题讲授方法了。但我喜欢(尤其是当我们遇到比较晦涩抽象的内容时)在此之前先帮助学生建立一个直观的理解,然后再引出正式的概念或方法,这样有时他们甚至可以沿着这些直观的理解自己抽象出将要学习的概念——这便是他们自己学到的,而不是老师硬塞给他们的。学生对于自己主动理解吸收的知识总是会掌握得格外牢固。老师的角色应该更像一个导游,毕竟真正来旅游来体验的是学生自己。我每学期开学的时候都会告诉学生:I’m not here to teach. I’m here helping you to learn. 所以我想我们在这个阶段要做的,就是通过一些类比或者简单直观的例子来引导他们。例如,我在正式给出偏差(bias)和方差(variance)的概念公式之前,都会给学生先看一张下面的打靶图:

通过这四张图的对比,学生就会大概有一个直观的概念,什么叫做偏差,什么叫做方差/波动性。然后再引出它们的标准概念,学生通常就会接受得更自然一些。

第三步:方法(Methodology)

接下来就是具体的概念、定理、方法了。在这一步,我觉得一个比较好的方式是尽量帮助他们跟之前的知识点进行连接和比对。这样随着课程的逐渐深入,他们脑海中的知识点将会渐渐地连成网,而不是一个个支离破碎的片段。我听很多同学反映过,学完一门课,好像每个小知识点都懂,但是还是不知道这整门课到底是怎么回事。这样的后果可能就是,考完试,这门课也就慢慢被遗忘了。因为在他们的脑海中还没有形成一个完整的体系(big picture),而碎片总是很容易被遗忘被忽略。所以,在多元统计中,在讲授因子分析时,我一定会比对主成分分析,启发学生思考它们的区别、联系和各自的应用场景;在讲聚类分析时,自然而然会关联到分类分析,等等。学期结束时,我会鼓励或带领他们用一张 A4 纸把整个学期的内容“画”出来——每个知识点、每个章节是什么逻辑关系,适用于怎样不同的场景等,这就是整个课程的 big picture, 也是由点形成的面。

第四步:技术细节(Technical details)

除此之外,我认为效果比较好的小贴士,希望对大家有所帮助。

(1)简短的复习

每节课的开始我通常会花一两分钟的时间帮学生回顾前面 学习的内容。毕竟学生需要同时学习多门课程,轮到这门课时,他们很可能对上 次或前面几次课的内容已经略有遗忘。如果这时直接开始新内容,他们很有可能 无法瞬间进入状态,而导致整堂课的效果欠佳。

(2)适当的节奏和适时的反馈

我通常不会把课程内容安排得太满,否则可 能会出现赶进度的囫囵吞枣的场面。由于我们无法保证所有的学生消化课上的所 有内容,我会按照平均水平学生的接受程度设定课程节奏,同时给游刃有余的学 生一些额外的挑战,比如提供一些参考文献等拓展性学习的途径。另外,适时地 (例如开学半个月后、期中考试后等)做几次关于课程的问卷调查,也能帮助我 们根据需要改进教学。

(3)更相关的例子

比如在概率统计中,没有人真正特别关心怎么投硬币、 掷骰子、取小球。这些当然可以作为帮助我们理解的小例子放到上面说的第二步, 但如果整门课都一直在投硬币、掷骰子,那么学生会失去兴趣也不算奇怪了。我 们可以使用更贴近他们生活、让他们感觉更相关的例子作为课堂展示——例如在 厦门大学我就会使用福建人都关心的博饼来讲古典概型;如果在四川,也许就是 打麻将——这样不仅能让他们带着好奇心去主动思考,而且可以让他们觉得,所 学真的有用。

(4)因材施教

我这里想说的就是,带不同阶段的学生,我们大概要侧重不 同的方面。如果我们面对的是一、二年级的、刚刚进入这个专业领域的新生,最 重要的应该是建立他们对这个专业方向的认同感,更多地从科普、直觉的角度出 发。对于三、四年级的本科生,他们已经初步了解了这个专业,并且未来的可能 性很多,所以这是他们对新知识最渴求、接受度最高的阶段,我们应该多传授一 些“干货”、 给他们更多的挑战。对于应用硕士,他们是直接对口工作的,所以 在讲授课程内容的同时我会顺带培养一下他们的专业技能,例如撰写报告、口头 展示等。而对于学术型硕博士,课上内容更不应该只拘泥于书本,我们在课上可 以提供一些课程相关的研究前沿介绍和参考文献,让学生主动学习,并启发他们 在研读的过程中发掘新的有趣的课题。

这就是我从开始教课到现在的一些个人感悟。当然,它也许并不适用于所有课程和所有老师,只是提供一个可能的借鉴。每个老师都有自己习惯并有效的教 学方式,一千个老师可能会有九百九十种不同的教学方法。但我相信相同的是, 通过我们的讲授,学生从懵懵懂懂到逐渐清晰,再到最终掌握并认同这门课程甚 至这个学科时,给我们带来的欣慰和兴奋。

发表评论

登录后才能评论