未来城市实验室:邻居统计
卡方统计
跨学科课程
目标:
学生会:
-
派生并使用卡方检验
-
在纽约市人口统计学背景下解释此测试的使用
-
将社会科学与所谓的“硬科学”进行比较和对比
-
考虑统计数据在何种程度上对人类研究有用
材料:
-
每对学生一袋30个珠子(或吃喝玩乐)。 应该有五种不同的颜色。
-
讲义(两份学生活动讲义,一份数据表和一把教师钥匙)
-
计算器
标准:
-
CCSS.ELA-LITERACY.RST.9-10.7: 将以文字形式表达的定量或技术信息转换为视觉形式(例如表格或图表),并将以视觉或数学形式表达的信息(例如以等式形式)转换为单词。
-
CCSS.数学.内容.HSS.MD.A.4:为随机变量开发概率分布,该随机变量是为根据经验分配概率的样本空间定义的; 找到期望值。
指导性问题:
-
如何测试组是否随机分布?
-
“硬科学”和“社会科学”之间的主要区别是什么?每种数据的局限性是什么?
-
我们如何利用今天的统计数据来帮助我们了解过去?
- 钩
- 练习
- 总结
- 使用
- 分析数据
- 讨论:社会科学的本质
- 讨论:历史因素简介
程序
卡方表是帮助科学家了解数据是否与随机结果显着不同的工具,换句话说,是否需要解释某些外部因素。 它们通常在教室中使用无生命的物体或非人类角色(珠子,遗传结果)进行说明。 本课考虑了像卡方统计方法是否对评估人类行为有用,以及它是否可能成为历史课堂中考虑的工具。 可以在这里找到针对非科学课堂老师的有用教程: http://www.ling.upenn.edu/~clight/chisquared.htm .
在本课程的第一部分中,学生通过测试磁珠的分布来得出卡方值。 然后,给学生们提出了一个更棘手的问题:纽约的不同种族是否随机分布? 学生可以使用计算器来确定。 (将为他们提供的纽约市所有邻里都具有极高的卡方值。)然后,老师将带领学生讨论这些类型的工具在分析人类行为方面是否有意义,并讨论社会科学与“硬科学”之间的差异更为普遍。 最后,本课程以讨论这些工具是否对分析历史有用的方式结束,并指向探索影响纽约市人们为什么非随机分组的历史因素的资源。
向学生提出怪异的主张,例如“穿纽扣衬衫的人比穿T恤的人跳得更高。” 找到一个不同意你的学生。 问课:谁有举证责任? 没有证据,我们应该假设哪个? 为什么? 让学生分享回应。
解释所有实验的目的是测试 零假设。 假设是现象的可测试解释。 零假设是解释任何差异的假设,该差异是随机性/机会的结果。 在发现足够的证据之前,我们不能采用新的(替代)假设。
老师提出的特定替代假设(HALT)原为: 人的跳跃高度之间的差异可以通过他们穿着的衬衫的类型来预测。
原假设(H0)的T恤示例为: 人们跳跃高度之间的差异与他们穿着的衬衫无关。
我们如何找出正确的呢? 这就是卡方分析的用武之地。
向学生解释,您在每个书包中装有30种五种不同颜色的珠子。 他们的工作是确定您是随机还是有偏见。 检查学生:零假设是哪个解释? (答案:零假设是它们是随机分布的,没有偏差。)
问:如果零假设(无偏差)是正确的,那么您期望磁珠的分布是什么? (答案:我希望有30个珠子和5种颜色的珠子每个有6个。)
科学家/统计学家如何确定实际(观察到的)数字与预期的距离有多远? 让学生有时间集体讨论潜在的数学解决方案。 他们应该能够提出减法作为衡量差异的方法。
卡方的等式为:
x2 = [SUM](o - e)2 / e
o =已观察到(这实际上是每个类别有多少个)
e =预期(这是随机机会预测的数量)
差异表示每个值与H的预测有多远0.
差异被平方以消除负数。 然后将它们除以期望值。 这就像取平均值。
结果值全部相加(以总和表示, 或讲义上的sigma)。 差异越大,卡方值越大。 请注意,这里没有考虑样本大小,因此,较大的样本通常意味着较大的卡方值。
说明:卡方值是一个度量值,用于衡量观察值与预期值之间的距离。 如果距离足够远,我们可以拒绝原假设。 换句话说,在这种情况下,我们可以说您(老师)不是随机行为。 相反,出于某种原因,您选择了将哪个珠子分配给每个组,因此有偏见。 自然,该测试无法确定这种偏见的来源。 要求学生提出自己的替代假设。 示例可能包括:
1.)与其他颜色珠相比,教师更喜欢使用某种颜色珠。
2.)老师的选择是随机的,但是珠子的原始来源没有每种颜色相同的数目。
让学生按照讲义上的说明测试自己的书包。 将需要计算自由度(颜色数– 1),并被教导使用p值图表。 工作表中提供了所有表格和图表。
学生分组分享结果,分组决定珠子分布是否有偏差。
从教育部向学生展示了纽约市附近地区的真实人口统计数据。 第一个任务是确定零假设是什么:如果美国人口普查告诉我们29%的纽约人将其确定为西班牙裔,那么该零假设对城市给定邻里人口的状况有何看法? (答案:我们希望每个社区中有29%的人来自西班牙裔。)
学生从提供的数据讲义中选择一个邻域进行测试。 由于卡方仅适用于较小的样本量,因此不应使用原始数据。 他们可以使用百分比作为样本,就像每个邻里只有100个人一样。 这项工作可以在讲义上用计算器完成。
要求学生分享他们的结果。 为什么每个邻域都有显着的卡方值? 从统计上讲这是什么意思? (每个邻域都有一个显着的卡方值。这意味着我们可以拒绝人们随机分布的原假设。)
加强:数据表明,在这些纽约市附近社区中的人口并非随机分布-但是数据也无法告诉我们原因。 卡方分析只是让我们知道某种形式的偏差在起作用,并且实际结果和预期结果之间的差异在统计上是显着的。 在这种情况下,确定 为什么 传统上这可能是社会科学的领域,而不是统计领域。
使用这些问题来指导有关学生刚刚学习的技能的潜在应用的深入讨论和/或写作活动。
向学生解释,传统上卡方是用于不施加选择的人群(例如在第一次活动中使用珠子或吃喝玩乐的情况)。 分析人类的行为通常是所谓的“社会科学”(例如心理学,经济学,社会学,政治科学和历史)的领域。
询问供应商问:“硬科学”和“社会科学”有什么共同点?
询问供应商:社会科学面临哪些独特挑战? 为什么从人类研究中得出结论比植物甚至是像老鼠这样的模型动物要难? 量化人类行为有用吗? 人口特性有哪些潜在用途? 像这样的统计研究有哪些局限性?
询问供应商:为什么我们可以拒绝我们所分析的所有邻域中的零假设是有意义的? (按照以下方式期望答案:人们选择自己的住所,或者人们受到承受能力的限制。)
关于移民选择的话题: 为什么一群人选择彼此住在一起?
关于其他外部因素的主题: 还有哪些其他因素可能会限制移民在居住地方面的选择?
在整个纽约市的历史上,某些人被迫或被迫居住在某些地区-或至少被阻止住在该市最“理想”的地区。 在20世纪中叶, 红线 在这种情况下,非洲裔美国人无法在传统的黑人社区中抵押房屋。这阻止了许多非洲裔美国人拥有房屋(并因此加入中产阶级),并帮助非洲裔美国人集中在城市的某些地区。 另一方面,许多非裔美国人搬到哈莱姆(Harlem)等传统黑人居民区,在吉姆·克劳(Jim Crow America)的暴力冲突中提供了一个安全的空间,并允许创造,思想和言论自由,从而激发了哈林(Harlem)文艺复兴时期。
借助历史的推挽作用以及多种历史因素和背景来告知人类参与者的选择(或缺乏选择),我们是否可以将统计分析用作历史上有意义的工具? 如果您正在撰写历史论文,您会考虑包括卡方分析来支持您的论点吗?
更多资讯
使用此网站可以了解重新编排的历史:1940年代的政策如何导致事实上的城市隔离: https://dsl.richmond.edu/panorama/redlining/
有关改版的全面历史,请参阅Richard Rothstein的 法的色彩:我国政府如何隔离美国的一个被遗忘的历史 (Liveright,2017年)。
实地考察:此内容的灵感来自 世界城市,1898-2012年 和 未来城市实验室 博物馆的旗舰展厅中的画廊, New York at Its Core。 如果可能,请考虑带您的学生参加实地考察! 访问 http://mcny.org/education/field-trips 了解更多信息。
致谢
本系列的教学计划 New York at Its Core 是与纽约市公立学校教师的焦点小组共同开发的:Joy Canning、Max Chomet、Vassili Frantzis、JoAnn Gensert Ph.D.、Jessica Lam、Patty Ng 和 Patricia Schultz。
该项目部分是由于 博物馆与图书馆服务研究所.
这些课程中表达的观点,发现,结论或建议不一定代表博物馆和图书馆服务学院的观点,发现,结论或建议。