社区和社群概况
也许人口普查数据最常见的用途便是了解社群内所有居民的基本信息,包括家庭成员、种族背景、收入水平等。这些统计数据可以帮助读者了解一个区域的相关信息,从而对从居民处可直接看见或听见的内容进行补充。人口普查补充材料通常不涉及大规模的研究设计,但是有助于改善规划和转移支付,并且可以为居民提出的要求提供支持信息。许多情况下,居民和官员只是希望从人口普查数据中获得了解社区或社群统计描述的信息。但是有时,社群的统计信息需要通过更加正式且有组织的方式获得,同时也需要为城市或大都市区中的小片区域编制纲要或简短的统计摘要。
许多社群概况都是关于特定地区基本社会统计数据的工具书或说明手册。这些概况有多个目标,且彼此之间经常相互冲突。概况被要求既要简洁,又要全面。因此,编写者必须从原始资料中提取最为有用的内容,这些内容必须能够为大多数人所理解,且不能出现冗余信息。许多读者从来没有接触过统计数据,他们希望只要看一眼概况,就能够了解哪些特征是需要被关注的。许多概况也希望能够做到客观。这些概况并不鼓励对数据进行特定的解释,其中汇编的统计数据只能被用于有关社区、城市或地区政策问题的讨论。
美国人口普查局的G. M. Young曾经看过许多这样的概况,但是很少对其中的内容和形式表示赞同。他的例子说明:这些概况中包含的信息十分广泛。尽管人口统计、社会经济和住房特征的比重之间差异较大,但是这些概况中的人口普查表格信息作用至关重要。有时候这些数据需要用官方统计信息进行补充,例如出生率和死亡率、房屋建筑、犯罪率、公园和学校等,一般都能提供每个社区的文字说明,甚至还可能提供一些历史数据。在某些情况下,特别是当需要进行对比时更是要使用地图和图片进行介绍。Young从区域内和区域间两方面对概况进行了区分:前者主要提供每个社区的信息,后者则主要用于在不同的社区之间进行比较。区域概况的例子有很多。芝加哥的《社群概况》(The Community Fact Book)可能是最古老且最有名的,也是其他概况的范本。
我们对编制概况的贡献仅限于如何解释每十年一次的人口普查数据。大都市区或城市内部概况的具体形式依赖于社群的需求。分析力求做到全面、明确和准确,目的是帮助研究者选择可用的特征并将其包含在概况中。这些分析本身是非常有趣的,我们可以从中了解这些特征是如何形成地理区域的,也就是我们所谓的社区。
在概况编制过程中出现了两个方法论问题。第一个问题是怎样为社区概况选择适当的地理单元。纽约市共有59个社群,平均每个社群大约有10万人。举例来说,Taylor等使用社区联合会界限(根据多种文献)来重新描述巴尔的摩;这些社区的人口普查数据应当被聚合。另一个例子是芝加哥,该市的77个社群分布在数百个不同的人口普查街区。在城市之外的区域,社群定义则通过市政当局的边界进行确定。这些边界在20世纪20年代被划定之后便没有发生过变更。社区范围的定义在一定程度上可以替代关于社区的定义。近年来,Bogue尝试了另外一个定义系统:首先通过人口普查街区数据定义社群范围,其次对其准确性进行测试。我们使用人口普查街区数据的原因是其适合用于统计地理学分析,且所有的统计区(SMSA)均存在人口普查街区。研究的分析结论甚至完全可以推广到其他系统。
第二个问题更加难以解决,这个问题便是怎样选择使用的变量。只需通过少数几个易于理解的变量就可以展示社区多种特征的大量信息,这样可以扩大社区概况的用途。为达到这一效果,现有的做法差异很大。芝加哥的《社群概况》主要包括人口、种族、住房质量、劳动参与率和社会地位方面的信息。在诸如以上案例中及其他许多情况下,都需提前决定分析中选用的变量。
此外,还有一种可能性:人们可以使用专门适用于资料整理的统计方法,例如因子生态分析法。本书中也运用了该方法进行资料的事先整理,下文中将进行详细介绍。Goldsmith等曾使用因子分析法来描述健康区域概况。甚至有人开始重视针对小面积区域社会指标的开发方法。人们始终关注的一个问题是使用这种多变量的方法如何获得易于解释的结果。对此,我们采用了一种折中的方式,第一步先使用多变量方法,然后再返回,对概况包含的原始变量进行研究。