《纪事报》得到了加州一个研究小组提供的不准确的移民数据。事情是这样的

提供给《纪事报》的移民数据高估了从其他州迁往加州的人数减少。

提供给《纪事报》的移民数据高估了从其他州迁往加州的人数减少。

卡洛斯·阿维拉·冈萨雷斯/《纪事报》2021年

数据并不总是完美的。就像人力资源一样,数据源可能由于各种原因而不准确。《纪事报》最近就遇到了这样一个案例。

2月25日,周六,《纪事报》发表了一篇题为《加州的移民数量大幅下降——来自每个州》的报道。一个地区的下降尤其严重。”这篇报道基于加州政策实验室提供给《纪事报》的数据,该实验室是加州大学的一个研究小组。

数据强调,从2018年和2019年到2020年和2021年,从美国各州搬到加州的人数有所下降。基于这些数据,我们报道中的图表显示,在大多数州,在此期间向加州的移民人数下降了40%以上。使用同样的数据,这篇文章报告了搬到旧金山的人数出现了更大的下降。

我们公布的数据是错误的。2月26日周日,也就是这篇报道发表的第二天早上,加州政策实验室通知我们,由于信息收集方式上的错误,他们提供的数据是不准确的。bwin登入在得知错误后,我们立即删除了不准确的信息,放置了一个bwin登入在url处撤回故事发表的地方。

根据最新的数据,这些错误导致了对加州移民人数下降的严重夸大。修正后的数据显示,总体下降幅度不到我们发表的文章中所述的一半。

今天我们发表了一篇新故事与校正数据.新数据显示,移民到加州的人数仍比大多数州有所减少,但减少的程度小于不准确的数据集。

来自加州政策实验室的不准确移民数据来自其管理的数据集加州大学消费信贷小组(UC-CCP)该公司每季度追踪大约90%拥有活跃信用信息的加州成年人以及2%的加州以外成年人的动向。bwin登入它从三家全国性征信机构之一收集数据(它没有公布确切的名称)。

这个错误是由于加州政策实验室在2020年初从信用局获取数据的方式发生了变化。这一变化导致,只有在2004年至2019年期间已经在加州生活过,然后又搬回来的人才被算作搬到加州的人。

所有在此期间没有在加州居住,但在2020年和2021年搬到加州的人都被排除在外。《加州纪事报》从未获得加州政策实验室(California Policy Lab)提取的原始数据,而是汇总数据,这些数据显示了从一个县迁移到另一个县的估计人数,如果这个数字大于4。

加州政策实验室对此错误进行了详细的技术解释可以在这里找到

我们为什么要发表这个故事?

纪事报试图为我们的读者提供有关旧金山、湾区和加州最重要问题的高质量信息。bwin登入登录必赢亚洲人们迁入和迁出加州和旧金山的程度对于我们的读者了解该地区的人口趋势至关重要。《纪事报》的数据团队认为,加州政策实验室提供的移民数据是有关该主题的最高质量和最全面的信息,而由加州大学相关研究小组、由经验丰富的研究人员领导提供的数据将是准确的。bwin登入

是什么导致了加州政策实验室的错误?

当《纪事报》询问如何才能避免这一错误时,加州政策实验室通过电子邮件给出了以下回应:

高质量的研究对我们的组织来说是至关重要的,因此我们有多种保障措施和质量保证系统,旨在在发表前捕捉错误。这包括第三方代码审查和针对其他可用评估的基准测试。不幸的是,我们通常的流程没有捕捉到这个特定的错误。如果错误不是在大流行开始时同时出现,我们可能会更早发现它。但由于大流行发生在我们数据提取方式发生变化的同一个季度,因此更难发现。

为了防止这种错误再次发生,我们增加了额外的质量保证措施。这些包括在所有未来的UC-CCP研究中检查这一特定问题;在我们的质量保证过程中增加了另一个步骤来讨论显著的结果,例如我们在我们的12月的报告;在任何可能的情况下,将基准测试(针对类似研究)作为未来研究发布的必要内部步骤。我们的高级工作人员也将在未来几周内开会,讨论我们是否应该实施额外的保障措施。

《纪事报》能做些什么来避免发布这些数据呢?

《纪事报》的数据团队不应该相信加州政策实验室数据的准确性,而是应该与其他公开的移民数据来源进行核对。这些数据源包括美国邮政服务地址变更数据而且美国人口普查移民数据他们有自己的偏见,但如果我们将这些数据集中的移民趋势规模与加州政策实验室的数据进行比较,我们就会发现我们发布的数据中的不准确性。我们以后会做这些检查的。

丹·科普夫是《旧金山纪事报》的数据编辑。电子邮件:dan.kopf@sfchronicle.com

Baidu
map