excess deaths
[repo] / excess-deaths / README.md
1 # Excess Deaths During the Coronavirus Pandemic
2
3 The New York Times is releasing data that documents the number of deaths from all causes that have occurred during the coronavirus pandemic for 24 countries. We are compiling this time series data from national and municipal health departments, vital statistics offices and other official sources in order to better understand the true toll of the pandemic and provide a record for researchers and the public.
4
5 Official Covid-19 death tolls offer a limited view of the impact of the outbreak because they often exclude people who have not been tested and those who died at home. All-cause mortality is widely used by demographers and other researchers to understand the full impact of deadly events, including epidemics, wars and natural disasters. The totals in this data include deaths from Covid-19 as well as those from other causes, likely including people who could not be treated or did not seek treatment for other conditions. 
6
7 We have used this data to produce [graphics tracking the outbreak’s toll](https://www.nytimes.com/interactive/2020/04/21/world/coronavirus-missing-deaths.html) and stories about [Ecuador](https://www.nytimes.com/2020/04/23/world/americas/ecuador-deaths-coronavirus.html), [Russia](https://www.nytimes.com/2020/05/11/world/europe/coronavirus-deaths-moscow.html), [Turkey](https://www.nytimes.com/2020/04/20/world/middleeast/coronavirus-turkey-deaths.html), [Sweden](https://www.nytimes.com/interactive/2020/05/15/world/europe/sweden-coronavirus-deaths.html) and [other countries](https://www.nytimes.com/2020/05/12/world/americas/latin-america-virus-death.html). We would like to thank a number of demographers and other researchers, listed at the end, who have provided data or helped interpret it.
8
9 ## Country and City-Level Data
10
11 The number of all-cause deaths recorded in each area, by week or month, can be found in the **[deaths.csv](deaths.csv)** file. ([Raw CSV](https://raw.githubusercontent.com/nytimes/covid-19-data/master/excess-deaths/deaths.csv)) For weekly data, the first and last weeks of the year, which are often partial weeks, were excluded.
12
13 ```
14 country, placename, frequency, start_date, end_date, year, month, week, deaths, expected_deaths, excess_deaths, baseline
15 France,,weekly,2020-04-27,2020-05-03,2020,4,18,10498,10357,141,2010-2018 weekly average
16 ```
17
18 Some of the data is only available at the city level.
19
20 ```
21 country, placename, frequency, start_date, end_date, year, month, week, deaths, expected_deaths, excess_deaths, baseline
22 Turkey,Istanbul,weekly,2020-04-06,2020-04-12,2020,4,15,2193,1429,764,2018-2019 weekly average
23 ```
24
25 The deaths fields have the following definitions:
26
27 * **deaths**: The total number of confirmed deaths recorded from any cause.
28 * **expected_deaths**: The baseline number of expected deaths, calculated from a historical average. See [expected deaths](#expected-deaths).
29 * **excess_deaths**: The number of deaths minus the expected deaths.
30
31 The time fields have the following definitions:
32
33 * **frequency**: Weekly or monthly, depending on how the data is recorded.
34 * **start_date**: The first date included in the period.
35 * **end_date**: The last date included in the period.
36 * **month**: Numerical month.
37 * **week**: Epidemiological week, which is a standardized way of counting weeks to allow for year-over-year comparisons. Most countries start epi weeks on Mondays, but others vary.
38 * **baseline**: The years used to calculate expected_deaths.
39
40 ## Methodology
41
42 The data is the product of journalists in a number of countries who monitor official data releases and ask government officials for information. We have consulted with demographers, medical officials and local sources to confirm that this data is broadly representative of how many people have died. In some countries, the number of burials, hospital deaths or other factors are used to confirm that the underlying trends are representative.
43
44 But mortality data in the middle of a pandemic is not perfect. Many countries have not yet published any data on all-cause mortality. And during a pandemic, normal patterns of death registration may be disrupted, which could lead to changes in how many deaths are captured. 
45
46 Most of the countries in this dataset have widespread vital statistics coverage. But many low-income countries have [unreliable death registration systems](https://twitter.com/helleringer143/status/1261868447903948800), making it very difficult to assess their levels of excess mortality. A rough guide to the historical completeness of death registration systems by country is available from the United Nations:
47 https://unstats.un.org/unsd/demographic-social/crvs/documents/Website_final_coverage.xls
48
49 Some countries are publishing mortality data faster than normal in order to understand how mortality is changing. That means data, especially for recent time periods, may be revised. It is usually revised upwards as more deaths are reported.
50
51 Other than for New York City, this dataset does not include mortality statistics for the United States. Elsewhere, we have analyzed excess mortality [for the American states](https://www.nytimes.com/interactive/2020/05/05/us/coronavirus-death-toll-us.html) where mortality data is sufficiently complete. Mortality data at the state level is available from the [Centers for Disease Control and Prevention](https://gis.cdc.gov/grasp/fluview/mortality.html).
52
53 See [Data Sources](#data-sources) below for the source of data for each country in this dataset.
54
55 ## Expected Deaths
56
57 We have calculated an average number of expected deaths for each area based on historical data for the same time of year. These expected deaths are the basis for our [excess death calculations](https://www.nytimes.com/interactive/2020/04/21/world/coronavirus-missing-deaths.html), which estimate how many more people have died this year than in an average year.
58
59 The number of years used in the historical averages changes depending on what data is available, whether it is reliable and underlying demographic changes. See Data Sources for the years used to calculate the baselines. The baselines do not adjust for changes in age or other demographics, and they do not account for changes in total population.
60
61 The number of expected deaths are not adjusted for how non-Covid-19 deaths may change during the outbreak, which will take some time to figure out. As countries impose control measures, deaths from causes like road accidents and homicides may decline. And people who die from Covid-19 cannot die later from [other causes](https://twitter.com/AndrewNoymer/status/1241620305350549504), which may reduce other causes of death. Both of these factors, if they play a role, would lead these baselines to understate, rather than overstate, the number of excess deaths.
62
63 ## Data Sources
64
65 **Austria**
66
67 Source: [Statistics Austria](http://www.statistik.at/web_de/statistiken/menschen_und_gesellschaft/bevoelkerung/gestorbene/index.html)  
68 Baseline years: 2015-2019  
69 Data frequency: weekly  
70
71 **Belgium**
72
73 Source: Sciensano publishes a [weekly report](https://covid-19.sciensano.be/fr/covid-19-situation-epidemiologique). More historical mortality data is from the [Belgian Mortality Monitoring](https://epistat.wiv-isp.be/momo/) dashboard.  
74 Baseline years: 2016-2019  
75 Data frequency: weekly  
76
77 **Brazil**
78
79 Source: Data for five cities in Brazil — São Paulo, Rio de Janeiro, Fortaleza, Manaus and Recife — is from the [Registro Civil](https://registrocivil.org.br/) and the Ministry of Health.  
80 Baseline years: 2016-2019  
81 Data frequency: weekly  
82
83 **Denmark**
84
85 Source: [Statistics Denmark](https://www.statbank.dk/dodc2)  
86 Baseline years: 2015-2019  
87 Data frequency: weekly  
88
89 **Ecuador**
90
91 Source: [General Direction of Civil Registry](https://www.registrocivil.gob.ec/cifras/)  
92 Baseline years: 2017-2019. 2019 data is only available for Jan.-April.  
93 Data frequency: monthly  
94
95 **Finland**
96
97 Source: [Statistics Finland](https://pxnet2.stat.fi/PXWeb/pxweb/en/Kokeelliset_tilastot/Kokeelliset_tilastot__vamuu_koke/statfin_vamuu_pxt_12ng.px/)  
98 Baseline years: 2015-2019  
99 Data frequency: weekly  
100
101 **France**
102
103 Source: INSEE (2018-2020 data can be found [here](https://www.insee.fr/fr/statistiques/4487988?sommaire=4487854))  
104 Baseline years: 2010-2019  
105 Data frequency: weekly  
106
107 **Germany**
108
109 Source: [Federal Statistics Office](https://www.destatis.de/EN/Themes/Society-Environment/Population/Deaths-Life-Expectancy/_node.html;jsessionid=91286BFEECCABAD3052B72D2C2760F99.internet8732)  
110 Baseline years: 2016-2019  
111 Data frequency: weekly  
112
113 **Jakarta, Indonesia**
114
115 Source: [Jakarta’s Department of Parks and Cemeteries](https://pertamananpemakaman.jakarta.go.id/v140/t15)  
116 Baseline years: 2010-2019  
117 Data frequency: monthly burials  
118
119 **Israel**
120
121 Source: [Population and Immigration Authority](https://www.gov.il/BlobFolder/news/death_stats_2001_2020/he/death_stats_2001_2020.pdf)  
122 Baseline years: 2015-2019  
123 Data frequency: monthly  
124
125 **Italy**
126
127 Source: [The Italian National Institute of Statistics](https://www.istat.it/en/archivio/240106)  
128 Baseline years: 2015-2019 monthly average. Historical data is only available as a four-year average from January 1 through March 31.  
129 Data frequency: monthly  
130
131 **Netherlands**
132
133 Source: [Statistics Netherlands](https://opendata.cbs.nl/#/CBS/en/dataset/70895ENG/table?ts=1588591754264)  
134 Baseline years: 2016-2019  
135 Data frequency: weekly  
136
137 **Norway**
138
139 Source: [Statistics Norway](https://www.ssb.no/statbank/table/07995/)  
140 Baseline years: 2015-2019  
141 Data frequency: weekly  
142
143 **Peru**
144
145 Source: [Mortality Information System](https://www.minsa.gob.pe/defunciones/) (Sinadef) for 2017-2020; Health Ministry for 2016.  
146 Baseline years: 2017-2019  
147 Data frequency: monthly  
148
149 **Portugal**
150
151 Source: Eurostat  
152 Baseline years: 2015-2019  
153 Data frequency: weekly  
154
155 **Moscow, Russia**
156
157 Source: [Moscow City Government](https://data.mos.ru/opendata/7704111479-dinamika-registratsii-aktov-grajdanskogo-sostoyaniya?pageNumber=13&versionNumber=3&releaseNumber=42&fbclid=IwAR23dK1YBLeGipw4UPg4hi_w6cDOE94fuZ0Z7lwx28u-rAZCEoqAAaIQpF8)  
158 Baseline years: 2015-2019  
159 Data frequency: monthly  
160
161 **Sweden**
162
163 Source: [Statistics Sweden](https://www.scb.se/en/About-us/news-and-press-releases/statistics-sweden-to-publish-preliminary-statistics-on-deaths-in-sweden/)  
164 Baseline years: 2015-2019  
165 Data frequency: weekly  
166
167 **Switzerland**
168
169 Source: [Federal Statistics Bureau](https://www.bfs.admin.ch/bfs/fr/home/statistiques/sante/etat-sante/mortalite-causes-deces.html)  
170 Baseline years: 2016-2019  
171 Data frequency: weekly  
172
173 **United Kingdom**
174
175 Sources: [Office for National Statistics](https://www.ons.gov.uk/peoplepopulationandcommunity/birthsdeathsandmarriages/deaths/datasets/weeklyprovisionalfiguresondeathsregisteredinenglandandwales); [National Records of Scotland](https://www.nrscotland.gov.uk/covid19stats); [Northern Ireland Statistics and Research Agency](https://www.nisra.gov.uk/publications/weekly-deaths).  
176 Baseline years: 2010-2019  
177 Data frequency: weekly  
178
179 **New York City, United States**
180
181 Source: [Centers for Disease Control and Prevention](https://gis.cdc.gov/grasp/fluview/mortality.html); [NYC Department of Health and Mental Hygiene](https://www1.nyc.gov/site/doh/covid/covid-19-data.page)  
182 Baseline years: 2017-2019   
183 Data frequency: weekly
184
185 ## Other Collections of All-Cause Mortality Data
186
187 [The Human Mortality Database](https://www.mortality.org/) includes recent all-cause deaths collected by demographers at the Max Planck Institute for Demographic Research and other institutions. [The Economist](https://www.economist.com/graphic-detail/2020/04/16/tracking-covid-19-excess-deaths-across-countries) has collected all-cause deaths and has made its [data](https://github.com/TheEconomist/covid-19-excess-deaths-tracker) publicly available. And the [Financial Times](https://www.ft.com/content/6bd88b7d-3386-4543-b2e9-0d5c6fac846c) has also collected all-cause deaths data.
188
189 ## License and Attribution
190
191 This data is licensed under the same terms as our Coronavirus Data in the United States data. In general, we are making this data publicly available for broad, noncommercial public use including by medical and public health researchers, policymakers, analysts and local news media.
192
193 If you use this data, you must attribute it to “The New York Times” in any publication. If you would like a more expanded description of the data, you could say “Data from The New York Times, based on reports from national and municipal health agencies.”
194
195 If you use it in an online presentation, we would appreciate it if you would link to our graphic tracking  these deaths [https://www.nytimes.com/interactive/2020/04/21/world/coronavirus-missing-deaths.html](https://www.nytimes.com/interactive/2020/04/21/world/coronavirus-missing-deaths.html).
196
197 If you use this data, please let us know at [covid-data@nytimes.com](mailto:covid-data@nytimes.com?subject=Excess%20Deaths%20Data).
198
199 See our [LICENSE](../LICENSE) for the full terms of use for this data.
200
201 ## Contact Us
202
203 If you have questions about the data or licensing conditions, please contact us at:
204
205 [covid-data@nytimes.com](mailto:covid-data@nytimes.com?subject=Excess%20Deaths%20Data)
206
207
208 ## Contributors
209
210 Allison McCann and Jin Wu have been leading our data collection efforts. 
211
212 Josh Katz contributed reporting from New York, Elian Peltier from Paris, Muktita Suhartono from Bangkok, Carlotta Gall from Istanbul, Anatoly Kurmanaev from Caracas, Venezuela, Monika Pronczuk from Brussels, José María León Cabrera from Quito, Ecuador, Irit Pazner from Jerusalem, Mirelis Morales from Lima and Manuela Andreoni from Rio de Janeiro.
213
214 Thank you to Stéphane Helleringer, Johns Hopkins University; Tim Riffe, Max Planck Institute for Demographic Research; Lasse Skafte Vestergaard, EuroMOMO; Vladimir Shkolnikov, Max Planck Institute for Demographic Research; Jenny Garcia, Institut National d'Études Démographiques; Tom Moultrie, University of Cape Town; Isaac Sasson, Tel Aviv University; Patrick Gerland, United Nations; S V Subramanian, Harvard University; Paulo Lotufo, University of São Paulo; and Marcelo Oliveira.
215