-
Notifications
You must be signed in to change notification settings - Fork 1
/
Copy path00-download-dados-do-Censo.R
237 lines (226 loc) · 13.2 KB
/
00-download-dados-do-Censo.R
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
# Faz o download dos dados do Censo
# https://rdrr.io/github/ropensci/ftp/
library(ftp)
library(data.table)
library(readxl)
library(dplyr)
url <- "ftp://ftp.ibge.gov.br/Censos/Censo_Demografico_2010/Resultados_do_Universo/Agregados_por_Setores_Censitarios/"
files <- ftp_list(url, TRUE)
files <- unlist(files)
UFS = c(
'AC',
'AL',
'AM',
'AP',
'BA',
'CE',
'DF',
'ES',
'GO',
'MA',
'MG',
'MS',
'MT',
'PA',
'PB',
'PE',
'PI',
'PR',
'RJ',
'RN',
'RO',
'RR',
'RS',
'SC',
'SE',
'SP_Capital',
'SP_Exceto_Capital',
'TO'
)
setwd('downloads/Censo2010/')
for (uf in UFS) {
# print(uf)
file <- files |>
startsWith(uf) |>
which()
# seila <- files[which(startsWith(files, uf))]
disk_file = files[file]
print(files[file])
if (!file.exists(disk_file)){
paste0(url, files[file]) |>
ftp_fetch(disk = disk_file)
}
unzip(disk_file, junkpaths = TRUE)
# basico <- read_excel("Basico_AC.XLS",
# col_types = c("text", "numeric", "text",
# "numeric", "text", "numeric", "text",
# "numeric", "text", "numeric", "text",
# "numeric", "text", "numeric", "text",
# "numeric", "text", "numeric", "text",
# "numeric", "numeric", "numeric",
# "text", "text", "text", "text", "text",
# "text", "text", "text", "text", "text"))
# Domicilio01 <- read_excel("Domicilio01_AC.XLS",
# col_types = c("text", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric",
# "numeric"))
#
# Responsavel02 <- read_excel("Responsavel02_AC.xls",
# col_types = c("text", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric",
# "numeric", "numeric", "numeric", "numeric", "numeric"))
#
# basico <- basico |>
# select(
# 'Cod_setor',
# 'Cod_Grandes Regiões',
# 'Cod_UF',
# 'Cod_meso',
# 'Cod_RM',
# 'Nome_da_RM',
# 'Cod_municipio',
# 'Nome_do_municipio',
# 'Situacao_setor',
# 'V001',
# 'V002'
# ) |>
# rename(
# 'numero_de_domicilios' = 'V001',
# 'numero_moradores' = 'V002'
# )
#
# Domicilio01 <- Domicilio01 |>
# select(
# 'Cod_setor',
# 'V003',
# 'V002',
# 'V035',
# 'V106',
# 'V023',
# 'V017',
# 'V018',
# 'V025',
# 'V026',
# 'V027',
# 'V028',
# 'V029',
# 'V030',
# 'V031',
# 'V032',
# 'V033',
# 'V010',
# 'V011'
# ) |>
# rename(
# 'domicilios_tipo_casa' = 'V003',
# 'domicilios_particulares_permanentes' = 'V002',
# 'domicilios_com_lixo_coletado' = 'V035',
# 'domicilios_tipo_casa_com_abastecimento_de_agua' = 'V106',
# 'domicilios_particulares_permanentes_sem_banheiro_ou_sanitario' = 'V023',
# 'domicilios_particulares_permanentes_com_banheiro_ligado_a_esgoto' = 'V017',
# 'V018': 'domicilios_particulares_permanentes_com_banheiro_ligado_a_fossa_septica',
# 'V025': 'domicilios_particulares_permanentes_com_1_banheiro',
# 'V026': 'domicilios_particulares_permanentes_com_2_banheiros',
# 'V027': 'domicilios_particulares_permanentes_com_3_banheiros',
# 'V028': 'domicilios_particulares_permanentes_com_4_banheiros',
# 'V029': 'domicilios_particulares_permanentes_com_5_banheiros',
# 'V030': 'domicilios_particulares_permanentes_com_6_banheiros',
# 'V031': 'domicilios_particulares_permanentes_com_7_banheiros',
# 'V032': 'domicilios_particulares_permanentes_com_8_banheiros',
# 'V033': 'domicilios_particulares_permanentes_com_mais_de_9_banheiros',
# 'V010': 'domicilios_particulares_permanentes_cedidos_de_outra_forma',
# 'V011': 'domicilios_particulares_permanentes_em_outra_condicao_de_ocupacao'
# )
#
# geral <- left_join(basico, Domicilio01, by='Cod_setor')
}
## USAR O rbind para concatenar
?rename