-
Notifications
You must be signed in to change notification settings - Fork 128
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
Spider para casos de Rondônia #132
base: master
Are you sure you want to change the base?
Conversation
|
||
self.add_city_case(city=city, confirmed=confirmed, deaths=deaths) | ||
|
||
self.add_city_case(city="Importados/Indefinidos", confirmed=None, deaths=None) |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Eu colocaria um TODO aqui só pra alertar que talvez, no futuro, possamos alterar esses None
caso eles comecem a divulgar o valor.
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Feito
@berinhard a checar se isso se repete nos dados que estamos recuperando via spider, mas nos boletins temos um problema que são inconsistência dos nomes dos municípios. Os casos que tenho catalogados e geralmente vem inconsistentes são (nome que aparece no boletim;nome na nossa base):
|
Olá @robertomb o CSV final com os dados está ficando assim. Teria como conferir se precisamos corrigir algo?
|
Conferi os dados mas não encontrei esses valores nos Boletins mais recentes. Já nos Boletins publicados, em http://www.rondonia.ro.gov.br/covid-19/noticias/boletim-diario-de-casos/:
|
Conferi aqui e está 100%, nenhum município diferente do que temos no nosso modelo de planilha. |
@diegobiavati estou capturando os dados deste site aqui: http://covid19.sesau.ro.gov.br/ A data dos dados é sempre a que está aparecendo no botão verde logo após o texto "Casos Confirmados por Cidade". Pode ser que esses dados sejam atualizados em janelas de intervalos menores do que a de divulgação dos boletins e isso pode explicar a discrepância entre os totais dos dados. |
Muito provavelmente, você está correto. Isso não traria inconsistência para os dados? Vi que o JSON não informa a data/hora de sua atualização. |
@diegobiavati a data da atualização fica no nome do arquivo CSV que gero. Baseio ela exatamente nesse campo de data que informei que está na interface. O formato do CSV está pronto para a importação no brasil.io, por isso, não tem nenhuma informação de data/hora de extração, já que isso é informado pela pessoa colaboradora ao subir a planilha. |
@diegobiavati compartilhou uma fonte nova, em JSON no comentário na issue #3 (comment) |
Esse PR surgiu depois do estudo que fiz na issue #129