Atualizar raspador para a Associação de Municípios do Amazonas #1296
Labels
dificuldade:baixa
Pouco desafiador de desenvolver
priority
Issue endereça algo prioritário
spider
Adiciona robô raspador para município(s)
Milestone
Parece que a associação de municípios do Amazonas migrou de site:
antes: https://www.diariomunicipal.com.br/aam; agora: https://diariomunicipalaam.org.br/
Então o raspador que temos - am_associacao_municipios.py que usa a BaseSigpub - pode não servir mais. Ao mesmo tempo, alguns elementos de página e o layout do diário parecem seguir iguais.
Tarefa
É necessário confirmar se realmente a mudança do site demanda a mudança do raspador, testando o código atual para a nova URL e, caso o código que temos não servir mais, desenvolver o raspador para o site novo.
É necessário atualizar o raspador para seguir o padrão de projeto. Por exemplo, está faltando o
start_date
(não achei a data exata, a edição mais velha que consegui encontrar é a 11: https://diariomunicipalaam.org.br/visualizar-publicacao/20091023). Se a edição 11 está em outubro de 2009, a 1 deve estar por ali no meio do ano de 2009.Interessante notar que nesse site novo, o
/path
é a data. No caso acima20091023
<> 2009-10-23The text was updated successfully, but these errors were encountered: