Este repositório conta com dados de web scraping das páginas do site IMDB a partir de pesquisa feita com as seguintes palavras-chave: "alien", "extraterrestrial" e "alien invasion".
As informações coletadas foram utilizadas como base para a produção do conteúdo do webstories Ovnis nos cinemas, do O POVO+.
Para a raspagem do conteúdo das páginas, foi utilizada a extensão webscraper.io para browsers como Google Chrome.
O sitemap criado para a raspagem está disponível neste repositório e pode ser utilizado para reproduzir a coleta.
Para isso, é necessário que o usuário acesse a página desejada — no caso, a dessa pesquisa no IMDB —, importar o conteúdo do arquivo sitemap.txt
e iniciar o scraping.
O arquivo com o resultado do web scraping está disponível em data/movies_aliens.csv
.