Bem-vindo(a) ao seu treinamento como Engenheiro(a) de Analytics Júnior na Zoop! Neste curso, você assumirá o papel de um(a) profissional que foi encarregado(a) de analisar três bases de dados da empresa para responder a três perguntas de negócio importantes, utilizando os serviços da AWS. Durante o curso, você aprenderá a realizar análises exploratórias, criar visualizações e fornecer insights que ajudarão a Zoop a tomar decisões estratégicas para o seu negócio.
O gerente de negócios da Zoop te passou uma amostra de três bases de dados, e seu desafio é analisar os dados usando serviços da AWS para gerar insights que respondam às seguintes perguntas:
- Quais produtos têm o maior volume de vendas por região e qual o canal de venda mais eficiente?
- Quais produtos apresentam maior necessidade de reposição com base no estoque disponível e quantidade vendida?
- As avaliações e comentários nas redes sociais impactam as vendas dos produtos?
Você usará o Amazon Athena para realizar consultas SQL e, em seguida, aprofundará a análise utilizando o AWS Glue Notebook, onde aplicará a linguagem Python para gerar visualizações gráficas que ajudarão a apresentar os insights de forma clara e objetiva.
- Amazon S3: Para armazenamento das bases de dados.
- AWS Glue Crawler: Para catalogar os dados e criar tabelas.
- AWS Glue Data Catalog: Para armazenar metadados das tabelas.
- AWS Glue ETL Job (Script Editor): Para realizar transformações de dados com Python.
- Athena: Para realizar consultas SQL nos dados armazenados no S3.
- Python: A principal linguagem utilizada para análises e visualizações.
- Pandas: Para manipulação e análise de dados.
- Matplotlib e Seaborn: Para criação de gráficos e visualizações.
- Apache Spark: Para processar grandes volumes de dados de forma distribuída.
Este curso é ideal para:
- Pessoas interessadas em aprender a realizar análises de dados utilizando Python e SQL.
- Quem deseja criar visualizações de dados e gerar insights a partir de grandes volumes de dados.
- Profissionais que pretendem seguir a carreira de Engenharia de Analytics, desenvolvendo habilidades práticas para se destacar na área.
Para aproveitar ao máximo este curso, é importante que você já tenha um conhecimento básico em:
- Python, especialmente na biblioteca PySpark.
- Manipulação de DataFrames e uso eficiente de SQL em clusters com Apache Spark.
Durante este curso, você irá:
- Realizar consultas SQL no Amazon Athena para obter insights iniciais a partir das três bases de dados da Zoop.
- Utilizar o AWS Glue Notebook com Python para aprofundar a análise, gerando gráficos e visualizações que auxiliem na compreensão dos insights.
- Aprender a identificar padrões, tendências e correlações que serão fundamentais para responder às perguntas de negócio da Zoop.
Ao final do curso, você terá construído um projeto completo de análise exploratória de dados, sendo capaz de utilizar os principais serviços da AWS para executar análises de dados e apresentar insights que agregam valor para a tomada de decisões em um contexto real de negócios.
- Clone o repositório:
git clone <link-do-repositorio>
- Siga as instruções no notebook de exemplos para carregar as bases de dados e executar as análises.
- Utilize o AWS Glue e o Amazon Athena para aplicar as técnicas aprendidas no curso.
- Uso de SQL no Amazon Athena para consultas exploratórias.
- Manipulação de dados com Pandas no AWS Glue Notebook.
- Visualização de dados utilizando Matplotlib e Seaborn.
- Integração e análise de dados provenientes de diferentes fontes, como vendas, estoque e redes sociais.
Este projeto é apenas o começo da jornada para se tornar um(a) Engenheiro(a) de Analytics na Zoop. Conforme você avança, continuará aprimorando suas habilidades em análise de dados, storytelling e tomada de decisões baseadas em insights para ajudar a empresa a alcançar seus objetivos de negócio.
Se você estiver pronto(a) para se aprofundar na análise de dados e transformar números em insights valiosos, esse curso é o lugar certo para começar!