Skip to content

alura-cursos/engenharia-analytics-analises-athena-glue

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

1 Commit
 
 
 
 
 
 
 
 

Repository files navigation

📊 Engenharia de Analytics: Analisando dados com Amazon Athena e AWS Glue

🎯 Objetivo do Projeto

Bem-vindo(a) ao seu treinamento como Engenheiro(a) de Analytics Júnior na Zoop! Neste curso, você assumirá o papel de um(a) profissional que foi encarregado(a) de analisar três bases de dados da empresa para responder a três perguntas de negócio importantes, utilizando os serviços da AWS. Durante o curso, você aprenderá a realizar análises exploratórias, criar visualizações e fornecer insights que ajudarão a Zoop a tomar decisões estratégicas para o seu negócio.

📚 Storytelling do Curso

O gerente de negócios da Zoop te passou uma amostra de três bases de dados, e seu desafio é analisar os dados usando serviços da AWS para gerar insights que respondam às seguintes perguntas:

  1. Quais produtos têm o maior volume de vendas por região e qual o canal de venda mais eficiente?
  2. Quais produtos apresentam maior necessidade de reposição com base no estoque disponível e quantidade vendida?
  3. As avaliações e comentários nas redes sociais impactam as vendas dos produtos?

Você usará o Amazon Athena para realizar consultas SQL e, em seguida, aprofundará a análise utilizando o AWS Glue Notebook, onde aplicará a linguagem Python para gerar visualizações gráficas que ajudarão a apresentar os insights de forma clara e objetiva.

🛠️ Tech Stack Utilizada no Projeto

  • Amazon S3: Para armazenamento das bases de dados.
  • AWS Glue Crawler: Para catalogar os dados e criar tabelas.
  • AWS Glue Data Catalog: Para armazenar metadados das tabelas.
  • AWS Glue ETL Job (Script Editor): Para realizar transformações de dados com Python.
  • Athena: Para realizar consultas SQL nos dados armazenados no S3.
  • Python: A principal linguagem utilizada para análises e visualizações.
  • Pandas: Para manipulação e análise de dados.
  • Matplotlib e Seaborn: Para criação de gráficos e visualizações.
  • Apache Spark: Para processar grandes volumes de dados de forma distribuída.

👥 Público Alvo

Este curso é ideal para:

  • Pessoas interessadas em aprender a realizar análises de dados utilizando Python e SQL.
  • Quem deseja criar visualizações de dados e gerar insights a partir de grandes volumes de dados.
  • Profissionais que pretendem seguir a carreira de Engenharia de Analytics, desenvolvendo habilidades práticas para se destacar na área.

📋 Pré-requisitos

Para aproveitar ao máximo este curso, é importante que você já tenha um conhecimento básico em:

  • Python, especialmente na biblioteca PySpark.
  • Manipulação de DataFrames e uso eficiente de SQL em clusters com Apache Spark.

📊 O Projeto

Durante este curso, você irá:

  1. Realizar consultas SQL no Amazon Athena para obter insights iniciais a partir das três bases de dados da Zoop.
  2. Utilizar o AWS Glue Notebook com Python para aprofundar a análise, gerando gráficos e visualizações que auxiliem na compreensão dos insights.
  3. Aprender a identificar padrões, tendências e correlações que serão fundamentais para responder às perguntas de negócio da Zoop.

Ao final do curso, você terá construído um projeto completo de análise exploratória de dados, sendo capaz de utilizar os principais serviços da AWS para executar análises de dados e apresentar insights que agregam valor para a tomada de decisões em um contexto real de negócios.

🚀 Como Iniciar o Projeto

  1. Clone o repositório:
    git clone <link-do-repositorio>
  2. Siga as instruções no notebook de exemplos para carregar as bases de dados e executar as análises.
  3. Utilize o AWS Glue e o Amazon Athena para aplicar as técnicas aprendidas no curso.

📚 Conteúdos Abordados

  • Uso de SQL no Amazon Athena para consultas exploratórias.
  • Manipulação de dados com Pandas no AWS Glue Notebook.
  • Visualização de dados utilizando Matplotlib e Seaborn.
  • Integração e análise de dados provenientes de diferentes fontes, como vendas, estoque e redes sociais.

📈 Próximos Passos

Este projeto é apenas o começo da jornada para se tornar um(a) Engenheiro(a) de Analytics na Zoop. Conforme você avança, continuará aprimorando suas habilidades em análise de dados, storytelling e tomada de decisões baseadas em insights para ajudar a empresa a alcançar seus objetivos de negócio.

Se você estiver pronto(a) para se aprofundar na análise de dados e transformar números em insights valiosos, esse curso é o lugar certo para começar!

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Jupyter Notebook 94.4%
  • Python 5.6%