Este repositório tem como finalidade documentar cada etapa do meu aprendizado em análise de dados utilizando Python. Aqui, vou descrever os conceitos, técnicas e ferramentas que estou aprendendo ao longo do curso, além de compartilhar exemplos práticos e projetos que desenvolvo.
- Por que Python?: Entendendo as vantagens de usar Python para análise de dados.
- Instalação e Configuração: Configurando o ambiente de desenvolvimento, incluindo a instalação de bibliotecas essenciais como
pandas
enumpy
. - Primeiros Passos: Familiarização com a sintaxe básica do Python e estruturas de dados fundamentais.
- Introdução ao pandas: Entendendo o que é um
DataFrame
e como ele é utilizado para manipular dados tabulares. - Leitura e Escrita de Dados: Como carregar dados de arquivos CSV, Excel e outras fontes, e salvar os resultados.
- Seleção e Filtragem: Acessando e filtrando dados específicos dentro de um
DataFrame
. - Limpeza de Dados: Técnicas para lidar com valores faltantes, duplicatas e inconsistências nos dados.
- Introdução ao numpy: Entendendo o que são
arrays
e como eles são usados para operações numéricas eficientes. - Operações Básicas: Realizando operações matemáticas e estatísticas básicas com
arrays
. - Indexação e Slicing: Acessando e manipulando subconjuntos de dados dentro de
arrays
.
- Introdução à Visualização: Importância da visualização de dados para a análise.
- Gráficos Básicos: Criando gráficos de linha, barras, dispersão e histogramas com
matplotlib
. - Gráficos Avançados: Utilizando
seaborn
para criar visualizações mais complexas e informativas.
- Entendendo o Dataset: Analisando a estrutura e o conteúdo do dataset.
- Estatísticas Descritivas: Calculando médias, medianas, desvios padrão e outras métricas estatísticas.
- Identificando Tendências e Padrões: Utilizando gráficos e técnicas estatísticas para identificar tendências e padrões nos dados.
- Conceitos Básicos: Entendendo o que é machine learning e suas principais categorias (supervisionado, não supervisionado).
- Pré-processamento de Dados: Preparando os dados para modelos de machine learning, incluindo normalização e codificação de variáveis categóricas.
- Modelos Simples: Implementando e avaliando modelos simples de regressão e classificação.
📁 Módulos: Cada módulo do curso terá uma pasta dedicada, contendo notebooks Jupyter com exemplos práticos e explicações detalhadas.
📁 Projetos: Projetos desenvolvidos ao longo do curso, aplicando os conceitos aprendidos em datasets reais.
📁 Recursos: Links para artigos, tutoriais e documentação útil para aprofundar o conhecimento.
Este repositório é um reflexo da minha jornada de aprendizado em análise de dados com Python. Através dele, espero não apenas consolidar meu conhecimento, mas também contribuir para a comunidade compartilhando exemplos práticos e insights valiosos.
Sinta-se à vontade para explorar, clonar e contribuir para este repositório! 🚀