4.5/5

Data Preprocessing with Python: Clean, Transform & Analyze

Fernando Pereira

Lead Technology & Training Manager

Preço normal
Colaboradores Findmore

Inscrição

250€
  • O valor da formação inclui:
  • Certificado DGERT
  • Exercícios Práticos
  • Download de Recursos

ÉS COLABORADOR FINDMORE?

Inscreve-te gratuitamente
  • Esta formação inclui:
  • Certificado DGERT
  • Exercícios Práticos
  • Download de Recursos

Datas

De 23 de Outubro a 06 de Novembro

Nº de Horas

10 horas

Horário

Pós-Laboral

NÍVEL

Intermédio

Local

Remote Sessions

Certificação

Objetivos da Formação

O objetivo da formação é capacitar os formandos a projetar pipelines eficientes para pré‑processamento de dados com Python, utilizando bibliotecas consolidadas como Pandas, NumPy e scikit-learn, de forma a preparar datasets de forma reprodutível e com performance para utilização em scikit‑learn.
Neste contexto, os formandos irão importar dados de diferentes fontes (CSV, Excel, bases de dados) usando Pandas e NumPy, realizar EDA inicial e diagnóstico de integridade (tipos, dados em falta, coerência e estatística descritiva), e aplicar técnicas de limpeza avançada, feature engineering, encoding e escalonamento com scikit-learn.
A formação inclui ainda a construção de ColumnTransformer e Pipeline para garantir consistência entre treino e teste, a introdução ao Polars como alternativa moderna focada em performance, e a construção prática de uma pipeline completa de pré-processamento de dados.

Programa

Sessão 1:
– Introdução ao Pandas & NumPy – criação de DataFrames, head, info, describe, seleção e filtragem; leitura de ficheiros CSV, Excel e bases de dados (ex: SQLite); EDA básica e verificação da coerência dos dados.

Sessão 2:
– Operações avançadas com Pandas – merge, groupby, pivot/reshape; parsing de datas, deteção de duplicados; feature engineering com derivação de colunas; exportação do data frame limpo
– Menção do Polars

Sessão 3:
– scikit‑learn: pre‑processamento – imputação (SimpleImputer), codificação (OneHotEncoder / OrdinalEncoder), normalização (StandardScaler / MinMaxScaler), tratamento de outliers, introdução a PCA

Sessão 4:
– Demonstração completa do pipeline – usar ColumnTransformer e Pipeline para encadear leitura → limpeza → codificação → escalonamento → treino/teste split → predição. Mostra o fluxo completo sobre dataset exemplo

Sessão 5:
– Projeto de pré-processamento de dados, limpeza, EDA, transformação, organização e criação da pipeline.

Calendário da formação

23 de Outubro de 2025 | 19h00 – 21h00
28 de Outubro de 2025 | 19h00 – 21h00
30 de Outubro de 2025 | 19h00 – 21h00
04 de Novembro de 2025 | 19h00 – 21h00
06 de Novembro de 2025 | 19h00 – 21h00

Requisitos para participar

Computador com Python 3.10+, Jupyter Notebook (ou VS Code com extensão Python). Pacotes instalados: pandas, numpy, scikit‑learn, polars, pyarrow.

Sobre a Findmore Academy

A Findmore Academy faz parte da Findmore Consulting e nasceu pela necessidade de oferecer formação continua a todos os colaboradores da empresa. 

Hoje a Findmore Academy é aberta a toda a gente e oferece formação nas mais diversas e modernas tecnologias bem como em soft skills.

As nossas formações são certificadas pela DGERT.

Está quase!

Preenche o formulário para te inscreveres

Formação Seleccionada

Data Preprocessing with Python: Clean, Transform & Analyze

PREÇO

250€

Está quase!

Preenche o formulário para te inscreveres

Formação Seleccionada

Data Preprocessing with Python: Clean, Transform & Analyze

PREÇO

Gratuito para membros Findmore

Queres ser formador na nossa academia?

Aulas Remotas

Podes trabalhar em qualquer lugar.

Ganha dinheiro

Sempre que fores requisitado para uma formação.

Inspira e Partilha

O teu conhecimento com os nossos alunos

Com dúvidas? Consulte as nossas FAQ’s

Formulário de Candidatura

*Campos Obrigatórios