Para começarmos a falar de ETL vamos entender o que essa sigla significa?
ETL é a sigla referente a Extract, transform and load, ou seja: Extrair, transformar e carregar. Esses três passos são fundamentais para a análise de dados e no Power BI são muito utilizados, por isso é muito importante entendermos qual a maneira certa de executá-los. 1° Extrair: A extração de dados é feita através da conexão com a fonte de dados que você irá trabalhar, podendo ser um arquivo em Excel, um banco de dados em SQL ou qualquer uma das inúmeras conexões nativas que o Power BI oferece... O Power BI faz a conexão com a fonte de dados e através dessa conexão os dados serão importados para o Power BI; 2°Transformar: Essa etapa é de extrema importância, é nela que você fará o processo de tratamento de dados. Nessa etapa, você fará a identificação de tabelas Fato e Dimensão, criará a sua tabela dCalendário e fará a limpeza e tratamento dos seus dados... Tudo isso dentro do nosso querido amigo Power Query.
Vamos lá, logo quando você faz a conexão com o Banco de Dados a tela que abre no Power BI é essa aqui:
E aparecem 2 opções de botões que muita gente se confunde:
Você deve escolher a opção “Transformar Dados” para abrir o Power Query e conseguirmos fazer o tratamento dos nossos dados.
Agora vou apresentar algumas dicas que farão toda a diferença na performance do seu relatório:
-Remover colunas que não são utilizadas: Muitas vezes quando fazemos a conexão de dados nem todas as colunas presentes nas tabelas serão utilizadas no relatório, é muito importante selecionarmos apenas as colunas que estão em uso. Isso impacta positivamente na performance, principalmente diminuindo o tempo de atualização do relatório. ⚠️Dica boa é dica compartilhada: Existe um programa chamado Mesure Killer, que mostra todas as colunas e medidas não utilizadas em um relatório, esse programa pode ser baixado na Microsoft Store e é de grande ajuda para otimizar nosso tempo na identificação dessas tabelas. -Desabilitar cargas de tabelas não utilizadas: Durante o processo de tratamento de dados, muitas vezes é necessário fazer uma mesclagem de tabelas e quando isso acontece essas tabelas não podem ser excluídas, pois servem de “base” para a tabela mesclada, por isso desabilitamos a carga dessas tabelas no relatório:
Por último, mas não menos importante:
-As etapas do Power Query:
No canto direito da tela do Power Query é onde fica todas as etapas de transformações aplicadas na tabela:
Quanto mais etapas forem adicionadas mais a performance é comprometida. Por isso, tudo que puder ser feito em uma etapa só ou até mesmo ser editado direto no código é preferível.
Por exemplo, a etapa “Tipo Alterado” que é a etapa que define o tipo de cada coluna (como Texto, Número Inteiro, Data..):
ela pode ser feita em apenas uma etapa:
Depois que todo o tratamento for feito na tabela você pode selecionar todas as colunas e clicar no botão “Detectar Tipo de Dados” na aba “Transformar”:
O Power Query irá identificar automaticamente o tipo de dado de cada coluna.
Mas é importante dar aquele check nos tipos de cada coluna antes de carregar os dados para não deixar escapar nadinha. 😉 3°Carregar: Depois que tiver finalizado toda a sua parte de tratamento de dados é só clicar no botão do canto superior esquerdo para carregar as suas tabelas prontinhas para fazermos a parte de modelagem:
Mas não se preocupe, caso você precise alterar algo no Power Query você pode acessá-lo sempre que precisar, é só clicar em “Transformar Dados” na sua página inicial do Power BI:
Assim, sempre que necessário, você pode fazer alguma alteração na Transformação dos dados.😄 É claro que esses pontos que apresentei para você aqui são só o comecinho de uma área que está sempre evoluindo e é cheia de informações. Por isso, é importante sempre se manter atualizado e pesquisar mais sobre o assunto para se aprofundar cada vez mais. Então não deixe de acompanhar as postagens para ficar sempre por dentro das novidades e dicas que estão sempre por aqui! 🚀