top of page
Posts do fórum
Fabiana de Almeida Soares
21 de mar. de 2023
In Power BI
Este artigo tem como objetivo ensinar como atualizar a versão do seu Power BI Desktop, para que você possa ter acesso aos novos recursos disponibilizado pela Microsoft.
Figura 1: Ícone atualização
Fonte: Freepik Sabemos que mensalmente a Microsoft lança atualizações incrementais do Power BI Desktop, geralmente novos recursos são disponibilizados e muitos querem usufruir destes novos recursos, porém antes de habilitá-lo, é necessário considerar dois critérios.
Primeiro, você precisa saber qual é a versão atual do Power BI instalado em sua máquina, clicando no link abaixo você encontra um passo a passo explicando como descobrir a versão.
Versão Power BI O segundo critério a ser considerado, é que existem duas maneiras de instalar o Power BI Desktop em sua máquina, através da Microsoft Store (loja de aplicativos do Windows) ou pelo próprio site da Microsoft, com isso, é necessário identificar por onde foi realizada a sua instalação.
Identificado? Então, vamos colocar a mão na massa!
Atualizando a versão do Power BI, através da loja Microsoft Store.
A vantagem ter a versão do Power BI Desktop instalado pela loja da Microsoft, é que as atualizações ocorrem automaticamente na medida em que novas versões são lançadas oficialmente, mas nada que te impeça de forçar a atualização manualmente.
1º Passo: Em seu computador, acesse o “menu” da barra de pesquisa do Windows, digite “Microsoft Store” e clique no aplicativo. Figura 2: Pesquisando Microsoft Store Fonte: autora
2º Passo: Ao abrir a loja de aplicativos, pesquise por “Power BI Desktop” e clique em “atualizar”.
Figura 2: Power BI Desktop Fonte: autora
Atualizando a versão do Power BI pelo site da Microsoft.
Ao contrário ter a versão do Power BI instalado pela loja Microsoft Store e a atualização ocorrer automaticamente, ao instalar pelo site da Microsoft é necessário atualizar a versão do seu Power BI Desktop manualmente fazendo uma nova instalação.
Atenção: Não é necessário desinstalar o Power BI Desktop que já consta em sua máquina, é só fazer uma nova instalação de acordo com o passo a passo abaixo.
1º Passo: Pesquise pelo Google por “Power BI Office downloads” e clique no link que retorna “Microsoft Power BI Desktop”.
Se quiser acessar diretamente a página, clique aqui Figura 3: Power BI Office downloads Fonte: Google
2º Passo: Vai abrir a seguinte página, conforme imagem abaixo. Primeiro, é necessário selecionar o “idioma” e posteriormente clique em “baixar” para ser direcionado para uma outra página.
Figura 4: Power BI Desktop download Fonte: Microsoft 3º Passo: Selecione o download desejado, no meu caso seria a primeira opção e consequentemente clique em “next”. O Power BI Desktop será baixado em sua máquina e você deve fazer o processo de instalação.
Figura 5: Definindo download desejado Fonte: Microsoft
Observação: Os recursos de cada atualização do Power BI Desktop só estarão disponíveis após a atualização da versão do seu Power BI Desktop e se a nova atualização estiver liberada oficialmente pela Microsoft.
Após atualizar a versão atual do Power BI Desktop, o novo recurso fica inativo, para ativá-lo é necessário habilitá-lo. No link abaixo cito como exemplo, a habilitação do recurso disponibilizado pela Microsoft na atualização liberado no mês de março de 2023. Habilitando recurso Power BI
È isso pessoal, espero ter lhe ajudado, até um próximo artigo!
2
0
6k
Fabiana de Almeida Soares
07 de mar. de 2023
In Big Data
Grandes volumes de dados vêm sendo gerados diariamente pelas organizações e tratar, armazenar e gerencia-los tem sido um dos principais desafios para muitas empresas. Os dados precisam ser armazenados em uma infraestrutura bem adequada, segura e escalável, para isso há diversos tipos de repositórios de armazenamentos e a escolha de um depende muito do tipo de dado.
Figura 1: Extração de Dados Fonte: Undraw Neste artigo em específico, será abordado de forma resumida, os conceitos juntamente aos prós e contras de dois tipos de repositórios de dados, Data Lake e Data Warehouse. Data Lake é um repositório que permite armazenar dados de diversas fontes, sejam estruturados, semiestruturados ou não estruturados e sem limitação de tamanho, como por exemplo: de rede social, excel, arquivos txt, banco de dados relacionais e não relacionais em seu formato bruto/original. Para carregar os dados não precisa de uma preparação prévia, não preciso se preocupar em limpar, organizar ou criar uma estrutura é permitido armazenar os dados sem um esquema definido. O processo de armazenamento de dados é totalmente diferente do Data Warehouse, para o Data Lake o processo aplicado é o ELT (Extração, Carregamento, Transformação), primeiro é feita a extração de dados das fontes, em seguida faz-se o carregamento e por último é aplicada a transformação pelo profissional responsável pela análise, retornando apenas os dados necessários.
Figura 2: Processo Data Lake Fonte: Data Science Academy
Com o Data Lake é possível trabalhar com os mais avançados tipos de análise para extrair insights, como consultas SQL, Machine Learning, análises em tempo real, análises estatísticas e outras, isso ocorre porque o Data Lake é considerado um “lago de dados”, levando em consideração que os dados de ficam centralizados em um único repositório possibilitando um leque de opções. Confira os prós e contras do Data Lake:
Prós:
Dados em formato bruto: dados armazenados sem a necessidade de definição de esquema e tratamento dos dados. Tamanho: importação de qualquer tamanho de dados em tempo real e de várias fontes. Repositório Central: Sendo o Data Lake um “lago de dados”, diversas pessoas que lidam diretamente com os dados podem acessa-los, seja um Analista de Dados, Engenheiros de Dados, Cientistas de Dados e outros, de tal forma, que a extração dos dados vai depender da necessidade de cada um. Não tem a necessidade de mover os dados: a conexão dos dados é feita de forma direta sem a necessidade de mover os dados para algum sistema de análise. Altamente acessível: dados acessados de forma rápida. Contra: Não possui supervisão do conteúdo, os dados são armazenados da forma que chegam, e sem o cuidado necessário com o Data Lake você passa a ter lixo armazenado.
Agora vamos falar sobre o Data Warehouse.
Data Warehouse (DW) é um repositório de armazenamento que recebe e combina grandes volumes de dados extraído de diversas fontes, são transformados e totalmente estruturados para um fim específico para tomada de decisões estratégicas. O processo aplicado é o ETL (Extração, Transformação, Carregamento) funciona da seguinte maneira: primeiro ocorre a extração dos dados das fontes, segundo aplicam-se as transformações necessárias de acordo com o esquema definido que resume a visão geral da organização dos dados (este esquema deve ser definido antes do processo de carregamento dos dados), e por fim o carregamento dos dados no Data Warehouse.
Figura 3: Processo Data Warehouse
Fonte: Data Science Academy
O DW é um banco de dado relacional, sua implementação é feita através de um SGDB (Sistema de Gerenciamento de Banco de Dados) como por exemplo Oracle, SQl Server, DB2 dentre outros. O DW é a melhor opção para armazenar dados estruturados de forma consolidada, agregada e resumida ou para armazenar dados que serão utilizados para um propósito específico. Confira os prós e contras do DW: Prós:
Dados prontos para uso: oferecendo suporte às análises de negócios de uma organização, com o DW o a acesso aos dados é completo para uma análise definida. Consultas rápidas: com o DW você consegue consultar rapidamente grandes quantidades de dados porque os dados já estão todos estruturados, tornando-se a “fonte única”.
Dados com qualidade: antes mesmo de serem carregados para o DW é feita uma limpeza, transformação e enriquecimento dos dados, no final, são armazenados dados precisos e de alta qualidade para análises de tomadas de decisões. Visão histórica: o DW armazena dados históricos, esses dados são importantes para que os tomadores de decisões sempre se baseiam em fatos históricos para fazer previsões e conferir se suas ações atuais estão melhorando ou não. Contra: Risco de perder dados: por serem utilizados por um objetivo específico e por serem apenas dados estruturados, alguns dados na etapa de transformação se “perdem”. Lentidão coleta de dados: os dados coletados de diversas fontes em tempo real têm dificuldade para chegar ao DW, por causa da etapa de limpeza e transformação de dados, ou seja, esse processo pode causar lentidão. Análises e Usuários Limitados: são acessados por usuários finais de negócios, não dá para estudar os dados em sua forma bruta para obter insights mais avançados. Você deve estar se perguntando: Qual é o melhor repositório? Ambos os repositórios possuem suas vantagens e desvantagens e a escolha do mesmo depende da análise desses critérios, do projeto, objetivo e da necessidade da empresa.
Espero que esse artigo tenha lhe ajudado. Até breve!
3
2
242
Fabiana de Almeida Soares
30 de jan. de 2023
In Power BI
Um profissional que trabalha na área de dados vai ouvir muito o termo “granularidade”. Compreender este conceito é fundamental para entender e interpretar os seus dados, assim como, identificar se a análise será macro, micro ou vice- versa, além de questionar: Que tipos de insights é possível gerar com estes dados? Até que grau dos dados é possível gerar análise? Que tipo de dados serão necessários para solucionar determinado problema?
A granularidade se refere ao nível de detalhamento dos dados, e a forma como os dados estão sumarizados, o detalhamento dos dados condiz com a granularidade que pode ser maior ou menor, vamos de exemplo básico. Imagina um produtor que vende as suas maçãs em toneladas, você não consegue fazer uma análise detalhada dessas maçãs devido ao nível de granularidade ser muito alto. Agora vamos pensar em uma pessoa que vá até um supermercado comprar maçãs, essa pessoa consegue fazer a seleção do produto, consegue identificar a qualidade do mesmo e escolher o que melhor lhe atende. Isso ocorre pelo devido fato das maçãs estar em um nível de granularidade baixo e, com isso, é possível fazer uma análise mais detalhada das mesmas.
Figura 1: Exemplo 1
Fonte: Imagem criada pela autora
Quanto menor for a granularidade, maior são os níveis de detalhes dos dados. Com isso, você consegue fazer uma análise mais precisa, porém, requer um espaço maior de armazenamento no repositório de dados e por se tratar de um volume maior de dados o tempo de resposta das consultas geradas é mais lento.
Já quanto maior a granularidade, menor são os níveis de detalhes dos dados. Com isso, você gera uma análise mais macro, requer um espaço menor de armazenamento no repositório de dados e o tempo de respostas as consultas é mais performático. Veja abaixo uma imagem que ilustra a granularidade e o detalhamento dos dados.
Figura 2: Granularidade
Fonte: Imagem criada pela autora
Para compreender ainda mais o termo granularidade, segue mais uma analogia.
Você precisa comprar um tênis, com isso, realiza uma pesquisa no Google e como resultado aparecem diversas pesquisas de forma abrangente e não é exatamente este o resultado desejado, sendo assim, para obter uma pesquisa mais detalhada do produto, você precisa refazer a pesquisa considerando outras informações, como por exemplo: marca, tamanho ou até mesmo a cor. Perceba, que você está detalhando o produto considerando diversos atributos para obter exatamente um resultado específico. Portanto, você saiu de uma pesquisa macro para uma pesquisa micro com mais detalhes.
Figura 3: Exemplo 2- Tênis Feminino
Fonte: Google
Figura 4: Exemplo 2- Tênis Feminino Olympikus
Fonte: Google
Figura 5: Exemplo 2 - Tênis Feminino Olympikus número 35
Fonte: Google
Figura 6: Exemplo 2 - Tênis Feminino Olympikus, número 35, cor preta
Fonte: Google
Para definir como deseja que os dados sejam dispostos, considerando o nível de detalhamento dos dados, a forma como pretende organizá-los e depositá-los em um repositório de dados, é necessário sempre se questionar que tipo de problema de negócio deseja resolver, por exemplo:
Quando está atuando em um projeto pode ocorrer do cliente solicitar uma análise de suas vendas por hora, porque ele tem interesse em identificar quais(al) os horários de maior venda para que consequentemente venha tomar decisões. Com isso, temos que perguntar ao cliente se o atributo hora é uma informação que está disponível na base de dados, para que a análise seja criada conforme solicitado.
Outro exemplo, os dados são detalhados até o nível de hora, mas o relatório é uma análise para o CEO que quer ver comparativos entre um mês e outro, o ano atual vs o anterior. Para esse relatório é possível então deixar o dado agregado ao nível de data deixado, reduzindo o volume de dados e deixar ele no nível de hora somente para os relatórios onde essa informação é importante.
Figura 7: Exemplo 3 – Faturamento e Qtd Vendas por Ano
Fonte: Imagem criada pela autora
Figura 8: Exemplo 3 – Faturamento e Qtd Vendas por Mês
Fonte: Imagem criada pela autora
Figura 9: Exemplo 3 – Faturamento por Hora
Fonte: Imagem criada pela autora
Por isso é importante entender sobre a granularidade dos dados até mesmo para responder ao cliente se será possível criar a análise da forma que ele está solicitando. De nada adianta o cliente demandar um tipo de análise se os dados não estão disponíveis e granulados na medida certa para criar um dashboard de análises de negócio, que auxiliará nas tomadas de decisões de forma rápida a assertiva, atendendo a expectativa do usuário final.
Por tudo isso, perceba que a granularidade é um conceito essencial no mundo de dados e sua compreensão é importantíssimo para um projeto de sucesso.
6
2
1k
Fabiana de Almeida Soares
Mais ações
bottom of page