Python

O que é Pandas?

Escrito por Erick Faria · 4 min. >
O que é Pandas?

Pandas é uma biblioteca amplamente utilizada em Python. O uso do pandas é geralmente feito pelos cientistas de dados e engenheiro de dados para lidar com dados tabulares e estruturados. O Pandas é atualmente a biblioteca mais famosa em python entre os cientistas de dados e é parada obrigatória caso você deseje se tornar um cientista de dados.

O que é Pandas?

Se você está começando a estudar para se tornar um(a) cientista de dados provavelmente já ouviu falar sobre a biblioteca pandas.

O pandas é amplamente utilizado por engenheiros e cientistas de dados para trabalhar e tratar dados tabulares e estruturados. A fama do pandas se dá devido ao grande número de funções que facilita o trabalho de dados tabulares.

Entenda o pandas como se fosse o Excel do Python com muitos recursos e com a possibilidade de automação de vários processos.

Com bandas você consegue transformar colunas, criar variáveis, alterar valores, etc. Logo, quando você vai começar a trabalhar uma série de dados o pandas será o ponto de partida para fazer a limpeza e a estruturação de todos os dados.

Por isso eu fiz a analogia de que o pandas é como se fosse o Excel do Python. Entenda o Python como se fosse o seu sistema operacional Windows. Ouvindo não foi criado para trabalhar com tabelas. É apenas um ambiente em que você instala programas faz a conexão entre o computador físico e a tela que você está enxergando. Para lidar com tabelas você precisa instalar um programa como o Excel.

Trazendo para a linguagem do Python, a analogia é muito semelhante. Você instala o Python e para trabalhar com dados tubulares e tabelas você faz a instalação da biblioteca pandas para trabalhar com esses dados.

O que é linguagem Panda?

Muitas pessoas que estão começando a estudar para se tornar cientista de dados, confunde a biblioteca pandas com uma linguagem de programação.

O pandas não é uma linguagem de programação, é um componente do Python. Entendam bandas como se fosse um programa do seu computador. Vamos voltar a analogia do Excel em seu Windows.

Falar que o pandas é uma linguagem de programação seria equivalente a chamar o Excel de sistema operacional, e assim comparar o Excel com o Windows.

O pandas tem funções próprias e as soluções que você precisa procurar estão dentro do pandas mas o uso da linguagem é o Python.

Para facilitar o entendimento, vamos voltar novamente a analogia do Excel com Windows. Quando você está usando o Excel você está em um ambiente diferente mas com muitas coisas que são herdadas do Windows.

Essa confusão é normal pois quando as pessoas vão falar das soluções em ciência de dados, geralmente elas procuram as soluções diretamente no pandas o que confunde pessoas que estão iniciando.

Para que serve o Pandas?

O pandas serve para muitas coisas, mas a principal utilidade é facilitar e permitir o trabalho e manuseio de tabelas de dados estruturados em Python. Entretanto, o panda serve para muitas outras coisas inclusive para fazer gráficos.

É muito difícil que eu consiga estar aqui todas as utilidades e todas as possibilidades que existe no pandas, pois mesmo eu que utilizo essa biblioteca há mais de 8 anos não conheço todas as funções e a cada dia me surpreendo com novas funções que são implementadas na biblioteca.

Apesar de ser possível fazer algumas coisas sem a biblioteca pandas no Python, com pandas o seu trabalho será muito mais fácil, pois todas as funções nativas dos pandas são feitas exatamente para facilitar o trabalho de pessoas que usam esses tipos de dados.

O que dá para fazer com Pandas?

O pandas serve para trabalhar com dados tubulares permitindo que você faça desde a criação de uma tabela até a confecção de gráficos.

O pandas permite que você faça praticamente tudo que está relacionado aos dados tabulares. É possível criar, deletar colunas, manipular as linhas, reestruturar os dados e até criar alguns gráficos.

Devido a sua grande amplitude de funções é difícil de estar aqui todas as possibilidades que é possível fazer no panda. Veja na lista abaixo algumas das principais possibilidades de se criar com o pandas.

  • Criar DataFrame
  • Criar e Deletar Colunas
  • Agrupar colunas e lindas
  • Estruturar e reestruturar DataFrame
  • Criar gráficos
  • Análises estatísticas

Como usar o Pandas?

Antes de começar a utilizar o pandas é fundamental que você tenha ao menos o conhecimento dos fundamentos em Python. Sem saber programar ao menos o básico de Python é muito difícil que você consiga tirar proveito de tudo o que o pandas pode te oferecer.

Voltando mais uma vez a analogia que eu fiz anteriormente, seria como você começar a utilizar o Excel sem antes aprender a utilizar o sistema operacional Windows. Se você tentar utilizar o Excel sem antes aprender como abrir um programa, minimizar uma janela ou fazer outras atividades básicas do Windows, certamente você terá muita dificuldade em várias etapas que não são necessariamente ligadas ao uso do Excel.

Eu aconselho que você assista os vídeos do curso de Python que eu disponibilizo nessa playlist e que após completar o curso de fundamentos em Python você volte para aprender e começar a fazer a utilização do pandas.

Caso você prefira um conteúdo que está escrito, eu recomendo que você leia o livro fundamentos em Python em que você pode adquirir no seguinte link: Fundamentos em Python: Guia completo para iniciantes

nesse livro de fundamentos em Python você terá todo o conteúdo necessário, condensado de maneira objetiva em um livro e te dará todas as bases para que você possa começar a fazer a utilização do pandas.

Quando você completar as fases de introdução ao Python, o primeiro passo para usar o pandas é por meio de instalação dessa biblioteca e a importação de um arquivo para poder começar a explorar as funcionalidades.

Na sessão abaixo eu compartilho com você algumas dicas para que você possa começar a fazer a utilização da biblioteca pandas em seus trabalhos.

Usando Pandas Python

A biblioteca pandas é tão completo que merece um curso só dessa biblioteca. Aqui no Balaio Científico nós temos vários conteúdos que abordam como fazer a utilização do pandas no Python com foco em ciência de dados.

Abaixo eu compartilho com vocês o que eu considero o ponto de partida para fazer a utilização do pandas que é fazer a importação e abrir um arquivo no pandas.

Abrir o arquivo no pandas é muito simples e a partir de importação do arquivo você conseguirá começar a explorar todas as funções e todo o poder da melhor biblioteca para a ciência de dados em Python.

A partir da aula que eu compartilhei acima você pode visitar a playlist que é possível acessar por meio deste link: Introdução ao Pandas e visitar outras aulas em que abordo sobre a biblioteca pandas.

O vídeo a seguir é um resumo desse post e onde eu mostro para vocês o que é o Pandas. Confira:

Espero que esse post tenha ajudado você a se situar sobre o que é o pandas e como ele possivelmente pode ajudar em seus trabalhos. Para conhecer mais a fundo todas as funcionalidades que estão presentes nessa biblioteca convido que você se inscreva no meu canal e visite periodicamente o blog Balaio científico para conhecer mais conteúdos sobre ciência de dados.

Escrito por Erick Faria
Engenheiro de Dados com Ph.D. em Geografia e experiência em análise espacial e geoprocessamento. Expertise em processamento de grandes volumes de dados geoespaciais, imagens de satélite e dados de mercado, utilizando ferramentas como Spark, Databricks e Google Earth Engine. Experiência em projetos de mercado de carbono, modelos preditivos para investimentos agrícolas e liderança de projetos de dados em saúde pública. Habilidades em Python, R, SQL e diversas ferramentas de engenharia de dados. Profile