Jump to content

Truque simples no tratamento de dados duplicados


kassia.andrade

Postagens Recomendadas


Olá pessoal, existem vários truques para lidar com o tratamento de dados seja esse em linguagem  Python , R ou SQL.
Um dos comandos que vou apresentar hoje é o SELECT INTO do SQL. 

Existem algumas situações em que esse comando é bem útil em bancos de analise onde temos várias fontes de dados. 
Lembrando que não é recomendado o uso deste comando em bancos em produção. 

Comando:

SELECT 
INTO
FROM


Exemplo de caso:
Na tabela_original temos dados duplicados, e uma reimportarão destes dados resultaria em horas de extração pois são muitos registros.
Nesse caso, passamos esses dados com  distinct para desduplicar os dados para a tabela_temporaria utilizando o comando SELECT INTO.
Agora temos a tabela_temporaria com os dados certos sem duplicação.
Segundo passo, removemos os dados da tabela_original onde os dados estão ainda duplicados, e por fim utilizamos novamente o comando SELECT INTO para exportar esses dados já corrigidos da tabela_temporaria
para a tabela_original. 

Exemplo pratico:

SELECT DISTINCT * 
INTO tabela_temporaria 
FROM tabela_original 


drop table tabela_original 


select * 
into tabela_original
from tabela_temporaria

Esse truque simples pode poupar muito tempo quando há a necessidade de exportar dados de uma tabela para outra. 

  • Curtir 1
Link to comment
Compartilhe em outros sites

Crie uma conta ou entre para comentar 😀

Você precisa ser um membro para deixar um comentário.

Crie a sua conta

Participe da nossa comunidade, crie sua conta.
É bem rápido!

Criar minha conta agora

Entrar

Você já tem uma conta?
Faça o login agora.

Entrar agora
  • Quem está online   0 Membros, 0 Anônimos, 30 Visitantes (Ver lista completa)

    • There are no registered users currently online


×
×
  • Create New...