Video: Fisjon og fusjon 2025
Når dataene dine er på mer enn ett sted, trenger du måter å sette alt på sammen. Når du går med to datasett med forskjellige variabler, er du sammenslåing data. Sammenslåing er en felles operasjon. Sammenslåing brukes ofte i datautvinning, og kombinerer koblede data som
-
Kundeopplysninger og markedsføringskampanjedata
-
Før og etter testresultater
-
Intern og leverandørdata
Hvis du vil slå sammen datasett, må du ha en variabel som identifiserer tilfeller for matching; dette kalles en nøkkel eller identifikator variabel. Og du må kanskje identifisere et datasett som primært; Hovedtabellen må bare ha én sak for noen verdi av nøkkelvariabelen.
Noen data mining applikasjoner har mer enn ett verktøy for sammenslåing av datasett: Den første figuren viser verktøyet for grunnleggende sammenslåinger, og den andre figuren viser verktøyet for å sette opp mer komplekse sammenslåingskriterier.
Hvis datakildene dine inneholder de samme variablene (mer eller mindre, kampen må ikke være identisk), men forskjellige tilfeller kalles vedlegg eller sammenkobling >. Som å slå sammen, er dette en vanlig operasjon. Den brukes når du har nye saker for noe du allerede har sporet.
append, concatenate , eller slå sammen rader.
