Hjem Personlig finansiering Betydningen av klynging og klassifisering i datalogi - dummies

Betydningen av klynging og klassifisering i datalogi - dummies

Video: The Senseless Ambiguity of North American Turn Signals 2024

Video: The Senseless Ambiguity of North American Turn Signals 2024
Anonim

Formålet med klynger og klassifikasjonsalgoritmer er å fornemme og ekstrahere verdier fra store sett med strukturert og ustrukturert data. Hvis du jobber med store mengder ustrukturerte data, er det bare fornuftig å prøve å partisjonere dataene til en slags logiske grupperinger før du prøver å analysere det.

Klynging og klassifisering lar deg ta en oversikt over dataene dine masse, og danner deretter noen logiske strukturer basert på hva du finner der før du går dypere inn i mutter-og-boltsanalysen.

I sin enkleste form er klynger sett med datapunkter som deler lignende attributter, og klyngalgoritmer er metodene som grupperer disse datapunktene til forskjellige klynger basert på deres likheter. Du vil se klyngalgoritmer som brukes til sykdomsklassifisering i medisinsk vitenskap, men du vil også se dem brukt til kundeklassifisering i markedsundersøkelser og for miljøhelse-risikovurdering i miljøteknikk.

Det er forskjellige klyngemetoder, avhengig av hvordan du vil at datasettet ditt skal deles. De to hovedtyper av klyngalgoritmer er

  • Hierarkisk: Algoritmer oppretter separate sett med nestede klynger, hver i sitt eget hierarkiske nivå.

  • Partition: Algoritmer oppretter bare et enkelt sett med klynger.

Du kan bare bruke hierarkiske klyngalgoritmer hvis du allerede kjenner separasjonsavstanden mellom datapunkter i datasettet. Den nærmeste naboalgoritmen som er beskrevet i dette kapitlet tilhører den hierarkiske klassen av klyngalgoritmer.

Du har kanskje hørt om klassifisering og trodde at klassifisering er det samme som clustering. Mange mennesker gjør, men dette er ikke tilfelle. I klassifisering, før du begynner, vet du allerede antall klasser som dataene dine skal grupperes i, og du vet allerede hvilken klasse du vil at hver datapunkt skal tilordnes. I klassifiseringen er dataene i datasettet som læres fra, merket.

Når du bruker klyngalgoritmer, har du på den annen side ikke et forhåndsdefinert konsept for hvor mange klynger som passer for dataene dine, og du stole på klyngalgoritmer for å sortere og klyse dataene på den mest hensiktsmessige måten. Med clusteringsteknikker lærer du fra umerkede data.

For å bedre illustrere arten av klassifisering, ta en titt på Twitter og dets hash-tagging system.Si at du bare fikk tak i favorittdrinken din i hele verden: en iset karamell latte fra Starbucks. Du er så glad for å ha din drink som du bestemmer deg for å tweet om det med et bilde og uttrykket "Dette er den beste latten noensinne! #StarbucksRocks. "Vel, selvfølgelig, inkluderer du" #StarbucksRocks "i tweetet ditt slik at tweeten går inn i #StarbucksRocks-strømmen og er klassifisert sammen med alle de andre tweets som har blitt merket som #StarbucksRocks. Din bruk av hashtag-etiketten i tweetet ditt forteller Twitter hvordan du klassifiserer dataene dine i en gjenkjennelig og tilgjengelig gruppe, eller klynge .

Betydningen av klynging og klassifisering i datalogi - dummies

Redaktørens valg

Hvordan man bygger en arrayformel i Excel 2010 - dummies

Hvordan man bygger en arrayformel i Excel 2010 - dummies

En matriseformel er en spesiell formel som opererer på en rekke verdier i Excel 2010. Når du bygger en matriseformel i et regneark, trykker du Ctrl + Shift + Enter for å sette inn en matriseformel i arrayområdet. For å få en ide om hvordan du bygger og bruker array formler i et regneark, bør du vurdere ...

Hvordan å beregne bevegelige gjennomsnitt i Excel - dummier

Hvordan å beregne bevegelige gjennomsnitt i Excel - dummier

Kommandoen Data Analyse gir et verktøy for beregning av bevegelse og eksponensiell glatt gjennomsnitt i Excel. Anta, for illustrasjons skyld, at du har samlet daglig temperaturinformasjon. Du vil beregne tre-dagers glidende gjennomsnitt - gjennomsnittet for de siste tre dagene - som en del av noen enkle værprognoser. For å beregne bevegelige gjennomsnitt ...

Hvordan du avbryter utskrift i Excel 2013 - dummies

Hvordan du avbryter utskrift i Excel 2013 - dummies

Når du klikker på Hurtigutskrift, ruter Excel 2013 skrive ut jobb til Windows-utskriftskøen, som fungerer som en mellommann og sender jobben til skriveren. Hvis du vil avbryte utskriftsjobben etter at Excel har fullført forsendelsen til utskriftskøen, må du:

Redaktørens valg

Interne og eksterne forhold utforsket på PHR / SPHR eksamenene - dummies

Interne og eksterne forhold utforsket på PHR / SPHR eksamenene - dummies

Relasjoner er hvordan Virksomheten blir gjort, bare fordi folk er kjernen i arbeidet og hvordan folk jobber sammen, påvirker utfallet. Interne forhold eksisterer mellom avdelinger og medarbeidere, samt mellom veiledere og ansatte. Flere PHR / SPHR eksamenskomponenter omhandler disse relasjonene, inkludert følgende: Administrere endring: Fordi forandring er et naturlig utfall ...

Forbereder seg på å takle PHR / SPHR-eksamenene - dummier

Forbereder seg på å takle PHR / SPHR-eksamenene - dummier

Svært få individer tar denne testen uten forberedelse . Graden du forbereder deg på er basert på din unike arbeidserfaring og utdanning. De inkluderer følgende: Studieplaner: En studieplan er et verktøy du designer. Det er en skriftlig angrepsplan som adresserer de tingene som gjør deg unik - din ...

Mottar resultater etter at du har tatt PHR eller SPHR-eksamenen - dummies

Mottar resultater etter at du har tatt PHR eller SPHR-eksamenen - dummies

Tilbake på dagen måtte eksamenstakere vente i seks uker etter resultater etter at de tok PHR eller SPHR-eksamen, men med datastyrt testing får du heldigvis et foreløpig pass eller en feil rett etter at du har fullført eksamen og etterfølgende undersøkelse. Det anbefales at du venter på å publisere eksamenssuksessen din til ...

Redaktørens valg

Hvordan du kan finne en webdesigner for å designe bloggen din - dummies

Hvordan du kan finne en webdesigner for å designe bloggen din - dummies

Du vil kanskje ikke design bloggen din selv - hvem har tid til å rote med all den koden? Webdesignere lager nettsteder og blogger for å leve. Selvfølgelig, fordi disse webkunnige fagfolk stoler på sine ferdigheter for inntekt, gjør de det ikke gratis. Hvis du er heldig, kan du finne en webside ...

Hvordan å evaluere online fellesskapsmedlemskap - dummies

Hvordan å evaluere online fellesskapsmedlemskap - dummies

Sunn online samfunn er levende og aktivt. Medlemmene er hjelpsomme og entusiastiske. Unhealthy samfunn oppdateres ikke ofte, og medlemmene ser ut til å være der bare for å fremme sine egne årsaker eller interesser. Noen ganger er disse fellesskapene ikke oppdatert i det hele tatt. Som samfunnssjef kan du ikke sette opp et fellesskap og håpe på det beste. Du ...

Hvordan du finner kommentarer utenfor din online fellesskap - dummies

Hvordan du finner kommentarer utenfor din online fellesskap - dummies

Som leder, og legger merke til ditt nettbaserte fellesskap betyr også å oppdage hvem som snakker om deg utenfor ditt nærmeste samfunn. Når folk har konstruktiv kritikk, tar de ikke alltid med deg. De liker å legge det til sine egne blogger eller nettverk for å motta trafikken eller lage sin egen diskusjon. Noen ganger vil de ...