Video: LFTR (Liquid Fluoride Thorium Reactor) Defended by Kirk Sorensen @ ThEC2018 2025
Data i prediktiv analyse kan identifiseres som streamet, statisk eller en blanding av de to. Strømdata endres kontinuerlig; Eksempler er den konstante strømmen av Facebook-oppdateringer, tweets på Twitter, og de stadig skiftende aksjekursene, mens markedet fortsatt er åpent.
Strømdata endres kontinuerlig; statiske data er selvstendig og vedlagt. Problemene knyttet til statiske data inkluderer hull, utelukker eller feil data, som alle kan kreve noe rensing, forberedelse og forbehandling før du kan bruke statiske data for analyse.
Som med streamede data, kan det oppstå andre problemer. Volum kan være et problem; den rene mengden non-stop data som stadig kommer, kan være overveldende. Og jo raskere dataene strømmer inn, jo vanskeligere er det for analysen å fange opp.
De to hovedmodellene for å analysere streamede data er som følger:
-
Undersøk bare de nyeste datapunktene og ta en beslutning om tilstanden til modellen og dens neste trekk. Denne tilnærmingen er inkrementell - i hovedsak bygger opp et bilde av dataene etter hvert som det kommer.
-
Vurder hele datasettet, eller en delmengde av det, for å avgjøre hver gang nye datapunkter kommer. Denne tilnærmingen er inkludert flere datapunkter i analysen - hva som utgjør "hele" datasettet hver gang nye data legges til.
Avhengig av arten av virksomheten din og den forventede effekten av avgjørelsen, er en modell å foretrekke over den andre.
Noen forretningsdomener, for eksempel analyse av miljø-, markeds- eller intelligensdata, pris nye data som kommer i sanntid. Alle disse dataene må analyseres ettersom de blir streamet - og tolkes ikke bare riktig, men med en gang.
På bakgrunn av den nylig tilgjengelige informasjonen, redigerer modellen hele den interne representasjonen av omverdenen. Å gjøre det gir deg den mest oppdaterte grunnlaget for en avgjørelse du kanskje må gjøre og handle raskt.
For eksempel kan en prediktiv analysemodell behandle en aksjekurs som en datafeed, selv om dataene endrer seg raskt, analyserer dataene i sammenheng med umiddelbare markedsforhold som eksisterer i sanntid, og deretter bestemmer om å handle en bestemt lager.
Det er klart at analysering av streamede data skiller seg fra å analysere statiske data. Analysere en blanding av begge datatyper kan være enda mer utfordrende.
