Innholdsfortegnelse:
- Entity extraction and enrichment
- Søk og varsling
- Samlede funksjoner
- Kartlegging og forretningsinformasjon
Video: Web Programming - Computer Science for Business Leaders 2016 2025
Lagring og gjenoppretting av store mengder data og så fort er bra, og når du har dine nylig administrerte data i NoSQL, kan du gjøre gode ting.
Entity extraction and enrichment
Du kan bruke database utløsere, varslingshandlinger og eksterne systemer for å analysere kildedata. Kanskje det mest er gratis tekst, men nevner kjente fag. Disse utløsere og varslingshandlinger kan markere teksten som en person eller organisasjon, effektivt merke selve innholdet og dokumentet det ligger innenfor.
Et godt eksempel er innholdet i en nyhetsartikkel. Du kan bruke et verktøy som Apache Stanbol eller OpenCalais til å identifisere nøkkelord. Disse verktøyene kan se "President Putin" og bestemme at dette gjelder en person som heter Vladimir Putin, som er russisk, og er den nåværende presidenten i Russland.
Andre eksempler inkluderer navn på sykdommer og medisiner, organisasjoner, samtalemengder, nevnte produkter, og om en kommentar var positiv eller negativ.
Dette er alle eksempler på enhetens ekstraksjon (som er prosessen med automatisk utpakking av typer objekter fra deres tekstnavn) . Ved å identifisere nøkkelord, kan du merke dem eller pakke dem inn i et XML-element, som hjelper deg å søke innhold på en mer effektiv måte.
Entityriching betyr å legge til informasjon basert på den opprinnelige teksten i tillegg til å identifisere den. I Putin-eksempelet kan du slå det enkle tekstordet "Putin" til president Putin. Alternativt kan du slå London til London.
Du kan vise disse dataene i et brukergrensesnitt som markert tekst med en lenke for ytterligere informasjon om hvert emne.
Du kan tilby anrikning ved å bruke gratis tekstsøk, varsling, databaseutløsere og integrasjoner til ekstern programvare som TEMIS Luxid og SmartLogic.
Søk og varsling
Når du har lagret informasjonen din, kan du søke etter det. Fritt tekstsøk er rettferdig, men etter å ha utført enhetens utvinning, har du flere alternativer. Du kan søke spesifikt for en person som heter "Orange" (som i William of Orange) i stedet for søkeoppføringer som omtaler ordet oransje - som selvfølgelig også er en farge og en frukt.
Å gjøre det resulterer i et mer granulært søk. Det tillater også fasettert navigering. Hvis du går til Amazon og søker etter Harry Potter, ser du kategorier for bøker, filmer, spill og så videre. produktkategori er et eksempel på en faset , som viser et aspekt av data i søkeresultatene - det vil si de vanligste verdiene for hver fasett i alle søkeresultatene, til og med de som ikke er på den nåværende siden.
Brukergrensesnitt kan støtte rike utforskninger til data (i tillegg til grunnleggende Google-esque søk). Brukere kan også bruke dem til å lagre og laste tidligere søk.
Du kan konfigurere lagrede søkekriterier slik at varsler blir aktivert når nylig lagt til poster samsvarer med kriteriene. Så, hvis en ny post ankommer som samsvarer med dine søkekriterier, oppstår en handling. Kanskje "Putin" blir Putin
Ikke alle søkemotorer er i stand til å gjøre hvert spørsmålstegn et varsel. Noen er begrenset til tekstfelt; andre kan ikke gjøre geospatiale kriterier. Pass på at du kan håndtere varselene du må konfigurere.
Samlede funksjoner
Når du har funnet relevant informasjon, vil du kanskje grave dypere. Avhengig av kilden, kan du spørre hvor mange land har et BNP på over 400 milliarder dollar, eller hva er gjennomsnittsalderen for alle medlemmene i slektstreet ditt, eller hvor finner de mest slangebittene i Australia. Disse eksemplene illustrerer hvordan analyser utføres over et sett med søkeresultater. Disse er teller, gjennomsnittlig gjennomsnitt og geospatial varmekartberegninger, henholdsvis.
Å kunne foreta slike beregninger ved siden av dataene, gir flere fordeler. Den første fordelen er at du kan bruke indeksene for å fange opp ting. For det andre vil disse indeksene trolig bli lagret i minnet, noe som gjør dem enda raskere. For det tredje er minneindekser spesielt nyttige for en NoSQL-database som bruker Hadoop File System (HDFS) -lagring. HDFS gjør ikke native indeksering eller minnekolonne butikker for rask aggregering beregninger selv - det krever en NoSQL database på toppen for å gjøre dette.
Facetted navigering er et eksempel på count-baserte aggregeringer over søkeresultater som vises i et brukergrensesnitt. Det samme gjelder for en tidslinje som viser antall poster som nevner et bestemt tidspunkt. For eksempel, vil du vise resultater fra dette året, denne måneden eller denne timen?
Hvis du vil ha denne funksjonaliteten, vær sikker på at databasen din har muligheten til å beregne aggregater effektivt ved siden av dataene. De fleste NoSQL-databaser gjør, men noen gjør det ikke.
Kartlegging og forretningsinformasjon
Den neste åpenbare brukergrensesnittutvidelsen innebærer kartlegging og visning av tabelloppsummeringer for direktestyringsinformasjon og historisk forretningsinformasjonsanalyse.
De fleste NoSQL-databaser gir en enkel å integrere REST API i sine databaser. Dette betyr at du kan plugge inn en rekke applikasjonsnivåer, eller til og med koble til JavaScript-applikasjoner direkte til disse databasene. En rekke gode kartleggingsbiblioteker er tilgjengelig for JavaScript. Du kan til og med bruke R Ecosystem til å lage diagrammer basert på data som holdes i disse databasene, etter at du har installert en passende databasekontakt.
Noen NoSQL-databaser gir selv en ODBC- eller JDBC-relasjonsdatabase-plugin-modul. Opprette indekser i en gitt plate og vise dem som en relativ visning er en fin måte å slå ustrukturert data i en NoSQL-dokumentdatabase til data som kan analyseres med et forretningsinformasjonsverktøy.
Sjekk om din NoSQL-databaseleverandør tilbyr visualiseringsverktøy eller har forretningspartnere med verktøy enn kan koble til disse databasene. I vogue-verktøy er Tableau Server, som er en moderne delt forretningsintelligensserver som støtter publisering av interaktive rapporter over data i en rekke databaser, inkludert NoSQL-databaser.
