Video: How To Install MySQL on Windows 10 2025
Søkemotorinnovatorer som Yahoo! og Google ble møtt med et mose data problem. De trengte å finne en måte å gi mening om de enorme mengdene data som deres motorer samler inn. Disse selskapene trengte både å forstå hvilken informasjon de samler og hvordan de kunne tjene penger på dataene for å støtte forretningsmodellen.
Hadoop ble utviklet fordi den representerte den mest pragmatiske måten å tillate bedrifter å håndtere store datamengder enkelt. Hadoop tillot store problemer å bli brutt ned i mindre elementer slik at analyse kunne gjøres raskt og kostnadseffektivt.
Ved å bryte det store dataproblemet i små biter som kunne behandles parallelt, kan du behandle informasjonen og omgruppere de små brikkene for å presentere resultater.
Hadoop ble opprinnelig bygget av en Yahoo! ingeniør kalt Doug Cutting og er nå et åpen kildekode prosjekt administrert av Apache Software Foundation. Den blir gjort tilgjengelig under Apache-lisensen v2. 0.
Hadoop er en grunnleggende byggestein i vårt ønske om å fange og behandle store data. Hadoop er designet for å parallellisere databehandling på tvers av databehandlingsknuter for å øke hastigheten på beregninger og skjule latens. I kjerne har Hadoop to hovedkomponenter:
-
Hadoop distribuert filsystem: En pålitelig, høy båndbredde, lavpris, datalagringsklynge som gjør det mulig å administrere relaterte filer på tvers av maskiner.
-
MapReduce motor: En høy ytelse parallell / distribuert databehandling implementering av MapReduce algoritmen.
Hadoop er utviklet for å behandle store mengder strukturert og ustrukturert data (terabyte til petabytes) og implementeres på rack av råvareservere som en Hadoop-klynge. Servere kan legges til eller fjernes fra klyngen dynamisk fordi Hadoop er designet for å være "selvhelbredende. "Hadoop kan med andre ord oppdage endringer, inkludert feil, og tilpasse seg disse endringene og fortsette å fungere uten avbrudd.
