Video: Week 10, continued 2025
Skalbarhet er evnen til et program å utvikle fleksibelt for å møte vekst og kompleksitetskrav. I sammenheng med Excel refererer skalerbarhet til Excels evne til å håndtere stadig økende datamengder.
De fleste Excel-avicionados er raske å påpeke at fra Excel 2007 kan du plassere 1, 048, 576 rader med data i et enkelt Excel-regneark - en overveldende økning fra begrensningen av 65, 536 rader pålagt av tidligere versjoner av Utmerke. Denne kapasitetsforbedringen løser imidlertid ikke alle skalerbarhetsproblemene som oversvømmer Excel.
Tenk deg at du jobber i et lite selskap og bruker Excel til å analysere sine daglige transaksjoner. Etter hvert som tiden går, bygger du en robust prosess komplett med alle formler, pivottabeller og makroer du trenger for å analysere dataene som er lagret i ditt pent vedlikeholdte regneark.
Når mengden data vokser, vil du først legge merke til ytelsesproblemer. Regnearket blir sakte å laste inn og deretter sakte å beregne.
Hvorfor skjer dette? Det har å gjøre med måten Excel håndterer hukommelsen på. Når en Excel-fil er lastet, lastes hele filen inn i RAM. Excel gjør dette for å tillate rask databehandling og tilgang. Ulempen med denne oppførselen er at hver gang dataene i regnearket endres, må Excel gjenopplaste hele dokumentet til RAM. Nettoresultatet i et stort regneark er at det tar mye RAM å behandle selv den minste endringen. Til slutt blir hver handling du tar i det gigantiske regnearket en forferdelig vente.
Dine pivottabeller vil kreve større pivot-cacher, nesten dobling av Excel-arbeidsbokens filstørrelse. Til slutt blir arbeidsboken for stor til å distribuere lett. Du kan også vurdere å bryte ned arbeidsboken i mindre arbeidsbøker (muligens en for hver region). Dette får deg til å duplisere arbeidet ditt.
Med tiden kan du til slutt nå 1, 048, 576-rad grensen på regnearket. Hva skjer da? Starter du et nytt regneark? Hvordan analyserer du to datasett på to forskjellige regneark som en enhet? Er formlene dine fortsatt gode? Vil du skrive nye makroer?
Dette er alle problemene som må løses.
Selvfølgelig vil du også møte Excel-kraftkunderne, som vil finne forskjellige smarte måter å jobbe rundt disse begrensningene. Til slutt, men disse metodene vil alltid være rett og slett løsningsforslag. Til slutt vil selv disse kraftkunder begynne å tenke mindre om den mest effektive måten å utføre og presentere analyse av dataene sine og mer om hvordan man lager data "passer" inn i Excel uten å bryte formler og funksjoner.
Excel er fleksibel nok til at en dyktig kunde kan få de fleste ting til å passe bra. Men når kundene bare tenker på Excel, er de utvilsomt begrensende selv, om enn på en utrolig funksjonell måte.
I tillegg begrenser disse kapasitetsbegrensningene Excel-kunder til å få dataene tilrettelagt for dem. Det vil si at noen andre trekker ut store biter av data fra en stor database og deretter aggregater og former dataene til bruk i Excel.
Skal den seriøse analytikeren alltid være avhengig av noen andre for sine databehov? Hva om en analytiker kunne få verktøyene for å få tilgang til store mengder data uten å være avhengige av andre for å gi data? Kunne den analytikeren være mer verdifull for organisasjonen? Kunne den analytikeren fokusere på nøyaktigheten av analysen og kvaliteten på presentasjonen i stedet for å dirigere Excel data vedlikehold?
Et relationsdatabasesystem (for eksempel Access eller SQL Server) er et logisk neste skritt for analytikeren som står overfor et stadig økende datapool. Databasesystemer har vanligvis ikke prestasjonsimplikasjoner med store mengder lagrede data, og er bygget for å adressere store datamengder. En analytiker kan da håndtere større datasett uten at dataene skal oppsummeres eller forberedes for å passe inn i Excel.
Også hvis en prosess blir stadig viktigere for organisasjonen og må spores i et mer akseptabelt miljø, vil det være lettere å oppgradere og oppskalere hvis prosessen allerede er i et relationsdatabasesystem.
