Video: St, Hansfest BSF 2018 2025
Hadoop er et rikt og raskt utviklende økosystem med et voksende sett med nye applikasjoner. I stedet for å forsøke å holde tritt med alle kravene til nye evner, er Pig designet for å være utvidbar via brukerdefinerte funksjoner , også kjent som UDFer.
UDFer kan skrives i en rekke programmeringsspråk, inkludert Java, Python og JavaScript. Utviklere legger også inn og deltar en voksende samling UDFer online. (Se etter Sparegris og DataFu, for å nevne bare to eksempler på slike nettsamlinger.) Noen av Pig-UDFene som er en del av disse depotene, er LOAD / STORE-funksjoner (XML, for eksempel), datatidsfunksjoner, tekst, matte, og statistikkfunksjoner.
Gris kan også være innebygd i vertspråk som Java, Python og JavaScript, som lar deg integrere gris med dine eksisterende applikasjoner. Det hjelper også å overvinne begrensninger i grisspråket. En av de mest omtalte begrensningene er at grisen ikke støtter kontrollflyt setninger: hvis / ellers, mens loop, for loop og tilstand uttalelser.
Gris støtter dataflyt, men må være innebygd på et annet språk for å gi kontrollflyt. Det er imidlertid avvik, men å legge inn svin i et kontroll-flyt språk. For eksempel hvis en svinerklæring er innebygd i en loop, hver gang sløyfen lukter og kjører svinoppstillingen, fører dette til at en separat MapReduce-jobb kjører.
