- Redshift je hitra in zmogljiva, popolnoma upravljana storitev skladiščenja podatkov v petabajtnem obsegu v oblaku.
- Stranke lahko uporabijo Redshift za samo 0,25 USD na uro brez obveznosti ali vnaprejšnjih stroškov in povečajo na petabajt ali več za 1000 USD na terabajt na leto.
OLAP
OLAP je Spletni sistem za obdelavo analitike ki ga uporablja Rdeči premik .
Primer transakcije OLAP:
Recimo, da želimo izračunati čisti dobiček za EMEA in Pacifik za digitalni radijski izdelek. To zahteva potegniti veliko število zapisov. Za izračun čistega dobička so potrebni naslednji zapisi:
- Število prodanih radijskih sprejemnikov v EMEA.
- Število radijskih sprejemnikov, prodanih v Pacifiku.
- Cena radia na enoto v vsaki regiji.
- Prodajna cena posameznega radia
- Prodajna cena - strošek na enoto
Za pridobitev zgoraj navedenih zapisov so potrebne kompleksne poizvedbe. Podatkovne baze skladiščenja podatkov uporabljajo arhitekturo različnih tipov tako z vidika baze podatkov kot z infrastrukturnega sloja.
Konfiguracija rdečega premika
Rdeči premik je sestavljen iz dveh vrst vozlišč:
Eno vozlišče: Eno vozlišče shrani do 160 GB.
Več vozlišč: Več vozlišč je vozlišče, ki je sestavljeno iz več kot enega vozlišča. Je dveh vrst:
Upravlja povezave odjemalcev in sprejema poizvedbe. Vodilno vozlišče prejme poizvedbe iz odjemalskih aplikacij, razčleni poizvedbe in razvije izvedbene načrte. Usklajuje se z vzporednim izvajanjem teh načrtov z računalniškim vozliščem in združuje vmesne rezultate vseh vozlišč, nato pa končni rezultat vrne odjemalski aplikaciji.
Računalniško vozlišče izvaja izvedbene načrte, nato pa se vmesni rezultati pošljejo v vodilno vozlišče za združevanje, preden se pošljejo nazaj odjemalski aplikaciji. Ima lahko do 128 računalniških vozlišč.
Razumejmo koncept vodilnega vozlišča in računalniških vozlišč na primeru.
Skladišče Redshift je zbirka računalniških virov, znanih kot vozlišča, ta vozlišča pa so organizirana v skupini, imenovani gruča. Vsaka gruča deluje v pogonu Redshift Engine, ki vsebuje eno ali več baz podatkov.
Ko zaženete primerek Redshift, se začne z enim vozliščem velikosti 160 GB. Ko želite rasti, lahko dodate dodatna vozlišča, da izkoristite vzporedno obdelavo. Imate vodilno vozlišče, ki upravlja več vozlišč. Vodilno vozlišče obravnava odjemalsko povezavo in tudi računalniška vozlišča. Podatke shrani v računalniška vozlišča in izvede poizvedbo.
Zakaj je Redshift 10-krat hitrejši
Rdeči premik je 10-krat hitrejši zaradi naslednjih razlogov:
Namesto shranjevanja podatkov kot niza vrstic Amazon Redshift organizira podatke po stolpcih. Sistemi, ki temeljijo na vrsticah, so idealni za obdelavo transakcij, medtem ko so sistemi, ki temeljijo na stolpcih, idealni za skladiščenje podatkov in analitiko, kjer poizvedbe pogosto vključujejo agregate, ki se izvajajo v velikih nizih podatkov. Ker se obdelujejo samo stolpci, ki so vključeni v poizvedbe, podatki v stolpcih pa se zaporedno shranjujejo v pomnilniški medij, sistemi, ki temeljijo na stolpcih, zahtevajo manj V/I in tako izboljšajo zmogljivost poizvedb.
Podatkovne shrambe v stolpcih je mogoče stisniti veliko bolj kot podatkovne shrambe v vrsticah, ker so podobni podatki zaporedno shranjeni na disku. Amazon Redshift uporablja več tehnik stiskanja in lahko pogosto doseže znatno stiskanje v primerjavi s tradicionalnimi shrambami relacijskih podatkov.
Amazon Redshift ne potrebuje indeksov ali materializiranih pogledov, zato zahteva manj prostora kot tradicionalni sistemi relacijskih baz podatkov. Pri nalaganju podatkov v prazno tabelo Amazon Redshift samodejno vzorči vaše podatke in izbere najprimernejšo tehniko stiskanja.
Amazon Redshift samodejno razdeli podatke in naloži poizvedbo po različnih vozliščih. Amazon Redshift olajša dodajanje novih vozlišč v vaše podatkovno skladišče, kar nam omogoča hitrejše izvajanje poizvedb, ko vaše podatkovno skladišče raste.
Funkcije rdečega premika
Funkcije rdečega premika so navedene spodaj:
blokirane številke
Redshift je preprost za nastavitev in upravljanje. Novo skladišče podatkov lahko uvedete z le nekaj kliki v konzoli AWS, Redshift pa vam samodejno zagotovi infrastrukturo. V AWS so vse administrativne naloge avtomatizirane, kot so varnostne kopije in replikacija, osredotočiti se morate na svoje podatke, ne na administracijo.
Redshift samodejno varnostno kopira vaše podatke v S3. Posnetke v S3 lahko posnemate tudi v drugi regiji za morebitno obnovitev po katastrofi.
Amazon Redshift je stroškovno najučinkovitejša storitev skladiščenja podatkov, saj morate plačati samo tisto, kar uporabljate.
Njeni stroški se začnejo pri 0,25 USD na uro brez obveznosti in brez vnaprejšnjih stroškov in se lahko povečajo na 250 USD na terabajt na leto.
Amazon Redshift je edina storitev skladiščenja podatkov, ki ponuja cene na zahtevo brez vnaprejšnjih stroškov, ponuja pa tudi cene rezerviranih instanc, ki prihranijo do 75 % z zagotavljanjem 1-3 letnega trajanja.
Za optimizacijo rdečega premika lahko izberete katero koli od obeh vozlišč.
Gosto računalniško vozlišče lahko ustvari visoko zmogljiva podatkovna skladišča z uporabo hitrih procesorjev, velike količine RAM-a in polprevodniških diskov.
Če želite zmanjšati stroške, lahko uporabite vozlišče Dense storage. Z uporabo večjega trdega diska ustvari stroškovno učinkovito skladišče podatkov.
Amazon Redshift samodejno poveča ali zmanjša vozlišča glede na spremembe potreb. Z le nekaj kliki v konzoli AWS ali enim klicem API-ja lahko preprosto spremenite število vozlišč v podatkovnem skladišču.
To je funkcija Redshifta, ki vam omogoča izvajanje poizvedb glede eksabajtov podatkov v Amazon S3. Amazon S3 je varen in stroškovno učinkovit podatkovni sistem za shranjevanje neomejenih podatkov v odprti obliki.
To je funkcija Redshifta, ki pomeni, da lahko več poizvedb dostopa do istih podatkov v Amazon S3. Omogoča izvajanje poizvedb v več vozliščih, ne glede na kompleksnost poizvedbe ali količino podatkov.
Amazon Redshift je edino podatkovno skladišče, ki se uporablja za poizvedovanje po podatkovnem jezeru Amazon S3 brez nalaganja podatkov. To zagotavlja prilagodljivost s shranjevanjem pogosto dostopanih podatkov v Redshift in nestrukturiranih ali redko dostopanih podatkov v Amazon S3.
Z nekaj nastavitvami parametrov lahko Redshift nastavite tako, da uporablja SSL za zaščito vaših podatkov. Omogočite lahko tudi šifriranje, vsi podatki, zapisani na disk, bodo šifrirani.
Amazon Redshift zagotavlja stolpčno shranjevanje podatkov, stiskanje in vzporedno obdelavo za zmanjšanje količine V/I, potrebnega za izvajanje poizvedb. To izboljša zmogljivost poizvedb.