logo

Kaj je Redshift?

  • Redshift je hitra in zmogljiva, popolnoma upravljana storitev skladiščenja podatkov v petabajtnem obsegu v oblaku.
  • Stranke lahko uporabijo Redshift za samo 0,25 USD na uro brez obveznosti ali vnaprejšnjih stroškov in povečajo na petabajt ali več za 1000 USD na terabajt na leto.

OLAP

OLAP je Spletni sistem za obdelavo analitike ki ga uporablja Rdeči premik .

Primer transakcije OLAP:

Recimo, da želimo izračunati čisti dobiček za EMEA in Pacifik za digitalni radijski izdelek. To zahteva potegniti veliko število zapisov. Za izračun čistega dobička so potrebni naslednji zapisi:

  • Število prodanih radijskih sprejemnikov v EMEA.
  • Število radijskih sprejemnikov, prodanih v Pacifiku.
  • Cena radia na enoto v vsaki regiji.
  • Prodajna cena posameznega radia
  • Prodajna cena - strošek na enoto

Za pridobitev zgoraj navedenih zapisov so potrebne kompleksne poizvedbe. Podatkovne baze skladiščenja podatkov uporabljajo arhitekturo različnih tipov tako z vidika baze podatkov kot z infrastrukturnega sloja.

Konfiguracija rdečega premika

Rdeči premik

Rdeči premik je sestavljen iz dveh vrst vozlišč:

    Eno vozlišče Več vozlišč

Eno vozlišče: Eno vozlišče shrani do 160 GB.

Več vozlišč: Več vozlišč je vozlišče, ki je sestavljeno iz več kot enega vozlišča. Je dveh vrst:

    Vodilno vozlišče
    Upravlja povezave odjemalcev in sprejema poizvedbe. Vodilno vozlišče prejme poizvedbe iz odjemalskih aplikacij, razčleni poizvedbe in razvije izvedbene načrte. Usklajuje se z vzporednim izvajanjem teh načrtov z računalniškim vozliščem in združuje vmesne rezultate vseh vozlišč, nato pa končni rezultat vrne odjemalski aplikaciji.Računalniško vozlišče
    Računalniško vozlišče izvaja izvedbene načrte, nato pa se vmesni rezultati pošljejo v vodilno vozlišče za združevanje, preden se pošljejo nazaj odjemalski aplikaciji. Ima lahko do 128 računalniških vozlišč.

Razumejmo koncept vodilnega vozlišča in računalniških vozlišč na primeru.

Rdeči premik

Skladišče Redshift je zbirka računalniških virov, znanih kot vozlišča, ta vozlišča pa so organizirana v skupini, imenovani gruča. Vsaka gruča deluje v pogonu Redshift Engine, ki vsebuje eno ali več baz podatkov.

Ko zaženete primerek Redshift, se začne z enim vozliščem velikosti 160 GB. Ko želite rasti, lahko dodate dodatna vozlišča, da izkoristite vzporedno obdelavo. Imate vodilno vozlišče, ki upravlja več vozlišč. Vodilno vozlišče obravnava odjemalsko povezavo in tudi računalniška vozlišča. Podatke shrani v računalniška vozlišča in izvede poizvedbo.

Zakaj je Redshift 10-krat hitrejši

Rdeči premik je 10-krat hitrejši zaradi naslednjih razlogov:

    Stolpčno shranjevanje podatkov
    Namesto shranjevanja podatkov kot niza vrstic Amazon Redshift organizira podatke po stolpcih. Sistemi, ki temeljijo na vrsticah, so idealni za obdelavo transakcij, medtem ko so sistemi, ki temeljijo na stolpcih, idealni za skladiščenje podatkov in analitiko, kjer poizvedbe pogosto vključujejo agregate, ki se izvajajo v velikih nizih podatkov. Ker se obdelujejo samo stolpci, ki so vključeni v poizvedbe, podatki v stolpcih pa se zaporedno shranjujejo v pomnilniški medij, sistemi, ki temeljijo na stolpcih, zahtevajo manj V/I in tako izboljšajo zmogljivost poizvedb.Napredno stiskanje
    Podatkovne shrambe v stolpcih je mogoče stisniti veliko bolj kot podatkovne shrambe v vrsticah, ker so podobni podatki zaporedno shranjeni na disku. Amazon Redshift uporablja več tehnik stiskanja in lahko pogosto doseže znatno stiskanje v primerjavi s tradicionalnimi shrambami relacijskih podatkov.
    Amazon Redshift ne potrebuje indeksov ali materializiranih pogledov, zato zahteva manj prostora kot tradicionalni sistemi relacijskih baz podatkov. Pri nalaganju podatkov v prazno tabelo Amazon Redshift samodejno vzorči vaše podatke in izbere najprimernejšo tehniko stiskanja.Masivna vzporedna obdelava
    Amazon Redshift samodejno razdeli podatke in naloži poizvedbo po različnih vozliščih. Amazon Redshift olajša dodajanje novih vozlišč v vaše podatkovno skladišče, kar nam omogoča hitrejše izvajanje poizvedb, ko vaše podatkovno skladišče raste.

Funkcije rdečega premika

Funkcije rdečega premika so navedene spodaj:

blokirane številke
Rdeči premik
    Enostaven za namestitev, uvajanje in upravljanje
      Samodejno zagotavljanje
      Redshift je preprost za nastavitev in upravljanje. Novo skladišče podatkov lahko uvedete z le nekaj kliki v konzoli AWS, Redshift pa vam samodejno zagotovi infrastrukturo. V AWS so vse administrativne naloge avtomatizirane, kot so varnostne kopije in replikacija, osredotočiti se morate na svoje podatke, ne na administracijo.Samodejno varnostno kopiranje
      Redshift samodejno varnostno kopira vaše podatke v S3. Posnetke v S3 lahko posnemate tudi v drugi regiji za morebitno obnovitev po katastrofi.
    Stroškovno učinkovito
      Brez vnaprejšnjih stroškov, plačajte sproti
      Amazon Redshift je stroškovno najučinkovitejša storitev skladiščenja podatkov, saj morate plačati samo tisto, kar uporabljate.
      Njeni stroški se začnejo pri 0,25 USD na uro brez obveznosti in brez vnaprejšnjih stroškov in se lahko povečajo na 250 USD na terabajt na leto.
      Amazon Redshift je edina storitev skladiščenja podatkov, ki ponuja cene na zahtevo brez vnaprejšnjih stroškov, ponuja pa tudi cene rezerviranih instanc, ki prihranijo do 75 % z zagotavljanjem 1-3 letnega trajanja.Izberite vrsto vozlišča.
      Za optimizacijo rdečega premika lahko izberete katero koli od obeh vozlišč.
        Gosto računalniško vozlišče
        Gosto računalniško vozlišče lahko ustvari visoko zmogljiva podatkovna skladišča z uporabo hitrih procesorjev, velike količine RAM-a in polprevodniških diskov.Gosto skladiščno vozlišče
        Če želite zmanjšati stroške, lahko uporabite vozlišče Dense storage. Z uporabo večjega trdega diska ustvari stroškovno učinkovito skladišče podatkov.
    Hitro prilagodite svoje potrebe.
      Petabajtno shranjevanje podatkov
      Amazon Redshift samodejno poveča ali zmanjša vozlišča glede na spremembe potreb. Z le nekaj kliki v konzoli AWS ali enim klicem API-ja lahko preprosto spremenite število vozlišč v podatkovnem skladišču.Analitika podatkovnega jezera v eksabajtni meri
      To je funkcija Redshifta, ki vam omogoča izvajanje poizvedb glede eksabajtov podatkov v Amazon S3. Amazon S3 je varen in stroškovno učinkovit podatkovni sistem za shranjevanje neomejenih podatkov v odprti obliki.Neomejena sočasnost
      To je funkcija Redshifta, ki pomeni, da lahko več poizvedb dostopa do istih podatkov v Amazon S3. Omogoča izvajanje poizvedb v več vozliščih, ne glede na kompleksnost poizvedbe ali količino podatkov.
    Poizvedujte po svojem podatkovnem jezeru
    Amazon Redshift je edino podatkovno skladišče, ki se uporablja za poizvedovanje po podatkovnem jezeru Amazon S3 brez nalaganja podatkov. To zagotavlja prilagodljivost s shranjevanjem pogosto dostopanih podatkov v Redshift in nestrukturiranih ali redko dostopanih podatkov v Amazon S3.Varno
    Z nekaj nastavitvami parametrov lahko Redshift nastavite tako, da uporablja SSL za zaščito vaših podatkov. Omogočite lahko tudi šifriranje, vsi podatki, zapisani na disk, bodo šifrirani.Hitrejše delovanje
    Amazon Redshift zagotavlja stolpčno shranjevanje podatkov, stiskanje in vzporedno obdelavo za zmanjšanje količine V/I, potrebnega za izvajanje poizvedb. To izboljša zmogljivost poizvedb.