Különbség a félig csatlakozás és a virágzás között Csatlakozás

Anonim

Semi Csatlakozás - Bloom Join

A Semi join és a Bloom join két csatlakozási mód a megosztott adatbázisok lekérdezésének feldolgozásához. Amikor lekérdezéseket dolgoz fel az elosztott adatbázisokban, az adatokat át kell adni a különböző helyeken található adatbázisok között. Ez drága művelet lehet az átruházandó adatok mennyiségétől függően. Ezért ha lekérdezéseket dolgoz fel egy elosztott adatbázis környezetben, akkor fontos a lekérdezések optimalizálása a webhelyek közötti átvitel minimálisra csökkentése érdekében. A félbe illesztés és a virágzás csatlakozás két módszer, amelyek segítségével csökkenthető az adatátvitel mennyisége és hatékony lekérdezést végezhet.

Mi a Semi Csatlakozás?

A fél csatlakozás olyan módszer, amely a hatékony lekérdezés feldolgozásához használható elosztott adatbázis-környezetekben. Vegyük figyelembe azt a helyzetet, amikor az 1. webhelyen található Munkaadat-adatbázis (olyan dolgozói adatok, mint a munkavállaló neve, részleg száma, stb.) És az Osztály adatbázisa (a gazdaságban található információk, például az osztály száma, az osztály neve, helye stb.) Például ha meg akarjuk szerezni a munkavállaló nevét és az osztály nevét, amelyen dolgozik (csak a New Yorkban található részlegeknél), egy lekérdezés végrehajtásával a 3. oldalon található lekérdező processzorban többféle módon az adatok továbbítása a három helyszín között a feladat elérése érdekében. Az adatok átadásakor azonban fontos megjegyezni, hogy nem szükséges áthelyezni az egész adatbázist a webhelyek között. Csak néhány, a csatlakozáshoz szükséges attribútum (vagy párkapcsolat) szükséges áthelyezni a webhelyek között a lekérdezés hatékony végrehajtásához. A félbe való csatlakozás olyan módszer, amely csökkentheti a webhelyek között szállított adatok mennyiségét. A féllel való csatlakozásnál csak az összekapcsolási oszlop kerül átvitelre egyik oldalról a másikra, majd az átvitt oszlop arra szolgál, hogy csökkentse a szállított kapcsolatok méretét a többi hely között. A fenti példában csak a 2. helyről az 1. helyre és a location = "New York" részegység nevét lehet átvinni az 1. helyre, majd elvégezheti a csatlakozást az 1. helyszínen, és átviheti a végső kapcsolatot a 3. helyre.

Mi a Bloom Csatlakozás?

Amint korábban említettük, a bloom csatlakozás egy másik módszer, amely elkerüli a felesleges adatok áthelyezését a helyek között, amikor lekérdezéseket hajt végre az elosztott adatbázis-környezetekben. A virágzáshoz való csatlakozás helyett a csatlakozási oszlop átvitele helyett az egyesítés oszlopának kompakt ábrázolása átkerül a webhelyek között. A Bloom join egy virágszűrővel működik, amely egy kicsit vektorral dolgozik tagsági lekérdezések végrehajtásához. Először is egy virágszűrő épül fel a csatlakozási oszlop használatával, és átmásolódik a helyek között, majd a csatlakozási műveletek végrehajtására kerül sor.

Mi a különbség a Semi Join és a Bloom Join között?

Annak ellenére, hogy mindkét félig csatlakozó és virágzó csatlakozási módszert használják a helyek közötti, az elosztott adatbázis környezetben történő lekérdezések során átvitt adatok mennyiségének minimalizálására, a bloom join csökkenti az átvitt adatok számát (átvitt számok) a virágzószűrők fogalmának kihasználásával, amelyek egy bitt vektorot alkalmaznak a meghatározott tagságok meghatározására. Ezért a bloom csatlakozás használata hatékonyabb, mint a félig csatlakozás.