HIVE Full Form in Hindi



HIVE Full Form in Hindi, Full Form in Hindi HIVE, HIVE Meaning in Hindi, HIVE Full Form, HIVE Ka Full Form Kya Hai, HIVE का Full Form क्या है, HIVE Ka Poora Naam Kya Hai, HIVE Meaning in English, HIVE Full Form in Hindi, HIVE Kya Hota Hai, HIVE का Full Form क्या हैं, HIVE का फुल फॉर्म क्या है, Full Form of HIVE in Hindi, HIVE किसे कहते है, HIVE का फुल फॉर्म इन हिंदी, HIVE का पूरा नाम और हिंदी में क्या अर्थ होता है, HIVE का क्या Use है, दोस्तों क्या आपको पता है HIVE की Full Form क्या है, और HIVE होता क्या है, अगर आपका answer नहीं है, तो आपको उदास होने की कोई जरुरत नहीं है, क्योंकि आज हम इस पोस्ट में आपको HIVE की पूरी जानकारी हिंदी भाषा में देने जा रहे है, तो फ्रेंड्स HIVE Full Form in Hindi में और HIVE का पूरी इतिहास जानने के लिए इस पोस्ट को लास्ट तक पढ़े.

HIVE Full Form in Hindi – हाइव क्या है ?

Hive एक ETL और डेटा वेयरहाउसिंग टूल है, जो Hadoop Distributed File System (HDFS) के शीर्ष पर विकसित किया गया है. हाइव जैसे ऑपरेशन करने के लिए काम आसान बनाता है.

हाइव की महत्वपूर्ण विशेषताएं

  • Hive में टेबल और डेटाबेस पहले बनाए जाते हैं और फिर डेटा को इन टेबल में लोड किया जाता है.

  • Management और केवल Structured Data को Query करने के लिए डिज़ाइन किए गए Data Warehouse के रूप में Hive करें जो तालिकाओं में संग्रहीत हैं.

  • Structured Data के साथ काम करते समय Map Reduce में UDF जैसी अनुकूलन और Usable Features नहीं होती हैं लेकिन Hive Framework करता है. क्वेरी ऑप्टिमाइज़ेशन प्रदर्शन के संदर्भ में क्वेरी निष्पादन के प्रभावी तरीके को संदर्भित करता है.

  • Hive की SQL- प्रेरित भाषा उपयोगकर्ता को मैप कम करने की प्रोग्रामिंग की जटिलता से अलग करती है. यह संबंधपरक डेटाबेस की दुनिया से परिचित अवधारणाओं का पुन: उपयोग करता है, जैसे कि तालिकाओं, पंक्तियों, स्तंभों और स्कीमा, आदि को सीखने में आसानी के लिए.

  • Hadoop की Programming Flat Files पर काम करती है. इसलिए Hive कुछ प्रश्नों पर प्रदर्शन को बेहतर बनाने के लिए "विभाजन" डेटा के लिए निर्देशिका संरचनाओं का उपयोग कर सकता है.

  • स्कीमा जानकारी संग्रहीत करने के लिए Hive यानी मेटास्टोर का एक नया और महत्वपूर्ण घटक. यह Metastore आमतौर पर एक रिलेशनल डेटाबेस में रहता है. हम जैसे तरीकों का उपयोग करके Hive के साथ बातचीत कर सकते हैं.

  • अधिकांश इंटरैक्शन एक कमांड लाइन इंटरफ़ेस (सीएलआई) से अधिक होते हैं. Hive क्वेरी भाषा (HQL) का उपयोग करके Hive प्रश्नों को लिखने के लिए एक CLI प्रदान करता है.

  • आमतौर पर, HQL सिंटैक्स SQL सिंटैक्स के समान होता है, जिससे अधिकांश डेटा विश्लेषक परिचित होते हैं. नीचे दी गई नमूना क्वेरी उल्लिखित तालिका नाम में मौजूद सभी रिकॉर्ड को प्रदर्शित करती है. नमूना क्वेरी: <TableName> से चुनें

  • Hive Four File Formats का समर्थन करता है जो TEXTFILE, SEQUENCEFILE, ORC और RCFILE (रिकॉर्ड स्तंभ फ़ाइल) हैं.

  • एकल उपयोगकर्ता मेटाडेटा संग्रहण के लिए Hive डर्बी डेटाबेस का उपयोग करता है और कई उपयोगकर्ता मेटाडेटा या साझा मेटाडेटा केस के लिए Hive MYSQL का उपयोग करता है.

MySQL को डेटाबेस के रूप में स्थापित करने और मेटा-डेटा की जानकारी की जाँच करने के लिए ट्यूटोरियल "HIVE और MYSQL की स्थापना और कॉन्फ़िगरेशन"

हाइव के बारे में कुछ मुख्य बातें:-

  • HQL और SQL के बीच प्रमुख अंतर यह है कि Hive क्वेरी पारंपरिक डेटाबेस के बजाय Hadoop के बुनियादी ढांचे पर निष्पादित होती है.

  • Hive क्वेरी निष्पादन नौकरियों को स्वचालित रूप से उत्पन्न नक्शे को कम करने की श्रृंखला की तरह होने जा रहा है.

  • जब क्लाइंट क्वेरी को निष्पादित करता है तो Hive डेटा के आसान पुनर्प्राप्ति के लिए विभाजन और बकेट अवधारणाओं का समर्थन करता है.

  • Hive डेटा क्लींजिंग, फ़िल्टरिंग आदि के लिए कस्टम विशिष्ट यूडीएफ (यूजर डिफाइंड फंक्शंस) का समर्थन करता है, प्रोग्रामर की आवश्यकताओं के अनुसार कोई भी हाइव यूडीएफ को परिभाषित कर सकता है.

Hive का उपयोग करके हम कुछ अजीब कार्यक्षमता प्रदर्शन कर सकते हैं जो रिलेशनल डेटाबेस में हासिल नहीं की जाती हैं. पेटा-बाइट्स में डेटा की एक बड़ी मात्रा के लिए, इसे क्वेरी करना और सेकंड में परिणाम प्राप्त करना महत्वपूर्ण है. और Hive इसे काफी Efficiency से करता है यह प्रश्नों को तेजी से Processed करता है और दूसरे समय में परिणाम उत्पन्न करता है. आइए अब देखते हैं कि Hive कितना Fast है.

Hive और संबंधपरक डेटाबेस के बीच कुछ प्रमुख अंतर निम्नलिखित हैं. Relational Database Scheme on READ और Schema on Right हैं. पहले एक तालिका बनाना और फिर विशेष तालिका में डेटा डालना. Relational Database Tables पर Insertion, Update और संशोधन जैसे कार्य किए जा सकते हैं.

Hive केवल READ पर स्कीमा है. इसलिए अद्यतन, संशोधन, आदि जैसे कार्य इसके साथ काम नहीं करते हैं. क्योंकि एक विशिष्ट क्लस्टर में हाइव क्वेरी कई डेटा नोड्स पर चलती है. इसलिए कई नोड्स में डेटा को अपडेट और संशोधित करना संभव नहीं है. 0.13 से नीचे के Hive Version इसके अलावा Hive READ कई WRITE Once Pattern का समर्थन करता है. जिसका मतलब है कि टेबल डालने के बाद हम टेबल को नवीनतम Hive Versions में Update कर सकते हैं.

नोट हालाँकि Hive का New Version Update Features के साथ आता है. Hive Edition Hive 0.14 नई सुविधाओं के रूप में अपडेट और डिलीट विकल्पों के साथ आता है

Hive Architecture in Hindi

Hive Mainly 3 मुख्य भागों से मिलकर बनता है -

Hive Clients

Hive विभिन्न प्रकार के Applications के साथ संचार के लिए विभिन्न ड्राइवर प्रदान करता है. थ्रिफ़्ट आधारित Applications के लिए, यह संचार के लिए थ्रिफ़्ट क्लाइंट प्रदान करेगा. जावा संबंधित Applications के लिए, यह JDBC ड्राइवर प्रदान करता है. किसी अन्य प्रकार के Applications के अलावा ODBC ड्राइवर प्रदान किए गए. ये ग्राहक और ड्राइवर फिर से Hive सेवाओं में Hive सर्वर के साथ संचार करते हैं.

Hive Services

Hive के साथ क्लाइंट इंटरैक्शन Hive सर्विसेज के माध्यम से किया जा सकता है. यदि क्लाइंट Hive में किसी भी क्वेरी से संबंधित संचालन करना चाहता है, तो उसे Hive सर्विसेज के माध्यम से संवाद करना होगा. CLI command Line Interface है जो DDL (Data Definition Language) Operations के लिए Hive सेवा के रूप में कार्य करता है. सभी ड्राइवर Hive सर्वर के साथ और Hive सेवाओं में मुख्य ड्राइवर के साथ संवाद करते हैं जैसा कि ऊपर दिए गए आर्किटेक्चर आरेख में दिखाया गया है. Hive सेवाओं में मौजूद ड्राइवर मुख्य चालक का प्रतिनिधित्व करता है और यह सभी प्रकार के JDBC ODBC और अन्य ग्राहक विशिष्ट अनुप्रयोगों का संचार करता है. ड्राइवर विभिन्न अनुप्रयोगों से मेटा स्टोर और फील्ड सिस्टम को आगे के प्रसंस्करण के लिए उन अनुरोधों को संसाधित करेगा.

Hive Storage and Computing

Hive सेवाएं जैसे Meta Store, File System और Job Client बदले में Hive Storage के साथ Communications करता है और निम्नलिखित क्रियाएं करता है. Hive में निर्मित तालिकाओं की Metadata जानकारी को Hive Meta Storage डेटाबेस में Stored किया जाता है. तालिकाओं में लोड किए गए Result और Data HDFS पर Hadoop क्लस्टर में Stored किए जाने वाले हैं.

Job Exectution Flow

उपरोक्त स्क्रीनशॉट से हम Hadoop के साथ Hive में नौकरी निष्पादन प्रवाह को समझ सकते हैं Hive में डेटा प्रवाह निम्न पैटर्न में व्यवहार करता है -

  • UI से निष्पादन क्वेरी उपयोगकर्ता इंटरफ़ेस

  • चालक योजना प्राप्त करने के लिए कंपाइलर के साथ बातचीत कर रहा है. यहां योजना Query Execution के लिए Referenced है प्रक्रिया और इसके संबंधित Metadata जानकारी एकत्र करना.

  • कंपाइलर किसी कार्य को निष्पादित करने की योजना बनाता है. मेटाडेटा अनुरोध प्राप्त करने के लिए मेटा स्टोर के साथ संकलक संकलक.

  • मेटा स्टोर संकलक को मेटाडेटा जानकारी भेजता है.

  • कंपाइलर क्वेरी को निष्पादित करने के लिए प्रस्तावित योजना के साथ ड्राइवर के साथ संवाद कर रहा है.

  • निष्पादन इंजन के लिए ड्राइवर भेजने की योजना.

  • Execution Engine Query को संसाधित करने के लिए Hive और Hadoop के बीच एक सेतु का काम करता है.

  • Execution Engine पहले तालिकाओं में Stored Values को प्राप्त करने के लिए नाम नोड और फिर Data Nodes से संपर्क करें.

  • Execution Engine Data Nodes से Desired Record लाने जा रहा है. तालिकाओं का Real Data केवल डेटा नोड में रहता है. Name Nodes से जबकि यह केवल क्वेरी के लिए Metadata Information प्राप्त करता है.

  • यह उल्लेखित क्वेरी से संबंधित डेटा नोड्स से वास्तविक डेटा एकत्र करता है.

  • Execution Engine डीडीएल डेटा Definition Language Operation करने के लिए Hive में मौजूद मेटा स्टोर के साथ द्वि-प्रत्यक्ष रूप से Communications करता है. यहां डीडीएल ऑपरेशन्स जैसे क्रेट, डीआरओपी और एल्टरिंग टेबल और डेटाबेस किया जाता है. मेटा स्टोर केवल डेटाबेस के नाम, टेबल के नाम और कॉलम के नाम के बारे में जानकारी संग्रहीत करेगा. यह उल्लेखित क्वेरी से संबंधित डेटा प्राप्त करेगा.

  • Execution Engine Hadoop फाइल सिस्टम के शीर्ष पर क्वेरी को निष्पादित करने के लिए नाम नोड, डेटा नोड्स और जॉब ट्रैकर जैसे Hadoop डेमोंस के साथ संचार करता है.

  • ड्राइवर से परिणाम प्राप्त करना.

  • Execution Engine के लिए परिणाम भेजना. एक बार जब परिणाम डेटा नोड्स से EE को प्राप्त हो जाते हैं, तो यह परिणाम ड्राइवर और UI (फ्रंट एंड) पर वापस भेज देगा

निरंतर इंजन के माध्यम से Hadoop फाइल सिस्टम और इसके डेमों के संपर्क में रहें. कार्य प्रवाह आरेख में बिंदीदार तीर Hadoop डेमन्स के साथ निष्पादन इंजन संचार को दर्शाता है.

What is Apache Hive in Hindi?

अपाचे Hive बड़े डेटा सेट फ़ाइलों को पढ़ने, लिखने और प्रबंधित करने के लिए एक ओपन सोर्स डेटा वेयरहाउस सॉफ्टवेयर है जो सीधे अपाचे हडोप डिस्ट्रीब्यूटेड फाइल सिस्टम एचडीएफएस या अन्य डेटा स्टोरेज सिस्टम जैसे कि अपाचे HBase में सीधे संग्रहीत किया जाता है. Hive SQL डेवलपर्स को हाइव क्वेरी भाषा (HQL) स्टेटमेंट लिखने में सक्षम बनाता है जो डेटा क्वेरी और विश्लेषण के लिए मानक SQL स्टेटमेंट के समान हैं. यह MapReduce प्रोग्रामिंग को आसान बनाने के लिए डिज़ाइन किया गया है क्योंकि आपको जावा कोड को जानना और लिखना नहीं है. इसके बजाय, आप एचक्यूएल में और अधिक प्रश्न लिख सकते हैं, और हाइव तब नक्शा बना सकते हैं और फ़ंक्शन को कम कर सकते हैं.

Hive की स्थापना के साथ शामिल हाइव मेटास्टोर है, जो आपको बड़ी मात्रा में असंरचित डेटा पर तालिका संरचना को लागू करने में सक्षम बनाता है. एक बार जब आप एक हाइव तालिका बनाते हैं, तो कॉलम, पंक्तियों, डेटा प्रकारों आदि को परिभाषित करते हुए यह सभी जानकारी मेटास्टोर में संग्रहीत होती है और हाइव आर्किटेक्चर का हिस्सा बन जाती है. अन्य उपकरण जैसे अपाचे स्पार्क और अपाचे पिग तब डेटा को मेटास्टोर में एक्सेस कर सकते हैं.

किसी भी डेटाबेस प्रबंधन प्रणाली (DBMS) के साथ आप अपने Hive प्रश्नों को एक कमांड-लाइन इंटरफ़ेस (जिसे Hive शेल के रूप में जाना जाता है), एक Java ™ डेटाबेस कनेक्टिविटी (JDBC) या एक ओपन डेटाबेस कनेक्टिविटी (ODBC) एप्लिकेशन से चला सकते हैं. Hive JDBC / ODBC ड्राइवरों का उपयोग करना. आप C ++, Java, PHP, Python या Ruby में लिखे एप्लिकेशनों के भीतर एक हाइव थ्रिफ़्ट क्लाइंट चला सकते हैं, जो कि IBM Db2® या IBM Informix® जैसे डेटाबेस तक पहुँचने के लिए एम्बेडेड SQL वाली इन क्लाइंट-साइड भाषाओं का उपयोग करने के समान है.

हाइव SQL एक्सेस के साथ पारंपरिक डेटाबेस कोड जैसा दिखता है. हालांकि, हाइव Apache Hadoop और Hive ऑपरेशंस पर आधारित है, जिसके परिणामस्वरूप महत्वपूर्ण अंतर हैं. सबसे पहले, Hadoop लंबे अनुक्रमिक स्कैन के लिए अभिप्रेत है और क्योंकि Hive Hadoop पर आधारित है, प्रश्नों में बहुत अधिक विलंबता कई मिनट होती है. इसका अर्थ है कि हाइव उन अनुप्रयोगों के लिए कम उपयुक्त है जिन्हें बहुत तेज़ प्रतिक्रिया समय की आवश्यकता होती है.

दूसरा हाइव रीड-आधारित है और इसलिए लेन-देन प्रसंस्करण के लिए उपयुक्त नहीं है जिसमें आम तौर पर लेखन कार्यों का एक उच्च प्रतिशत शामिल होता है. यह डेटा वेयरहाउसिंग कार्यों जैसे कि अर्क / ट्रांसफॉर्म / लोड (ETL) रिपोर्टिंग और डेटा विश्लेषण के लिए बेहतर अनुकूल है और इसमें ऐसे उपकरण शामिल हैं जो SQL के माध्यम से डेटा तक आसानी से पहुंच बना सकते हैं.

यदि आप Hadoop पर SQL में रुचि रखते हैं, तो Hive के अतिरिक्त, IBM आईबीएम Db2 बिग SQL प्रदान करता है, जो Hive डेटा सेट को और अधिक सुरक्षित और अधिक सुरक्षित बनाता है. हाइव और डीबी 2 बिग एसक्यूएल के त्वरित अवलोकन के लिए नीचे दिए गए वीडियो देखें.

सारांश

Hive Hadoop पारिस्थितिकी तंत्र के शीर्ष पर एक ETL और डेटा वेयरहाउस टूल है और इसका उपयोग संरचित और अर्ध संरचित डेटा के प्रसंस्करण के लिए किया जाता है. Hive एक डेटाबेस है जो Hadoop पारिस्थितिकी तंत्र में मौजूद है DDL और DML संचालन करता है और यह डेटा की बेहतर क्वेरी और प्रसंस्करण के लिए HQL जैसी लचीली क्वेरी भाषा प्रदान करता है. यह आरडीएमएस की तुलना में बहुत सारी सुविधाएँ प्रदान करता है जिसकी कुछ सीमाएँ हैं. ग्राहक की आवश्यकताओं को पूरा करने के लिए उपयोगकर्ता विशिष्ट तर्क के लिए. यह कस्टम परिभाषित स्क्रिप्ट और उपयोगकर्ता परिभाषित कार्यों को लिखने और तैनात करने का विकल्प प्रदान करता है. इसके अलावा, यह भंडारण विशिष्ट लॉगिक्स के लिए विभाजन और बाल्टी प्रदान करता है.