search engine कैसे काम करता है - ldkalink
search engine कैसे काम करता है: आप सभी जानते है की सबके काम करने का तरीका अलग अलग होता है चाहे वो आप हो या कोई और दूसरा व्यक्ति या फिर कोई software system. सबके काम करने तरीका अलग ही होता है।
आप search engine क्या है ये तो सभी जानते ही होंगे पर यह किस तरह से कार्य करता है शायद इसके बारे में किसी को नहीं पता होगा तभी आप www.ldkalink.com पर search engine किस तरह से work करता है यह आर्टिकल पढ़ रहे है।
हम हमेशा यही सोचते है की इंटरनेट यूजर द्वारा कोई query सर्च करने के बाद ही सर्च इंजन द्वारा information सर्च लिस्ट में यानि SERP में दिखाया जाता है।
पर ऐसा नहीं होता है हमारे द्वारा कुछ भी सर्च करने के पहले ही सर्च इंजन द्वारा आधे से भी ज्यादा काम कर लिया गया होता है तभी सर्च करते ही best result कुछ ही सेकंड में यूजर को दे दिया जाता है।
नए इंटरनेट यूजर के मन में एक सवाल यह भी होता है की SERP क्या है तो इसका full name 'Search Engine Results page' होता है।
जब किसी यूजर द्वारा कोई query सर्च की जाती है तो इसी कीवर्ड से रिलेटेड जो web pages सर्च लिस्ट में रैंकिंग के आधार पर दिखाया जाता है इसे ही हम SERP कहते है।
अब जरा सोचो की इतने कम समय में ही यूजर के क्वेरी के अनुसार सबसे अच्छा रिजल्ट उनके सामने रख दिया जाता है।
जबकि इंटरनेट पर लाखो वेबसाइट है जिसमे तरह तरह की इनफार्मेशन पड़ी है मिलियन टीबी डाटा नेट पर मौजूद है।
अब ऐसे में सर्च इंजन को यह कैसे पता चला की कौन से साइट पर सर्च किये गए query की जानकारी पड़ी है।
यही सर्च इंजन के काम करने का best तरीका होता है जिसके बारे में हम अभी जानने वाले है की आखिर सर्च इंजन द्वारा इतने कम समय में ही search engine कैसे work करता है।
यहाँ हम किसी एक सर्च इंजन की बात नहीं कर रहे है जितने भी सर्च इंजिन्स है उन सभी के काम करने के तरीके के बारे में बात करने वाले है पर हम उदहारण के रूप के गूगल के सर्च इंजन को लेंगे।
search engine कैसे काम करता है - how does a search engine work in Hindi
Search engine kaise kaam karta hai: Creater द्वारा जब भी वेबसाइट पर किसी तरह का अपडेट या content जैसे की image, text या video हो upload किया जाता है तो गूगल के crawler या जिसे हम spider भी कहते है के द्वारा पहले इसे crawl किया जाता है यानि scan किया जाता है।
हमारे search engine में कुछ भी सर्च करने से पहले ही इंटरनेट पर अपलोड होने वाली इनफार्मेशन को google के crawler द्वारा क्रॉल कर लिया जाता है।
क्रॉल करते समय यह भी देखा जाता है की कौन सी साइट पर किस तरह की कंटेंट पड़ी है और फिर इन सारे डाटा को local server में put कर दिया जाता है।
local server का मतलब google का अपना local hard disk जैसे हम किसी के हार्ड डिस्क को access नहीं कर सकते है हम यह नहीं जान सकते है की दूसरे के hard disk में क्या क्या इनफार्मेशन राखी है वैसे ही हम google के लोकल सर्वर को भी एक्सेस नहीं कर सकते है।
अब google के indexer द्वारा local sever की indexing की जाती है इसका अर्थ यह है की सर्वर में जितने भी डाटा मौजूद है इन सब को एक अलग अलग category में डिवाइड कर दिया जाता है।
जैसे की एक नई वेबसाइट है जो dresses से रिलेटेड है तो इस साइट पर जितनी भी इनफार्मेशन होगी इन सभी को गूगल के क्रॉलर द्वारा क्रॉल करके यह देखा जायेगा की इस साइट पर किस तरह की content मौजूद है और सारे डाटा को लोकल सर्वर में रख दिया जायेगा।
अब लोकल सर्वर में डाटा सेव होने के बाद इसे गूगल के indexer द्वारा अलग अलग भागो में बाँट दिया जायेगा।
जैसे की pink, white, yellow, ड्रेस को एक अलग केटेगरी में रख दिया जायेगा और इसी तरह से shirt और t-shirt की भी एक अलग केटेगरी बना दी जाती है इस तरह से indexer द्वारा इस साइट के सारे डाटा को अलग अलग कर दिया जाता है।
सर्च इंजन के काम करने के तरीके को समझने के लिए हम एक library का उदहारण लेते है माना मेरे पास एक पुस्तकालय है और इसे मैनेज करने के लिए मेरे पास तीन peon भी है अब ये तीनो peon का काम अलग अलग बटा हुआ है किसको किस तरह का काम करना है।
जब कभी लाइब्रेरी के लिए बुक्स आर्डर किया जाता है तो सारी पुस्तके एक ट्रक में भरकर लाया जाता है अब जैसे ही ये बुक्स मेरे पास आता है ये तीनो peon से अलग अलग काम कराया जाता है अब इन तीनो के काम को हम स्टेप बय स्टेप समझते है।
peon-1 इसे हम crawler या spider नाम भी दे सकते है क्यों की पहला peon का काम यह था की जो बुक्स ऑर्डर किया गया था ये सारे बुक्स के आ जाने के बाद मिलान करना की कौन कौन सी किताबे आई है और फिर इसे ट्रक से नीचे उतारकर गोदाम में रख देना है।
ठीक ऐसे ही गूगल के crawler द्वारा भी किया जाता है इंटरनेट पर किसी भी साइट पर content upload होते ही इसे गूगल के crawl द्वारा crawl करके सारे डाटा को local server में डाल दिया है।
peon-2 इसे हम indexer के नाम से जान सकते है दूसरे peon का काम गोदाम में रखे बुक्स को अलग अलग करना है जैसे हिंदी, इंग्लिश, मैथ्स, मैग्जीन, कॉमिक्स ये सारी किताबो को एक अलग अलग कैटेगरी में रखकर लाइब्रेरी में जमा देना है।
गूगल के indexer द्वारा भी ठीक इसी तरह से काम किया जाता है लोकल सर्वर में जितने भी इन्फॉर्मेशन पड़ी है सबको अलग अलग category में बाट दिया जाता है और फिर इसे main server में रख दिया जाता है क्यों की हर एक इंटरनेट यूजर main server से ही जुड़ा होता है।
peon -3 इसे हम ranking algorithm का एक नाम देते है अब तीसरे peon का काम है की लाइब्रेरी में अगर कोई यूजर आता है और कहता है की मुझे एक English literature की एक बुक चाहिए तो तीसरे peon द्वारा तुरंत ही लाइब्रेरी से English literature की relevant बुक्स निकलकर दे दिया जाता है।
Google के ranking algorithm भी इसी तरह से कार्य करते है main server में जो इन्फॉर्मेशन अलग अलग कैटेगरी में सेव रहती है यूजर के कुछ भी सर्च करने पर बेस्ट आंसर यूजर को सर्च लिस्ट में दिखा दिया जाता है।
सर्च करने पर सर्च लिस्ट में बहुत से रिजल्ट पेजेस दिखाई देंगे जिन्हे रैंकिंग के आधार पर रैंक दिया जाता है जिस भी पेज की रैंकिंग पहले नंबर पर होगी उसे google के ranking algorithm द्वारा SERP में सबसे पहले नंबर पर रखा जायेगा।
कई लोग यह भी सोचते है की सिर्फ SEO करके ही website या web pages को टॉप पर रैंक कराया जा सकता है।
पर ऐसा नहीं है किसी भी वेबसाइट या वेब पेज को टॉप पोजिशन पर लाने के लिए वेब पेज का best crawling होने के साथ साथ सही तरीके से indexing होना भी जरूरी होता है तभी यह संभव है।
इस तरह से किसी भी पेज की रैंकिंग गूगल के ranking algorithm द्वारा डिसाइड की जाती है की किस वेब पेज की रैंकिंग किस पोजिशन पर है और इसके images किस पोजिशन पर रैंक कर रही है।
अब ranking algorithm या फिर google algorithms क्या है और यह किस तरह से काम करता है इसके बारे में भी हम ldkalink ब्लॉग के एक दूसरे आर्टिकल पर विस्तार से जानेंगे।
आशा करता हु की आप सबको अब अच्छे से समझ आ गया होगा की search engines अपना work किस तरह से करता है यदि यह आर्टिकल आपके लिए थोड़ा भी हेल्पफुल रहा है तो इसे अपने दोस्तों के साथ जरूर शेयर करे।
टिप्पणियाँ
एक टिप्पणी भेजें
please do not enter any spam link in the comment box.