Recent Posts

What is Robots.txt File क्या होता है ? Explained In Hindi

हेलो दोस्तों हम अपनी पिछली पोस्ट में देख चुके है की कैसे Google Adsense क्या है, आज का ये पोस्ट और भी ज्यादा इंटरेस्टिंग होने वाला है क्युकी हम Blogger,Wordpress के कुछ सेटिंग के बारे में बात करेंगे। हम जानेंगे Robot.txt File क्या होता है। ये आपके SEO को बेहतर बनाने में भी मद्त करता है.

 अगर आप एक ब्लॉगर है तो जरूर इसके बारे में जानते होंगे लेकिन अगर आपने अभी अभी blogging करना शुरू किया है तब आप थोड़ा confuse भी हो सकते है की आखिर ये Robots.txt File किस नाम की चिड़िया है ?

आपको बता दू की Robots.txt File बिना आप Google Search Engine पर अपनी वेबसाइट नहीं दिखा सकते और इसके लिए आपको कुछ सेटिंग करने ki जरुरत होती है.



Robots.txt File क्या है ?

Robots.txt ये वो फाइल है जब  आपके साइट पर कोई आना चाहता है तब Search Engine bot उसे Direction देने का काम करती है.

आपका पेज,वेबसाइट,गूगल सर्च में अच्छे से Index  हो जाये इसका विशेष ध्यान रखती है,इसका दूसरा काम है अपने Sitemap के जरिये आपके वेबसाइट पर उपलब्ध images  को Index करवाना। 

जहाँ Robots.txt फाइल आपका सर्च Ranking बढ़ाने में मदत करती है वही एक गलत इनफार्मेशन या गलत सेटिंग से आपके वेबसाइट को भरी नुक्सान भी हो सकता है या सर्च इंजन पर Visible ही न हो. 

Robots.txt File में क्या-क्या होता है ? Syntax क्या है ?

Robots.txt File की सेटिंग करने से पहले हमे उसके बारे में थोड़ी जानकारी का  बहुत जरुरी है ताकि हम बिना गलती के सेटिंग कर सके.


Robots.txt File कुछ इस तरह दीखता है 

 User-agent: Mediapartners-Google

Disallow:

User-agent: *

Disallow: /search

Allow: /

Sitemap: http://example.blogspot.com/feeds/posts/default?orderby=UPDATED


  • User - agent : mediapartners-Google

यह  कोड Google adsense के लिए है जो आपके वेबसाइट पर बेहतर विज्ञापन देने में मद्त करती है , आप अपने ब्लॉग पर Google Adsense का उपयोग कर रहे है या नहीं इसे ऐसे ही छोड़ दे.

  • User-agent:*

यह (*) के साथ चिह्नित सभी रोबोटों के लिए है। डिफ़ॉल्ट सेटिंग्स में हमारे ब्लॉग के लेबल लिंक खोज Crawerls  द्वारा Indexed  करने के लिए प्रतिबंधित होते हैं, जिसका अर्थ है कि नीचे दिए गए कोड के कारण वेब Crawel  हमारे लेबल पेज लिंक को इंडेक्स नहीं करेंगे।

  • Disallow: /search

इसका मतलब है हमारे डोमेन नाम के ठीक बाद Search दिखने वाला label Google Search अनदेखा कर देगा। निचे दिए उदाहरण को आप देख सकते है जो की मेरे होमपेज का Link है.

http://www.get2grip.com/search/label/m=1 

और यदि हम Disallow को हटा देते हैं: / उपरोक्त कोड से खोज करते हैं तो Crawl  हमारे पूरे ब्लॉग को इंडेक्स तक पहुँचायेंगे और इसके सभी कंटेंट और वेब पेजों को क्रॉल करेंगे।

यहां Allow :/ करने से  जिसका अर्थ है कि वेब क्रॉलर हमारे ब्लॉग के होमपेज को क्रॉल और Index  कर सकते हैं।

  • Sitemap: http://example.blogspot.com/feeds/posts/default?orderby=UPDATED

यह कोड हमारे ब्लॉग के साइटमैप को दर्शाता है। यहां sitemap  लिंक जोड़कर हम केवल अपने ब्लॉग की क्रॉलिंग दर का अनुकूलन कर रहे हैं।


जब भी वेब क्रॉलर हमारे robots.txt फ़ाइल को स्कैन करते हैं, तो वे हमारे साइटमैप के लिए एक रास्ता खोज लेंगे, जहां हमारे प्रकाशित पोस्ट के सभी लिंक मौजूद हैं।

वेब क्रॉलर को हमारी सभी पोस्ट को क्रॉल करना आसान लगेगा।

इसलिए, इस बात की बेहतर संभावना है कि वेब क्रॉलर हमारे ब्लॉग की सभी पोस्टों को बिना किसी को अनदेखा किए क्रॉल करते हैं।

आज के इस पोस्ट में हमने Robort .txt File क्या होता है को expain किया है अगर किसी भी तरह का Doubt आपके मन में है तब आप comment के जरिये हमसे पूछ सकते है. 

हम अपने हर पोस्ट में आपके लिए एक BONUS POINT लेकर आते है जो की पोस्ट के अंत में होता है। 

निचे दिए गए लिंक के जरिये आप हमारी वेबसाइट को सब्सक्राइब भी कर सकते है ताकि साडी जानकारी आपके Mail में direct आपको प्राप्त हो.


Bonus Point 


Disallow Particular page 


अगर आप किसी particular पेज को Index नहीं करना चाहते है तब आप सिम्पली अपने ब्लॉग Page का URL कॉपी करके पेस्ट करदे और वहाँ से अपने ब्लॉग का URL मिटा दे जो की कुछ इस तरह दिखेगा :

Disallow: /p/page-url.html   


Disallow Particular Post  


अगर आपको किसी पोस्ट को Index नहीं करना है तो आप निचे दिए लिंक को कॉपी कर सकते है 

Disallow: /yyyy/mm/post-url.html

yyy जिस साल आप पोस्ट पब्लिश करते है वो बताता है mm महीना दर्शाता है। 

आप अपने ब्लॉग का URL कॉपी करके starting का blog नाम हटा दे.


Robots.txt File सेटअप कैसे करे : LINK AVAILABLE SOON 


Post a Comment

0 Comments