सेमल्ट: आपकी Google Analytics में रेफरल स्पैम को अवरुद्ध करने के लिए एक सुपर गाइड

सेमल्ट के विशेषज्ञ निक चाओकोवस्की ने भरोसा दिलाया कि रेफरल स्पैम उन समस्याओं में से एक है जो वर्तमान में वेबमास्टर्स का सामना कर रहे हैं। वर्षों से स्थिति खराब हो रही है, जिसका अर्थ है कि कोई व्यक्ति रेफरल स्पैम बनाने से कहीं अधिक पैसा कमाता है।

भूत और रेफरल स्पैम

स्पैम ने अब Google Analytics रिपोर्ट के लिए अपना रास्ता बना लिया है। स्पैमर सिस्टम में कमजोरियों की तलाश करते हैं ताकि वे वेबसाइट की डेटा रिपोर्ट में दिखाई दे सकें। वे इस उम्मीद के साथ ऐसा करते हैं कि वे इस बात के लिए पर्याप्त जिज्ञासा पैदा करते हैं कि वेबमास्टर अपनी वेबसाइट पर जाकर देखें कि वे रिपोर्ट में क्यों हैं। समस्या यह है कि वे यातायात में वृद्धि नहीं करते हैं। वे इसे तब से नहीं बनाते हैं क्योंकि वे बॉट हैं। वे Google Analytics द्वारा उपयोग किए जाने वाले JavaScrip ट्रैकिंग कोड का उपयोग एक अधिसूचना बनाने के लिए करते हैं कि एक यात्रा थी। उन्होंने सगाई का विश्लेषण करने के लिए उछाल दर और अन्य तत्वों की तरह महत्वपूर्ण आँकड़ों को तिरछा किया। रेफरल स्पैम को रोकना अत्यावश्यक है यदि किसी को सटीक डेटा की आवश्यकता होती है, खासकर यदि वे मार्केटिंग निर्णय लेने के लिए उस पर भरोसा करते हैं।

यह विशेष रूप से रेफरल स्पैम को ब्लॉक करना मुश्किल हो जाता है, क्योंकि स्पैमर्स बहुत तेजी से काम करते हैं, जिससे स्पैम हिट्स की दर बढ़ जाती है और साथ ही स्रोत भी। इसका मतलब है कि वेबमास्टरों को इन स्रोतों को समाप्त करने और उन्हें ब्लैकलिस्ट करने के प्रयास में सुधार करना होगा। यह उन लोगों के लिए विशेष रूप से परेशानी है जिनके पास नई साइटें हैं जिन्हें बहुत वैध यातायात प्राप्त नहीं होता है। ऐसी साइटों पर स्पैम दरों में वृद्धि अधिक तिरछापन पेश करती है, जो इसे प्राप्त होने वाली दैनिक हिट से भी अधिक हो सकती है।

यह कितना आसान है?

एक यात्रा के रूप में एक पृष्ठ लोड रिकॉर्ड। घोस्ट स्पैमर Google Analytics ट्रैकिंग कोड का उपयोग करते हैं और ट्रैफ़िक डेटा को सीधे रिपोर्ट में भेजते हैं, जिससे यात्रा का अनुमान लगाया जा सकता है। कहीं एक सर्वर पर एक पेज लोड करने में 0.001 सेकंड लग सकते हैं। हालाँकि, उन्होंने इनमें से 100 से अधिक साइटों पर कई अन्य साइटों के Google खातों पर जाली यात्राओं के लिए मजबूर किया हो सकता है। सिंगल होस्ट खरीदना काफी आसान है। जब तक स्पैमर आरओआई के बारे में सुनिश्चित नहीं हो जाते, तब तक बहुत नुकसान हो सकता है।

समाधान जो कम आए

कुछ तकनीकें कभी-कभी इतनी उन्नत होती हैं कि रेफरल स्पैम को ब्लॉक करने के लिए नियोजित समाधान काम नहीं करते हैं। उनमें से एक रहस्यमय ऑनलाइन सेवा है जिसका नाम दारोडर है। निम्न विधियों ने इसे GA से स्पष्ट नहीं किया।

  • .Htaccess फ़ाइल। यह काम नहीं करता है क्योंकि भूत स्पैम साइट को नहीं छूता है
  • रेफरल बहिष्करण सूची। इसमें अपडेट का अभाव है।
  • अपवर्जन फिल्टर। यह पुराना तरीका है क्योंकि यह केवल भविष्य के स्पैम पर केंद्रित है और पिछले स्पैम डेटाबेस के लिए पूर्वव्यापी नहीं है।

बहिष्कार फ़िल्टर लगभग डारोडर रेफरल स्पैम को खत्म करने के करीब आया। इसकी केवल सीमा यह थी कि इसमें निरंतर और लगातार अद्यतन रेफरल स्पैमर सूची नहीं है।

गुम पहेली टुकड़ा

रेफरल और भूत डेटा की पहचान करने और ब्लॉक करने के लिए एक कार्रवाई योग्य समाधान एक व्यापक डेटाबेस से आया है, और अतीत की जानकारी के लिए पूर्वव्यापी है। एक इष्टतम समाधान के लिए तीन तत्वों के आधार पर, यहां एक है जो काम करता है।

चरण 1: स्पैम को बाहर करने के लिए सेगमेंट का उपयोग करना

सेगमेंट का उपयोग करना बेहतर है क्योंकि वे डेटा को स्थायी रूप से नहीं बदलते हैं। यदि कोई गलती से फिल्टर का उपयोग करते समय वास्तविक रेफरल फ़िल्टर करता है, तो उन्हें वापस पाने का कोई तरीका नहीं है। सेगमेंट का उपयोग करके पुराने डेटा पर निर्माण करना संभव है, इसके बावजूद कि यह कितने समय से है। एक भी उन्हें retroactively लागू कर सकते हैं।

चरण 2: बहिष्करण सूची को बनाए रखना

स्लैक एक उपकरण है जिसका उपयोग वेबमास्टर रेफरल स्रोतों की निगरानी के लिए कर सकते हैं। यह किसी भी नए रेफरल के विषय में उपयोगकर्ता को सूचित करता है और उन्हें एक संकेत देता है: चाहे वह श्वेतसूची हो या संदिग्ध रेफरल स्रोत को ब्लैकलिस्ट करना।

1. सुस्त सभी रेफरल प्राप्त करता है, और

2. यह गणना के आदेश द्वारा सभी परिणामों को क्रमबद्ध करने के लिए PHP का उपयोग करता है, और फिर वेबमास्टर को अंतिम सूची को देखने के लिए देखता है कि क्या कोई परिचित दिखता है या नहीं। अगर नहीं,

3. यह एक स्लैक चैनल के लिए सभी संदिग्ध स्पैम को आगे बढ़ाता है जो उपयोगकर्ता को एक श्वेतसूची या ब्लैकलिस्ट के बीच विकल्प प्रदान करता है। जो भी विकल्प वे चुनते हैं, यह चरण 4 की ओर जाता है,

4. यह एक पृष्ठ पर रीडायरेक्ट करता है जो चयन की पुष्टि के रूप में फैसले की पुष्टि करता है।

5. सुस्त तब डेटाबेस में सभी पहचाने गए स्‍पामर्स को स्‍टोर और लॉक कर देता है

6. स्वच्छ डेटा का अंतिम प्रदर्शन regex प्रारूप में होगा। इसे Google Analytics में कॉपी और पेस्ट करें।

स्लैक दिन में कम से कम पांच बार वेबमास्टर्स को अपवर्जन सूची को अपडेट करने की अनुमति देता है।

वास्तविकता में, कई समाधान काम कर सकते हैं:

यह एक सिद्ध पद्धति होने के बावजूद, यह और भी बेहतर होगा यदि वेबमास्टर इसे अन्य तकनीकों के साथ पूरक करता है, बस यह सुनिश्चित करने के लिए कि वे सभी आधारों को कवर करते हैं। उक्त समाधान के अतिरिक्त:

  • ज्ञात बॉट्स और मकड़ियों को बाहर करने के लिए Google Analytics को संकेत देने वाले चेकबॉक्स पर क्लिक करें,
  • "एक होस्टनाम फ़िल्टर शामिल करें" लागू करें
  • कुकीज़ का उपयोग करें

ऊपर उल्लिखित समावेशी फिल्टर कभी-कभी कुशल होता है, लेकिन लंबे समय में सबसे अच्छा समाधान नहीं है क्योंकि:

  • Hostname स्पूफिंग करना मुश्किल नहीं है, और एनालिटिक्स स्पैमर तेजी से एक कमजोर के रूप में उपयोग कर रहे हैं।
  • यदि सेटअप गलत है, तो यह वास्तविक रेफ़रर्स को फ़िल्टर करने को समाप्त कर सकता है।

mass gmail