اختبار أ-ب تعريفه وفوائده وأنواعه ومقاييسه وكيفية إجرائه -الجزء الثاني
تحدثنا في الجزء الأول عن تعريف اختبار أ/ب وفوائده وأنواعه، وسنتحدث في هذا الجزء عن مقاييسه وكيفية إجرائه.
المقاييس الرئيسية المستخدمة في اختبار أ/ب:
عند إجراء اختبارات أ/ب، عادةً ما يكون لديك مقياس أساسي واحد تقيس به مدى نجاح أو فشل المتغيرات التي اخترتها. يعتمد هذا المقياس على طبيعة اختبارك، أي ما تريد اختباره، وهدفك، أي ما تريد تحقيقه من الاختبار.
إلى جانب المقياس الرئيسي، يمكنك أيضاً النظر إلى المقاييس الثانوية للحصول على بيانات إضافية.
لنفترض أنَّك تطبق اختبار أ/ب على صورة الإعلان. إليك ما يمكنك التركيز عليه:
- النقرات: عدد المستخدمين الذين نقروا على إعلانك.
- تكلفة النقرة: كم كلفتك النقرة على إعلانك.
- معدل النقر: النسبة المئوية لعدد المرات التي نقر فيها المستخدمون على إعلانك.
- معدل التحويل: عدد المستخدمين الذين نقروا على إعلانك وصاروا عملاء.
إذا كنت تختبر صفحة موقع ويب أو صفحة هبوط لحملة إعلانية، فعليك مراقبة واحد أو أكثر من مؤشرات الأداء هذه:
- الزوار الفريدين: عدد المستخدمين الذين زاروا صفحة الويب في أثناء الاختبار.
- الزوار العائدون: عدد المستخدمين الذين زاروا موقعك على الويب من قبل.
- الوقت على الصفحة: مقدار الوقت الذي يقضيه المستخدمون على صفحة الويب.
- معدل التحويل: عدد المستخدمين الذين نقروا على رابط من صفحة الويب وصاروا عملاء.
- معدل الارتداد: عدد المرات التي يغادر فيها المستخدمون صفحة الويب دون اتخاذ أي إجراء.
- معدل الخروج:عدد المرات التي خرج فيها المستخدمون من صفحة الويب بعد أن زاروا صفحات أخرى من موقع الويب في نفس الجلسة.
بالنسبة للتسويق عبر البريد الإلكتروني، عليك تتبع هذه المقاييس:
- معدل الفتح: عدد المستخدمين الذين يفتحون رسالة بريدك الإلكتروني.
- معدل النقر: عدد المستخدمين الذي ينقرون على الرابط الموجود في رسالة بريدك الإلكتروني.
- معدل التحويل: عدد المستخدمين الذين نقروا على رابط في رسالة بريدك الإلكتروني وصاروا عملاء.
كيفية إجراء اختبار أ/ب:
يتطلب اختبار أ/ب التخطيط والتنفيذ الدقيق. فقبل بدء الاختبار، تحتاج إلى التحضير، ثم تحليل البيانات واستخلاص النتائج.
تتناول الخطوات أدناه جميع مراحل العملية، مما يوفر خريطة طريق كاملة لكيفية إجراء تجربة تقسيم الجمهور باستخدام متغير واحد أو أكثر.
1. وضع فرضية وتحديد المتغير (المتغيرات) المراد اختبارها:
ما يجب عليك فعله هو تحليل بيانات الأداء الموجودة حالياً على موقعك على الويب أو رسائل البريد الإلكتروني أو الإعلانات أو أي شيء تريد اختباره.
الفرضية حسب التعريف هي افتراض يجب اختباره لإثبات صحته أو خطأه، وهي تنبع من الملاحظات. لذلك، أنت بحاجة إلى الفرضية لبدء اختبار أ/ب.
لنفترض أنَّك تريد إجراء اختبار أ/ب لحملة إعلانات العرض، وتبدو فرضيتك كما يلي:
الملاحظة: لا ينقر كثير من المشاهدين على إعلانات حملتي.
الفرضية: إذا كانت خلفية صورة الإعلان باللون الأسود بدلاً من الأبيض، فسيرتفع عدد النقرات. سوف تكشف الفرضية عن المتغير الذي عليك اختباره. وهو في هذه الحالة خلفية صورة الإعلان.
كما ذكرنا سابقاً يمكن اختبار متغيرات متعددة في وقت واحد، وهو ما يُعرف عموماً بالاختبار متعدد المتغيرات. في هذا السيناريو، يتعين عليك تحديد مزيد من المتغيرات لتجربتها.
2. إنشاء الإصدارات (النسخ):
بالنظر إلى مثالنا، تحتاج إلى إنشاء إصدار جديد من صورة إعلانك (بخلفية سوداء) ثم اختباره مقابل الإصدار الأصلي (بخلفية بيضاء)، كما في الشكل أدناه:
إذا كنت تختبر سطور موضوع رسالة البريد الإلكتروني، فسيكون لديك نسختان من النص. وإذا كنت تختبر صفحات الهبوط، فسيكون لديك نسختان من المحتوى الموجود على الصفحة، وهكذا.
3. تحديد المشاركين عشوائياً:
يجب تقسيم المشاركين في الاختبار عشوائياً إلى مجموعة تحكم واحدة ومجموعة اختبار واحدة أو أكثر للحصول على نتائج محايدة.
فيما يتعلق بكيفية تقسيم عدد الزيارات لاختبار أ/ب، يستحسن تقسيم الجمهور بنسبة 50/50 للحصول على أفضل النتائج. ومع ذلك، من الممكن أيضاً تقسيمه تقسيماً غير متساوٍ، على سبيل المثال، 80/20 أو 70/30.
أياً كانت الطريقة التي تختارها، احرص على أن تلبي كلا المجموعتين الفرعيتين الحد الأدنى من عدد الأشخاص المطلوب لتحقيق دلالة إحصائية. ولكن كيف تحدد هذا العدد؟
تحتوي معظم برامج اختبار أ/ب على هذه الميزة مدمجة فيها، لذلك لا يتعين عليك البحث عن أداة مساعدة. أو استعن بمحلل بيانات لمساعدتك في حساب العدد المطلوب.
إذا كنت تتعامل مع جمهور محدود مثل قائمة جهات اتصال البريد الإلكتروني، فعليك أولاً التوثق من أنَّ العدد كبير بما يكفي لإجراء اختبار أ/ب. في التسويق عبر البريد الإلكتروني، على سبيل المثال، تحتاج إلى شرائح جمهور لا تقل عن 1000 مستلم.
بالنسبة للجماهير غير المحددة مثل تلك الموجودة في إعلانات العرض، يتأثر حجم العينة بمدة الاختبار. كلما طال أمده، زاد عدد الزوار.
4. تتبع النتائج وقياسها:
لا ينبغي لك إطلاق اختبار أ/ب، ثم الانتظار حتى تكتمل مدته للتوثق من النتائج في النهاية. على العكس تماماً، عليك تتبع النتائج طوال مدة الاختبار. هنا يأتي دور المقاييس الرئيسية المحددة سابقاً التي تحدثنا عنها في بداية المقالة.
وهذا يقيك الإصلاحات المكلفة وإعادة العمل. لنفترض أنَّك لم تعد الاختبار على وجه صحيح؛ ما لم تراقب البيانات باستمرار، فقد لا تدرك ذلك إلا في النهاية، وحينها تحتاج إلى إعادة العمل.
علاوة على ذلك، في بعض الحالات، عليك التوثق مما إذا كنت قد استوفيت حجم العينة الذي تحتاج إليه لمعرفة ما إذا كان عليك تمديد مدة الاختبار أم لا.
تحتوي عديد من منصات اختبار أ/ب على تحليلات مدمجة لمساعدتك على تتبع جميع المقاييس ومؤشرات الأداء الرئيسية ذات الصلة.
بالنسبة لتجارب إعلانات العرض، ادمج كل اختبار أ/ب مع جوجل أناليتيكس (Google Analytics)، بصرف النظر عن الأداة الأساسية التي تستخدمها. وبذلك، سيكون لديك رؤية أشمل لأداء الحملة. إضافة إلى ذلك، يؤدي جمع بيانات الاختبار من مصادر متعددة إلى نتائج أوثق.
5. تحليل البيانات وتفسير النتائج:
في نهاية الاختبار، عليك تحليل تقرير اختبار أ/ب وتحديد ما إذا كان هناك اختلاف في الأداء بين إصدارات الاختبار المختلفة. علاوة على ذلك، يجب أن يكون الاختلاف ذا دلالة إحصائية، أي يجب أن يُعزى الاختلاف في الأداء إلى المتغيرات التي اخترتها لا إلى الصدفة.
يؤدي مستوى الثقة دوراً بارزاً في تحديد أنجح إصدار. وهو نسبة تشير إلى مدى ثقتك في صحة نتيجة الاختبار.
على سبيل المثال، قد يؤدي الإصدار أداءً أفضل في التحويل مقارنة بالإصدار الأصلي. ومع ذلك، هذا لا يكفي لمعرفة الأنجح في الاختبار، إذ عليك أيضاً التوثق مما إذا كان هناك احتمال كبير للتفوق على إصدار التحكم، المعروف أيضاً باسم مستوى الثقة.
في اختبار أ/ب، عادة ما تكون مستويات الثقة العامة أعلى من 85%. ومع ذلك، فإن مدى ارتفاع أو انخفاض هذه النسبة يعتمد على قدرتك على تحمل المخاطر.
يمكنك حساب كل هذا بالطريقة التقليدية إذا كنت ترغب في ذلك، ولكن ليس عليك أن تحفظ أي صيغة معقدة عن ظهر قلب. لذلك ننصحك باستخدام إحدى الآلات الحاسبة ذات الأهمية الإحصائية المتاحة على الإنترنت لتسهيل الأمر واستبعاد الخطأ البشري.
في النهاية، قد يكون اختبارك ناجحاً أو غير ناجح أو غير حاسم.
إذا أثبتت البيانات المستخلصة من اختبار أ/ب أنَّ فرضيتك خاطئة، فلا ينبغي أن تثبط هذا عزيمتك. هذا يعني ببساطة أنَّه عليك استبعاد هذا المتغير.
6. إجراء الاختبار دورياً:
يجب عليك مواصلة الاختبار بصرف النظر عن نتيجة تجربتك. انظر إلى الأمر بهذه الطريقة:
- إذا كانت نتيجتك ناجحة، فعليك اختبار المتغيرات الأخرى لتحسين الأداء أكثر.
- إذا كانت نتيجتك سلبية، فعليك إجراء اختبار آخر والعثور على المتغيرات التي من شأنها أن ترفع مقاييسك.
- إذا كانت نتيجتك غير حاسمة، فلا بد من إعادة الاختبار.
كذلك، يجب ألا تجري الاختبار فقط عندما تسوء الأمور، إذ تستطيع إجراء تحسينات دائماً. يؤدي إجراء اختبارات أ/ب دورياً إلى ضمان النجاح المستمر أو مساعدتك في الوصول إلى مستوى أعلى من الأداء. أسوأ شيء تفعله هو إهمال التحسين إلى أن تضطر إليه.
يُستحسن أيضاً إنشاء تقويم اختبار أ/ب حرصاً على إجراء اختبارات دورية.
أفضل الممارسات لاختبار أ/ب:
يتطلب اختبار أ/ب إعداداً دقيقاً. وهذا يعني أنَّ ثمة احتمال لارتكاب الأخطاء. مثالياً، عليك تجنب التحيز وضمان نتائج دقيقة. لحسن الحظ، اختبارات أ/ب منتشرة على نطاق واسع، وقد تم تحسين سلسلة من أفضل الممارسات والتوثق منها بمرور الوقت. إليك أهم الأشياء التي عليك مراعاتها عند تصميم الاختبار:
1. وضع أهداف واضحة:
لا تساعدك الأهداف في إعداد اختبار أ/ب فحسب، فهي ضرورية أيضاً لقياس النجاح أو الفشل. لذلك لا تنتظر حتى تبدأ الاختبار للتفكير فيما تريد تحقيقه، إذ يجب أن يكون لديك اتجاه واضح محدد أمامك منذ البداية، وإلا فقد يصبح اختبارك عديم الفائدة.
2. تشغيل اختبارات أ/أ أولاً:
يشبه اختبار أ/أ اختبار أ/ب تماماً، مع وجود اختلاف رئيسي واحد هو أنَّ الأول يقارن بين أداء صفحتين متطابقتين. قد تتساءل ما هو الغرض من مثل هذا الاختبار. في الأساس، إنَّه اختبار تجريبي للتوثق من إعداد الاختبار إعداداً صحيحاً ومن أنَّ منصة الاختبار تعمل على وجه صحيح قبل إجراء اختبار أ/ب.
3. اختبار متغير واحد تلو الآخر:
إذا كنت لا تجري اختبار متعدد المتغيرات، فاحرص على تعديل متغير واحد فقط لأنَّ وجود عدة متغيرات يصعِّب فهم أي متغير كان السبب في تحسين الأداء أو تراجعه.
4. المواظبة على إجراء الاختبارات:
ترتكب عديد من الشركات خطأً جسيماً لأنَّها لا تُجري اختبارات أ/ب إلا عندما تسوء الأمور في مواقعها على الويب، أو في حملات رسائل البريد الإلكتروني، أو في الحملات الإعلانية. إذا كنت لا تواظب على الاختبارات، فإنَّك تفوت عديداً من الفرص لتحسين جهودك التسويقية وتجربة المستخدم.
5. الجرأة على تحمل المخاطر:
قد يخشى المسوقون في بعض الأحيان أن يؤثر اختبار أ/ب تأثيراً سلبياً في الأداء، خاصة عندما يتعلق الأمر بالموارد الرقمية التي تحقق أداءً جيداً بحق. لنفترض أنَّ مخاوفك تحققت، وانخفضت مقاييسك بعد استخدام الإصدار الجديد. في هذه الحالة، لا بأس في التوقف واختبار متغير مختلف، متغير قد يؤدي في الواقع إلى نتائج اختبار إيجابية.
الأخطاء الشائعة عند إجراء اختبارات أ/ب:
لقد تناولنا أفضل الممارسات، وحان الوقت لاستعراض الأخطاء الشائعة عند إجراء اختبارات أ/ب:
1. استخدام حجم عينة غير كاف:
إذا لم يكن لديك حجم عينة اختبار أ/ب كبير بما يكفي، فقد يؤدي اختبارك إلى نتائج غير حاسمة. احرص على إجراء حسابات حجم العينة مقدماً دائماً. إذا لم يكن حجم العينة كافياً، وما زلت تريد إجراء الاختبار، فإنَّك تخاطر في إهدار جزء من ميزانيتك على اختبار غير حاسم. لذا عليك الانتظار حتى تحصل على مجموعة أكبر من المستخدمين لبدء الاختبار.
2. إجراء الاختبار مدة قصيرة:
المتفق عليه هو أنَّه عليك إجراء اختبار أ/ب مدة لا تقل عن أسبوع إلى أسبوعين، ولكن هذا يعتمد على ما تختبره. مع التسويق عبر البريد الإلكتروني، على سبيل المثال، قد تحصل على نتائج حاسمة في غضون ساعات أو أيام. وفي المقابل، تتطلب اختبارات أ/ب لإعلانات العرض مزيداً من الوقت للحصول على عينة كافية وجمع بيانات كافية.
3. النظر في عدد كبير جداً من المقاييس:
لا يعني هذا أنَّه لا ينبغي لك التحقق من المقاييس الثانوية على الإطلاق، فقد ذكرنا أعلاه العكس. ومع ذلك، لتقييم الدلالة الإحصائية، عليك أن تأخذ في الحسبان مقياسك الأساسي فقط. يؤدي قياس نجاح الاختبار بناءً على مقاييس أخرى إلى زيادة احتمال الحصول على نتائج إيجابية خاطئة.
4. وضع توقعات غير واقعية:
لن يؤدي كل اختبار أ/ب إلى زيادة تحويلاتك أو إيراداتك. في الواقع، معظمها لن يحقق ذلك، ولا بأس في هذا. أفادت شركتا جوجل (Google) وبينغ (Bing) سابقاً أنَّ 10% إلى 20% فقط من تجاربهما حققت نتائج إيجابية. ولكن على الرغم من أنَّ العديد من اختبارات أ/ب لا تؤثر تأثيراً كبيراً في مقاييسك، فإنَّها تعلمك شيئاً جديداً عن جمهورك، وهذا مكسب في حد ذاته.
في الختام:
تساعد معرفة كيفية إجراء اختبار أ/ب المسوقين الرقميين (وكذلك المتخصصين الآخرين) على فهم العملاء واتخاذ قرارات مبنية على البيانات تؤدي إلى نتائج أفضل. من السهل على أي شركة أن تُجري اختبار أ/ب، خاصة وأنَّ هناك الكثير من الأدوات المتاحة التي يمكنها أتمتة جزء من العملية على الأقل.
ولكن معظم أدوات اختبار أ/ب الموجودة في السوق تعتمد اعتماداً كبيراً على ملفات تعريف الارتباط، والتي -كما نعلم- سيُلغى العمل بها قريباً. وهذا يثير مخاوف بشأن مستقبل الاختبار، ذلك أنَّه سيُنظر إلى المستخدمين الذين يزورون موقع الويب عدة مرات باعتبارهم مستخدمين جدد، مما يؤدي إلى نتائج غير موثوقة. ولكن حتى ذلك الحين، يظل وجود استراتيجية تسويقية لاختبار أ/ب أمراً حيوياً.