Interleavd Experiments - Trustworthy online controlled experiments

2022/07/23


  • Interleaved experiment มักใช้ในการวัด ranking algorithm (e.g., search engines)
  • ใน interleaved experiment เราจะมี ranking algorithm 2 ตัว A และ B
    • Algorithm A โชว์ผล A1, A2, A3, A4
    • Algorithm B โชว์ผล B1, B2, B3, B4
    • เราจะเอา Algorithm A/B มา mixed กัน แล้วลบผลลัพธ์ที่ซ้ำกันทิ้ง
      • A1, B1, A2, B2, A3, B3, A4, B4
    • วิธีนึงที่ใช้วัดผลคือดู click-through rate จากผลลัพธ์ของสอง Algorithms
  • Limitation
    • เนื่องจากผลลัพธ์เป็นผลลัพธ์รวมกัน (homogeneous)
    • ถ้าผลลัพธ์แรกใช้พื้นที่เยอะกว่า หรือ ส่งผลกระทบกับส่วนอื่นในหน้า UI นั้นๆ ความซับซ้อนในการสรุปผลก็จะยากขึ้น

Reference

#ab-testing #interleaved-experiment