การใช้การถดถอยของ Excel เพื่อทำความเข้าใจ KPI ให้ดียิ่งขึ้น

เผยแพร่แล้ว: 2021-10-23

กลุ่มของเราที่ Hanapin เพิ่งเข้าร่วมในหลักสูตร Excel 21 วันฟรี ซึ่งกำกับโดย Dr. Wayne Winston ผู้เชี่ยวชาญ Microsoft Excel ที่มีชื่อเสียง หลักสูตรนี้รู้สึกช้าในตอนแรก แต่ในที่สุดก็เปิดเผยความสามารถหลายอย่างของ Excel ที่ฉันไม่เคยรู้จักมาก่อน สิ่งที่น่าตื่นเต้นที่สุดสำหรับฉันคือความสามารถในการถดถอยตัวแปรหลายตัวโดยไม่ต้องใช้ซอฟต์แวร์ทางสถิติขั้นสูง (เช่น STATA) ในโพสต์นี้ ฉันจะแชร์ทีละขั้นตอนสำหรับการตั้งค่าและเรียกใช้การถดถอยใน Excel และวิธีที่เครื่องมือนี้สามารถช่วยในการวิเคราะห์ PPC และการจัดการบัญชี

ขอโทษ ฉันเสียใจ

ก่อนที่เราจะเจาะลึกการใช้งานทางเทคนิค คุณอาจสงสัยกับตัวเองว่า “อะไรในโลกนี้คือการถดถอย” กล่าวโดยสรุป การถดถอยจะพิจารณาความสัมพันธ์ระหว่างตัวแปร สำหรับตัวแปรตาม ("Y") ชุดของตัวแปรอิสระ ("Xs") มีส่วนทำให้เกิดการเปลี่ยนแปลง Y และรูปแบบการถดถอยอธิบายพฤติกรรมนั้นมากน้อยเพียงใด (ดูที่นี่สำหรับการทบทวนเชิงลึกของการวิเคราะห์การถดถอย)

การถดถอยเชิงเส้น (หรือการถดถอยเชิงเส้นพหุคูณ) เป็นสมการที่พบบ่อยที่สุดซึ่งเหมาะสมกับสมการผลรวมของรูปแบบ:

โดยที่ Y คือตัวแปรตาม X 1 – X n แทนชุดของตัวแปรอิสระ n ตัว และ A 1 – A n คือค่าคงที่สัมประสิทธิ์ที่สอดคล้องกับ X 1 – X n นี่คือการสร้างแบบจำลองทางสถิติขั้นพื้นฐาน ดังนั้นเราจึงตระหนักว่าจะมีความไม่สอดคล้องกันระหว่างผลลัพธ์ที่คาดการณ์และสังเกตได้สำหรับการทำซ้ำ "y" แต่ละครั้ง ดังนั้น เงื่อนไขข้อผิดพลาด “ + e” จะถูกเพิ่มเข้าไปในบัญชีสำหรับความแปรปรวนดังกล่าว

ทำไมต้องถดถอยใน PPC?

สามารถใช้การถดถอยในการวิเคราะห์จำนวนเท่าใดก็ได้ ตัวอย่างเช่น คุณอาจต้องการพิจารณาว่าการเปลี่ยนแปลงราคาเสนอ CPC มีผลอย่างไรต่อค่าเฉลี่ย ตำแหน่ง ส่วนแบ่งการแสดงผลที่เสียไป หรือคะแนนคุณภาพ คุณอาจตรวจสอบว่าองค์ประกอบใด (CTR ที่คาดหวัง ประสบการณ์หน้า Landing Page หรือความเกี่ยวข้องของโฆษณา) ที่มีผลกระทบมากที่สุดต่อคะแนนคุณภาพระดับบัญชี แคมเปญ หรือคำหลักของคุณ บางที ดังที่เราจะเห็นในตัวอย่างด้านล่าง คุณต้องการเปิดเผยบทบาทที่ CPC การค้นหาและดิสเพลย์และอัตรา Conversion เล่นอยู่ใน CPA โดยรวมสำหรับบัญชีของคุณ

ไม่ว่าเป้าหมายสุดท้ายของคุณคืออะไร กระบวนการในการตั้งค่าและกำหนดค่าของแบบจำลองการถดถอยของคุณก็เหมือนกัน

ขั้นตอนที่ 1: เตรียมข้อมูลของคุณ

เช่นเดียวกับการวิเคราะห์ใดๆ ผลลัพธ์ที่ดีจำเป็นต้องมีข้อมูลคุณภาพที่ได้รับการจัดเตรียมอย่างถูกต้อง เพื่อให้ได้ผลการถดถอยที่ดีคุณต้องมีจำนวนที่เพียงพอของข้อมูล (อย่างน้อยเป็นจุดข้อมูลเป็นจำนวนมากจำนวนตัวแปรอิสระ แต่ข้อมูลเพิ่มเติมที่คุณมีความถูกต้องมากขึ้นแบบการถดถอยของคุณได้) ในการเพิ่มจำนวนจุดข้อมูล คุณอาจพิจารณาแบ่งกลุ่มข้อมูลตามวัน สัปดาห์ หรือเดือน (ขึ้นอยู่กับกรอบเวลาที่กำลังตรวจสอบ)

ตัวอย่างเช่น เราใช้ข้อมูลจาก 24 เดือนที่ผ่านมาใน AdWords หลังจากดาวน์โหลดรายงานแคมเปญ (แบ่งกลุ่มตามเดือน) เราจะสร้างตารางสาระสำคัญเพื่อตรวจสอบจำนวนคลิก ค่าใช้จ่าย และ Conversion ตามเดือนและประเภทแคมเปญ:

จากที่นี่ เราสามารถคำนวณ CPA, CPC และ CVR สำหรับแต่ละเครือข่าย รวมถึง CPA ทั้งหมด จากนั้นเป็นเพียงการคัดลอกและวางข้อมูลลงในแผ่นงานใหม่อย่างรวดเร็ว เราพร้อมที่จะเริ่มถดถอย!

ขั้นตอนที่ 2: สร้างแบบจำลองของคุณ (การเลือกตัวแปร)

การสร้างแบบจำลองมีสององค์ประกอบหลัก: การวางแผนอย่างรอบคอบและการแก้ไขที่ยืดหยุ่น การวางแผนอย่างรอบคอบเป็นการพิจารณาว่าตัวแปรใดเหมาะสมที่สุดสำหรับโมเดลของคุณอย่างมีเหตุผล (และข้อมูลใดบ้างที่พร้อมใช้งาน) การใช้เวลาเพิ่มขึ้นเล็กน้อยในขั้นตอนการวางแผนสามารถช่วยประหยัดเวลาและสติได้ในภายหลังเมื่อคุณทดสอบและทดสอบแบบจำลองของคุณอีกครั้ง แม้จะเตรียมการอย่างรอบคอบแล้ว คุณยังอาจต้องแก้ไขแบบจำลองของคุณอย่างยืดหยุ่นในขณะที่คุณถอยหลังและระบุตัวแปรที่มีนัยสำคัญและไม่สำคัญ

หมายเหตุสำคัญสองประการเมื่อเลือกตัวแปรอิสระ:

  • ตัวแปรอิสระ ควร มีความสัมพันธ์เชิงตรรกะที่เป็นไปได้กับตัวแปรตาม (เช่น ปริมาณน้ำฝนเฉลี่ยในโตเกียวและ # ของอาการหัวใจวายในวิสคอนซินจะต่ำในรายการความสัมพันธ์ที่จะตรวจสอบของฉัน)
  • ตัวแปรอิสระ ไม่ควร มีความสัมพันธ์กันอย่างสูง (เช่น ซึ่งรวมถึงต้นทุน การคลิก และ CPC เนื่องจากตัวแปรอิสระภายในการถดถอยเดียวกันจะทำให้เกิดข้อผิดพลาดหลายกลุ่มในแบบจำลอง)

ในตัวอย่างของเรา เราต้องการดูว่าอะไรเป็นตัวขับเคลื่อน CPA ของบัญชีของเรา เรารู้ว่ามีสองเครือข่ายที่เราแสดงโฆษณาใน Adwords ได้แก่ การค้นหาและดิสเพลย์ และเรารู้ว่าตัวแปรหลัก 2 ตัวที่ขับเคลื่อน CPA (ต้นทุน/Conversion) สำหรับแต่ละเครือข่ายคือ CPC (ต้นทุน/คลิก) และ CVR (Conversion/คลิก ).

ดังนั้น เราจะเริ่มต้นด้วยการถดถอย CPA บน CPC และ CVR สำหรับการค้นหาและดิสเพลย์แยกกัน เพื่อพิจารณาว่าตัวแปรอิสระใดมีความสำคัญ และควรรวมไว้ในแบบจำลองสุดท้ายของเราด้วย

ขั้นตอนที่ 3: ถอยหลังและแก้ไข

ในการเรียกใช้การถดถอยใน Excel:

1. ก่อนเริ่มการถดถอยใน Excel ก่อนอื่นให้ตรวจสอบว่าตัวแปรอิสระ (คอลัมน์ข้อมูล) อยู่ใกล้กัน

2. ถัดไป ยืนยันว่าเปิดใช้งานส่วนเสริม "Analysis ToolPak" สำหรับ Excel แล้ว (มองเห็นได้ในริบบิ้น "ข้อมูล" เมื่อเปิดใช้งาน)

3. ในกล่องเครื่องมือการวิเคราะห์ข้อมูล ให้เลือก "การถดถอย"

4. ป้อนช่วงตัวแปรตาม (Y) และช่วงตัวแปรอิสระ (X) เลือก "ป้ายกำกับ" หากคุณเลือกที่จะรวมส่วนหัวของคอลัมน์

5. เลือกตำแหน่งสำหรับผลลัพธ์การถดถอยของคุณ (แผ่นงานใหม่หรือที่มีอยู่)

6. เลือก “residuals” หากคุณต้องการตรวจสอบและลบค่าผิดปกติใน data

7. คลิก “ตกลง” เพื่อเรียกใช้การถดถอย คุณจะถูกนำทางไปยังแผ่นงานที่มีข้อมูลสรุปผลลัพธ์และรายละเอียดโดยอัตโนมัติ

8. หากการตรวจสอบผลลัพธ์การถดถอยเผยให้เห็นตัวแปรอิสระที่ไม่มีนัยสำคัญ (โดยทั่วไป ค่า p มากกว่า .1) หรือค่า R-squared ที่ต่ำกว่าที่คาดไว้ (ดู "A" ด้านล่าง) คุณสามารถทำซ้ำขั้นตอนได้ตามต้องการ ปรับแต่งโมเดล

ขั้นตอนที่ 4: ทำความเข้าใจผลลัพธ์

การดูผลลัพธ์โดยสรุปเป็นครั้งแรกอาจเป็นการข่มขู่และท้อแท้ เพื่อให้ง่ายขึ้น ไฮไลต์ด้านล่างเป็นส่วนสำคัญของผลลัพธ์ที่จะช่วยคุณประเมินแบบจำลองการถดถอยของคุณเพิ่งสร้างขึ้น

(A) R Square และ Adjusted R Square: นี่คือการวัดว่าแบบจำลองของคุณ "เหมาะกับ" ข้อมูลมากเพียงใด กล่าวโดยย่อ R Square บอกว่าตัวแปรอิสระที่เลือกอธิบายความผันแปรในตัวแปรตามได้มากน้อยเพียงใด โดยพื้นฐานแล้ว R Square ที่ปรับแล้วนั้นเหมือนกัน แต่ยังพิจารณาถึงจำนวนตัวแปรอิสระที่รวมอยู่ด้วย ทำให้มีการวัดที่แม่นยำขึ้นเล็กน้อย (ไม่มีคำว่า "ดี" หรือ "ถูกต้อง" R Square เนื่องจากขึ้นอยู่กับประเภทของโมเดลและข้อมูลที่คุณใช้ แต่ยิ่งสูงยิ่งดี)

(B) ข้อผิดพลาดมาตรฐาน: รากที่สองของผลรวมของผลต่างกำลังสองระหว่างผลลัพธ์ที่คาดการณ์ไว้และผลลัพธ์จริง สำหรับการแจกแจงแบบปกติ ประมาณ 65% ของเศษที่เหลือ (ดู “E” ด้านล่าง) จะน้อยกว่าหนึ่งข้อผิดพลาดมาตรฐาน และ 95% จะน้อยกว่า 2 ส่วนที่เหลือมากกว่าสองเท่าของข้อผิดพลาดมาตรฐานโดยทั่วไปจะถูกระบุว่าเป็นค่าผิดปกติในข้อมูล

(C) สัมประสิทธิ์ของตัวแปรอิสระ: สัมประสิทธิ์คือพจน์ "A" ในสูตรการถดถอยของคุณ ดังนั้น สำหรับตัวอย่างนี้ CPC ที่เพิ่มขึ้น 1 หน่วยควรเท่ากับ CPA ที่เพิ่มขึ้น 8.4 (สมมติว่า CVR คงที่)

(D) ค่า P ของตัวแปรอิสระ: ในแง่ของคนธรรมดา ค่า P จะบอกถึงความสำคัญของตัวแปรอิสระ ค่า P ต่ำมีความสำคัญ (มุ่งเป้าไปที่น้อยกว่า .1) ในขณะที่ค่า P สูงบ่งชี้ว่าความสัมพันธ์ที่รับรู้อาจเป็นโอกาสที่บริสุทธิ์ ควรแยกตัวแปรอิสระที่มีค่า P สูงออกในระหว่างขั้นตอน "การแก้ไขที่ยืดหยุ่น"

(E) เศษเหลือ: สิ่งนี้แสดงความแตกต่างระหว่างค่าที่คาดการณ์ของตัวแปรตามสำหรับการวนซ้ำแต่ละครั้งและค่าที่บันทึกไว้จริง ดังที่กล่าวไว้ข้างต้น เศษที่เหลือส่วนใหญ่ควรน้อยกว่า 1 ข้อผิดพลาดมาตรฐาน และเกือบทั้งหมดควรน้อยกว่าค่า 2 * ข้อผิดพลาดมาตรฐาน คุณสามารถตัดสินใจว่าจะรวมหรือแยกค่าผิดปกติที่ระบุ (ส่วนที่เหลือมากกว่าสองเท่าของข้อผิดพลาดมาตรฐาน) จากแบบจำลองของคุณ

ขั้นตอนที่ 5: นำมันมารวมกัน (ส่วน Takeaways!)

หลังจากการถดถอยสามครั้ง เราพบสมการสามสมการต่อไปนี้ที่เกี่ยวข้องกับ CPC การค้นหาและดิสเพลย์ และ CVR กับเครือข่ายและ CPA รวม:

สมการเหล่านี้ยืนยันสิ่งที่เรารู้อยู่แล้ว (หรือคิดว่าเราทำ): CPC ของการค้นหาและดิสเพลย์และ CVR ล้วนมีบทบาทสำคัญในการทำงานของ CPA รวมของเรา นอกจากนั้น พวกเขายังเปิดเผย 3 สิ่งที่ฮีทแมปมาตรฐานไม่เปิดเผย

  • CPC การค้นหาที่เพิ่มขึ้นมีผลกระทบต่อ CPA ในการค้นหา 3.5 เท่า เมื่อเทียบกับ CVR การค้นหาที่เพิ่มขึ้นเท่ากัน
  • ความผันผวนของ CPC ของเครือข่ายดิสเพลย์มีผลกระทบเกือบ 5 เท่าของ CVR ของดิสเพลย์ต่อ CPA ของดิสเพลย์
  • โดยรวม การเปลี่ยนแปลงประสิทธิภาพของเครือข่ายดิสเพลย์ส่งผลต่อ CPA ทั้งหมดมากกว่าการเปลี่ยนแปลงที่มีขนาดใกล้เคียงกันในประสิทธิภาพของเครือข่ายการค้นหา

จากนี้ เห็นได้ชัดว่า CPC ดิสเพลย์เป็นเป้าหมายอันดับ 1 สำหรับการเพิ่มประสิทธิภาพ หากฉันตั้งเป้าที่จะลด CPA ทั้งหมด CPC การค้นหาและ CVR ดิสเพลย์เป็นลำดับถัดไป โดยที่ CVR ของการค้นหามีความสำคัญน้อยที่สุดในลำดับความสำคัญของฉัน

การถดถอยเป็นเครื่องมือที่ทรงพลังและเป็นส่วนเสริมที่ยอดเยี่ยมสำหรับสายพานเครื่องมือของ PPC Manager ตัวอย่างพื้นฐานนี้แสดงให้เห็นเพียงหนึ่งในหลายวิธีที่การถดถอยสามารถช่วยให้คุณเข้าใจความสัมพันธ์ระหว่าง KPI ที่คุณรัก เราหวังว่าคุณจะทดสอบหรือใช้ความสามารถในการถดถอยใน Excel ต่อไป และแบ่งปันประสบการณ์/ความคิด/ข้อค้นพบของคุณกับเราทาง Twitter!