Utilizarea regresiilor Excel pentru a înțelege mai bine KPI-urile
Publicat: 2021-10-23Un grup dintre noi aici la Hanapin a participat recent la un curs gratuit de 21 de zile de Excel, condus de renumitul expert Microsoft Excel, Dr. Wayne Winston. Cursul în sine a părut lent la început, dar în cele din urmă a dezvăluit câteva capabilități Excel pe care nu le-am cunoscut niciodată. Cel mai interesant dintre acestea, pentru mine, este capacitatea de a regresa mai multe variabile fără un software statistic avansat (cum ar fi STATA). În această postare, voi împărtăși pas cu pas pentru configurarea și rularea regresiilor în Excel și modul în care acest instrument vă poate ajuta la analizele PPC și la gestionarea contului.
Scuzați-mă, regresez
Înainte să pătrundem în implementarea tehnică, s-ar putea să vă întrebați: „Ce naiba este o regresie?” Pe scurt, regresiile se uită la relațiile dintre variabile. Pentru orice variabilă dependentă („Y”), ce set de variabile independente („Xs”) contribuie la variația Y și cât de mult din acel comportament explică modelul de regresie? (Vezi aici pentru o revizuire aprofundată a analizelor de regresie)
Regresiile liniare (sau regresiile liniare multiple) sunt cele mai comune, încadrându-se într-o ecuație însumată de forma:
unde Y este variabila dependentă, X 1 – X n reprezintă o mulțime de n variabile independente și A 1 – A n sunt constantele coeficientului corespunzătoare lui X 1 – X n . Aceasta este construirea de modele statistice de bază și, prin urmare, recunoaștem că va exista o anumită inconsecvență între rezultatele noastre prezise și observate pentru fiecare iterație „y”. Astfel, termenul de eroare „ + e” este adăugat pentru a explica o astfel de variație.
De ce regres în PPC?
Regresiile pot fi utilizate în orice număr de analize. De exemplu, vă recomandăm să luați în considerare ce efect au modificările sumelor licitate CPC asupra mediei. Poziție, procentaj de afișări pierdute sau Scor de calitate. Puteți examina ce element (CTR așteptat, experiența paginii de destinație sau relevanța anunțului) are cel mai puternic impact asupra Scorului de calitate la nivel de cont, campanie sau cuvânt cheie. Poate, așa cum vom vedea în exemplul de mai jos, doriți să descoperiți rolul pe care CPC-urile și ratele de conversie în Rețeaua de căutare și Rețeaua de display îl joacă în suma CPA generală pentru contul dvs.
Oricare ar fi scopul dvs. final, procesul de stabilire și de determinare a valorii modelului dvs. de regresie este același.
Pasul 1: Pregătiți-vă datele
Ca în orice analiză, un rezultat bun necesită date de calitate care au fost pregătite corect. Pentru rezultate bune de regresie, aveți nevoie de o cantitate suficientă de date (cel puțin la fel de multe puncte de date cât numărul de variabile independente, dar cu cât aveți mai multe date disponibile, cu atât modelul dvs. de regresie poate fi mai precis). Pentru a crește numărul de puncte de date, ați putea lua în considerare segmentarea datelor pe zi, săptămână sau lună (în funcție de intervalul de timp examinat).
Pentru exemplul nostru, folosim date din ultimele 24 de luni în AdWords. După descărcarea unui raport de campanie (segmentat în funcție de lună), creăm un tabel pivot pentru a examina clicurile, costurile și conversiile în funcție de lună și tip de campanie:
De aici, putem calcula CPA, CPC și CVR pentru fiecare rețea, precum și suma CPA totală. Apoi este doar o copiere și inserare rapidă a datelor într-o nouă foaie, suntem gata să începem să regresăm!
Pasul 2: Construiește-ți modelul (alegerea variabilelor)
Construirea modelului are două componente principale: planificare atentă și revizuire flexibilă. O planificare atentă se referă la a lua în considerare care variabile ar fi cele mai potrivite pentru modelul dvs. din punct de vedere logic (și ce date sunt disponibile pentru utilizare). Petrecerea unui pic de timp suplimentar în etapa de planificare vă poate economisi timp și sănătate mai târziu, pe măsură ce testați și retestați modelul. Chiar și cu o pregătire atentă, este posibil să fie nevoie să revizuiți modelul în mod flexibil pe măsură ce regresați și identificați variabilele care sunt semnificative și nu.
Două note importante atunci când selectați variabile independente:
- Variabilele independente ar trebui să aibă o relație logică și imaginabilă cu variabila dependentă (adică precipitațiile medii în Tokyo și numărul de atacuri de cord în Wisconsin ar fi scăzut pe lista mea de corelații de examinat)
- Variabilele independente nu ar trebui să fie foarte corelate între ele (adică includerea costului, clicurilor și CPC ca variabile independente în cadrul aceleiași regresii ar cauza o eroare de multicoliniaritate în model)
În exemplul nostru, dorim să ne uităm la ce anume determină suma CPA contului nostru. Știm că există două rețele în care difuzăm anunțuri în AdWords — Căutare și Rețeaua de display — și știm că cele două variabile principale care conduc CPA (cost/conversie) pentru fiecare rețea sunt CPC (cost/clic) și CVR (conversie/clic). ).
Prin urmare, vom începe prin a regresa CPA pe CPC și CVR pentru căutare și afișare separat pentru a determina care variabile independente sunt semnificative și, prin urmare, ar trebui incluse în modelul nostru final.
Pasul 3: Regresați și revizuiți
Pentru a rula o regresie în Excel:
1. Înainte de a iniția regresia în Excel, verificați mai întâi pentru a vă asigura că variabilele independente (coloanele de date) sunt învecinate între ele.
2. Apoi, confirmați că suplimentul „Analysis ToolPak” este activat pentru Excel (vizibil în panglica „Date” odată activat).
3. În caseta de instrumente Analiza datelor, selectați „Regresie”.
4. Introduceți intervalul de variabile dependente (Y) și intervalul de variabile independente (X), selectând „Etichete” dacă alegeți să includeți antetele coloanei
5. Selectați o destinație de plasare pentru rezultatul regresiei (o foaie de lucru nouă sau existentă)
6. Selectați „reziduuri” dacă doriți să verificați și să eliminați valori aberante din date
7. Faceți clic pe „OK” pentru a rula regresia. Veți fi navigat automat la foaia care conține rezumatul și detaliile rezultatelor.
8. Dacă examinarea rezultatului de regresie dezvăluie variabile independente nesemnificative (de obicei, valorile p sunt mai mari de .1) sau un R pătrat mai mic decât se aștepta (vezi „A” de mai jos), puteți repeta procesul după cum este necesar pentru a rafina modelul.
Pasul 4: Înțelegerea rezultatului
Privirea unei rezultate rezumative pentru prima dată poate fi intimidantă și descurajatoare. Pentru a fi mai ușor, mai jos sunt evidențiate secțiuni cheie ale rezultatului, care vă vor ajuta să evaluați modelul de regresie pe care tocmai l-ați construit.
(A) Pătrat R și Pătrat R ajustat: Aceasta este o măsură a cât de bine „se potrivește” modelul dvs. cu datele. Pe scurt, R Square spune cât de mult din variația variabilei dependente este explicată de variabilele independente alese. Pătratul R ajustat este practic același, dar ia în considerare și numărul de variabile independente incluse, oferind o măsură ceva mai precisă. (Nu există un pătrat R „bun” sau „corect”, deoarece depinde de tipul de model și de datele pe care le utilizați, dar cu cât este mai mare, cu atât mai bine).
(B) Eroare standard: rădăcina pătrată a sumei diferențelor pătrate dintre rezultatele prezise și cele reale. Pentru o distribuție normală, aproximativ 65% dintre reziduuri (vezi „E” de mai jos) vor fi mai mici de o eroare standard și 95% vor fi mai mici de 2. Reziduurile mai mari de două ori eroarea standard sunt de obicei etichetate ca valori aberante în date.
(C) Coeficienții variabilelor independente: Coeficienții sunt termenii „A” din formula de regresie. Astfel, pentru acest exemplu, o creștere de 1 unitate a CPC ar trebui să fie egală cu o creștere de 8,4 a CPA (presupunând că CVR rămâne constantă).
(D) Valoarea P a variabilelor independente: În termeni profani, valoarea P indică semnificația variabilei independente. Valorile P scăzute sunt semnificative (vizând mai puțin de 0,1), în timp ce valorile P ridicate indică corelația percepută ar putea fi pură întâmplare. Variabilele independente cu valori P ridicate ar trebui excluse în timpul etapei de „revizuire flexibilă”.
(E) Reziduuri: Aceasta arată diferența dintre valoarea prezisă a variabilei dependente pentru fiecare iterație și valoarea reală înregistrată. După cum sa menționat mai sus, majoritatea reziduurilor ar trebui să fie mai mici de 1 eroare standard și aproape toate ar trebui să fie mai mici decât valoarea de 2 * eroare standard. Puteți decide dacă includeți sau excludeți orice valori aberante identificate (reziduuri mai mari de două ori Eroare standard) din modelul dvs.
Pasul 5: Împreună (partea Takeaways!)
După executarea a trei regresii, am găsit următoarele trei ecuații care relaționează CPC și CVR în Rețeaua și Rețeaua de display cu sumele CPA totale și de rețea:
Aceste ecuații verifică ceea ce știam deja (sau credeam că știam că facem): că sumele CPC și CVR-urile din Rețeaua de căutare și din Rețeaua de display joacă toate un rol important în comportamentul CPA total. Dincolo de asta, totuși, au dezvăluit și 3 lucruri pe care o hartă termică standard nu le-ar face.
- O creștere a CPC în Rețeaua de căutare are un impact de 3,5 ori mai mare asupra CPA în Rețeaua de căutare decât o creștere echivalentă a CVR în Rețeaua de căutare
- Fluctuațiile CPC în Rețeaua de display au un impact de aproape 5 ori mai mare al CVR în Rețeaua de display asupra sumei CPA pentru Rețeaua de display
- În general, schimbările în performanța rețelei de display afectează suma CPA totală mai dramatic decât schimbările de o amploare similară în performanța rețelei de căutare
Din aceasta, este clar că CPC-ul în Rețeaua de display este ținta nr. 1 pentru optimizare dacă vreau să reduc suma CPA totală. Următoarele sunt CPC de căutare și CVR din Rețeaua de display, cu CVR de căutare cea mai mică dintre prioritățile mele.
Regresiile sunt un instrument puternic și o completare excelentă la centura de instrumente a PPC Manager. Acest exemplu de bază arată doar unul dintre multele moduri prin care regresiile vă pot ajuta să înțelegeți relațiile dintre KPI-urile iubiți. Sperăm că veți testa sau continua să utilizați capacitatea de regresie în Excel și să ne împărtășiți experiența/gândurile/descoperirile cu noi pe Twitter!