분석에서 데이터 품질을 유지하는 5가지 방법

게시 됨: 2017-06-15

데이터 기반 전략은 모든 마케팅 역할의 필수적인 부분으로, 데이터 품질을 시니어 마케터에게 최우선 순위로 두고 있습니다. 하지만 데이터가 깨끗하고 정확하다는 것을 어떻게 보장할 수 있습니까?

AT Internet의 최근 보고서 는 디지털 분석에서 데이터 품질에 대한 5가지 핵심 차원을 탐구했습니다 . 다음은 보고서의 몇 가지 주요 내용과 마케터가 높은 데이터 품질을 유지하기 위해 수행할 수 있는 몇 가지 사항입니다.

  • 기업의 55%는 의사 결정을 위해 데이터를 사용합니다 ...[1]
  • 그러나 CEO의 33%만이 자신의 데이터를 신뢰합니다[2]
  • 경영진의 56%가 나쁜 데이터 품질로 인해 영업 기회를 잃게 된다고 말합니다. [3]
  • 경영진의 51%는 잘못된 데이터가 시간을 낭비하고 비효율을 초래한다고 말합니다. [3]

이 콘텐츠는 AT Internet 과 협력하여 제작되었습니다.

1. 봇 트래픽 제외

Incapsula의 2016 봇 트래픽 보고서에 따르면, 웹 트래픽의 50 % 이상은 봇에 기인 할 수있다 - 아래 차트는 보여줍니다한다.

Incapsula의 이미지 제공

이 트래픽은 '좋은'과 '나쁜'봇으로 분류 할 수있다. ' 좋은 ' 봇은 다음 중 하나입니다.

  • Google, Bing 또는 Yandex와 같은 회사의 검색 엔진 봇(7%)
  • Facebook 모바일 앱, Android 프레임워크 봇 및 Twitter 봇과 같은 피드 페처(12%)
  • 상업용 크롤러 일반적으로 디지털 마케팅 도구용 데이터 추출에 사용(3%)
  • WordPress 핑백 봇(1%)과 같은 모니터링 봇

' 나쁜 ' 봇은 웹사이트 보안을 우회하기 위해 가짜 신원을 가정하는 ' 가장자 ' 일 가능성이 가장 높습니다 . 더 사악한 사람들은 공격한 사이트에 대해 분산 서비스 거부(DDoS 공격)를 실행할 수 있습니다. 이러한 유형의 봇은 2016년 총 인터넷 트래픽의 24%를 차지했으며 웹 스크레이퍼가 1.7%를 차지했습니다.

이 비율의 봇 트래픽은 마케터가 인지해야 하는 두 가지 효과가 있습니다. (그것은 그것보다 더 많은 트래픽을 받고 같은 사이트 외모 때문에) 하나는, 그것은 인위적으로 트래픽 볼륨을 팽창, 두, 그것은 아래로 전환율 측정을 제공합니다 (캠페인은보다 덜 효과적 볼 수 있도록).

이 트래픽을 제거하는 것은 정확한 벤치마킹에 필수적입니다. '깨끗한'데이터 없이는 '전략에 대한 정보를 의사 결정을 내릴 수 상당히 열심히이야.

2. 누락되거나 깨진 태그 확인

특히 자주 페이지를 추가하고 수정 발행인 또는 온라인 소매 업체와 같은 페이지의 높은 숫자와 사이트 - 사이트 업데이트 및 모바일 애플리케이션에 대한 변경, 동안 분석 태그 '무결성을 보장하는 것은 좋은 데이터를 수집하는 것이 필수적입니다.

오류가 감지하기 어려울 수 있지만, 그들은 '보고서의 정확성을 보장하기 위해 확인하는 것이 중요하고 올바른 다시.

누락, 중복 또는 잘못된 태그 캠페인 측정에 영향을 미칠 수 있습니다 - 특정 캠페인이 얼마나 효과에 대해 잘못된 결론에 이르는. 이벤트 관련 사이트는 종종 팀이 출시 전에 극심한 시간 압박을 받아 기술적인 실수로 이어질 수 있기 때문에 태그가 누락되는 경향이 있습니다.

이러한 TV 광고 또는 회의 등 - - 불행하게도,이 또한 이벤트와 메이크업에 비싼 실수가 될 수 종종 회사에 의해 상당한 투자를 나타냅니다.

3. 데이터 형식을 일관되게 유지

URL에서 숫자 문자열(카테고리 ID, SKU)을 사용하는 것은 길고 다루기 힘든 일반 텍스트 문자열을 이기는 것처럼 보일 수 있습니다. 그러나 이는 데이터를 캡처 할 때 실용적일 수 있지만 분석할 때 문제가 발생할 수 있습니다. 이해할 수 있는 텍스트 값은 데이터의 출처와 통합할 수 있는 문자열을 이해하는 데 큰 도움이 됩니다.

텍스트 값을 일관되게 유지하는 것도 중요합니다. 등이 모두 영어로 텍스트를 표현하기 위해 'EN'과 '영어'를 사용하는 등 - 일반적인 불일치는 같은 값은 종종 다른 방법으로 기록 된 언어 매개 변수입니다.

이 예에서 각각은 보고서의 다른 행에 나타나며 분석가가 수동으로 통합해야 합니다.

4. ' 단일 버전의 진실 ' 사용

많은 도구를 사용하면 데이터 수집 및 분석에 문제가 될 수 있습니다. 다른 시스템은 동일한 측정기준 및 측정항목에 대해 고유한 정의 및 계산을 사용할 수 있습니다. 예를 들어, 다른 분석 도구는 캠페인 실행 여부에 따라 트래픽 소스를 다르게 지정할 수 있습니다.

한 가지 일반적인 문제는 교차 기기 측정입니다. 출근길에 휴대전화로 사이트를 방문하고 출근할 때 데스크톱으로 다시 방문하는 사용자는 두 명의 다른 사용자로 계산될 수 있습니다.

로그인 한 기기와 플랫폼에서 동작을 측정 할 수있는 능력을 가지고 하나의 도구를 사용하면 효과적인 솔루션 - 당신에게 매뉴얼 화해와 deduplications의 번거 로움을 저장.

5. 실시간 분석을 사용하여 문제 식별

최고급 디지털 인텔리전스 제공업체는 사용자에게 실시간으로 방문자 행동에 대한 통찰력을 제공할 수 있습니다. 이를 통해 팀은 시간별 캠페인에 대한 즉각적인 피드백을 받고 404 오류 및 모바일 앱 충돌과 같은 발생하는 문제에 대응할 수 있습니다.

또 다른 사용 사례는 속보 이벤트 중에 미디어 사이트가 개별 기사의 성능을 실시간으로 추적하여 사용자가 가장 관심을 갖는 콘텐츠 종류에 대한 데이터 기반 통찰력을 제공할 수 있습니다.

[1] http://www.oxfordeconomics.com/think-leadership/leaders-2020

[2] https://home.kpmg.com/xx/en/home/campaigns/2016/06/ceo-outlook.html

[3] https://www.edq.com/globalassets/white-papers/building-a-business-case-for-data-quality-report.pdf

디지털 분석에서 데이터 품질 : 5 개 키 크기에 대한 자세한 인터넷 AT의 전체 보고서를 데이터 품질, 다운로드 보존에 대한 찾을 수 있습니다.

이 기사는 AT Internet 과 공동으로 작성되었습니다 . ClickZ의 협업 콘텐츠 가이드라인을 읽으 려면 여기 클릭하세요 .