본문 바로가기

타닥타닥7: 웹로그 분석 본문

공부

타닥타닥7: 웹로그 분석

Savedata 2022. 7. 9. 18:47

#정리

업무를 하다보니 웹로그 분석을 할 일이 생겼는데, 제대로 공부한 적이 없는 분야다. 그러다보니 용어도 생소하고 무엇을 해야지 의미있는 정보를 이끌어낼 수 있는지를 몰라서 어버버 거리다가 알아가고자 이렇게 정리를 한다. 고객들이 웹사이트에서 움직인 행동들을 정보로 남기고, 해당 정보를 분석하여 고객들의 행동을 데이터로써 분석한다는 점에서 굉장히 재미있는 데이터 분야로 느껴진다. 웹페이지에서 자유롭게 행동한 사람들의 무의식적인 움직임들을 정보로 이용하여 데이터로 만든다는게 흥미롭다. 이렇게 모은 데이터들을 어떤 지표들을 통해서 엮으면 의미가 있을지를 아래의 정보들에서 이미 개척해놨다. 기존의 분석 방식을 따라가며 현재의 데이터로 할 수 있는 것들을 최대한 만들어봐야겠다. 

아래의 정보들을 읽고 데이터 엔지니어로써 현재 다루고 있는 데이터에서 직접적으로 영향을 줄 수 있는 것이 무엇이 있을지 생각해봤다. 아래의 여러가지 지표들과 분석 방식이 있는데 그 중  웹로그를 통해 각 고객의 PV, Stickness, 이탈 등을 분석한다면 고객 분석을 위한 좋은 지표가 될 듯하다.

 

#웹로그 분석을 위한 블로그 정보 모음.

 

정보를 퍼 온 블로그: https://www.beusable.net/blog/?p=3781

 

PV와 UV는 무엇이 다르고 어떻게 분석해야 할까 | 뷰저블

PV와 UV 지표 데이터 분석법

www.beusable.net

https://blog.bizspring.co.kr/%ED%99%9C%EC%9A%A9-%EB%B0%A9%EB%B2%95-%EC%82%AC%EB%A1%80/%EC%9B%B9-%EB%A1%9C%EA%B7%B8%EB%B6%84%EC%84%9D-%EC%8B%9C-%EC%95%8C%EC%95%84%EC%95%BC-%ED%95%A0-%EA%B8%B0%EC%B4%88-%EC%9A%A9%EC%96%B4-%EC%95%8C%EC%95%84%EB%B3%B4%EA%B8%B0/

 

웹 로그분석 시 알아야 할 기초 용어 알아보기! | BizSpring BLOG

사이트를 운영중이시라면 내 사이트에 몇 명이 방문했고, 어느 경로를 통해 접속했는지 등을 파악하기 위해 대부분의 운영자들이 웹 로그분석 서비스를 이용하고 있습니다. 이처럼 웹 로그분

blog.bizspring.co.kr

http://www.openads.co.kr/content/contentDetail?contsId=1296 

 

활성 사용자(Active User) 개념잡기

활성 사용자(Active User) 개념잡기

www.openads.co.kr

https://slidesplayer.org/slide/11256226/

 

목 차 1. 웹로그파일의 이해 2. 웹로그데이터의 이해및 분석방법 3. 웹로그분석프로세스 및 활용

. 웹로그파일의 이해 –로그파일- 홈페이지 CUSTOMER 사이트 방문 서버에 기록 로그파일은 웹서버를 통해 이루어지는 모든작업들에 대한 기록이라고 표현할 수 있다. 우리가 웹서버에 접속을 하게

slidesplayer.org

 


웹로그 분석에서 쓰이는 용어정리

1. 페이지뷰 : 웹사이트 방문자가 웹페이지를 열어본 횟수를 의미합니다. 한 명의 방문자가 새로고침, 이전/다음 페이지 이동한 페이지뷰는 모두 카운팅 합니다.

 

2. 세션(Session) : 홈페이지 방문자를 구분하기 위한 고유 값으로, 웹사이트에 접속한 후 웹사이트를 떠난 시점까지를 말합니다.
방문자가 웹 브라우저를 닫은 시점이나 또는 웹사이트에서 아무런 액션 없이 30분이 경과되면 세션종료가 됩니다.
(세션 타임아웃의 시간은 업계 평균 30분이지만, 해당 기준은 업체마다 다를 수 있습니다.)

 

3. 방문수 : 세션을 기준으로 30분 이내의 중복 방문을 제거한 방문수입니다.

 

4. 쿠키 : 사용자가 어떠한 웹사이트를 방문할 경우 그 사이트가 사용하고 있는 서버를 통해 인터넷 사용자의 컴퓨터에 설치되는 작은 기록 정보 파일을 말합니다. 컴퓨터에 기록된 이 쿠키정보로 로그분석 데이터(신규방문수, 재방문수, 회원특성등)를 분석하게 됩니다.

 

5. 반송수 : 방문자가 웹사이트를 방문한 후에 다른 페이지로 이동하지 않고 바로 이탈하는 경우입니다.

 

6. 레퍼러(유입경로) : 방문자가 웹사이트로 유입될 때 클릭한 외부 페이지 주소를 말합니다.

 

7. 내부유입 : 사이트 방문이 내부사이트에서 발생된 경우입니다.
보통의 경우 사이트 방문 후 일정 시간(30분) 동안 아무런 클릭이나 이동 없어 세션이 종료된 상태에서 사이트 내부 페이지(링크)를 클릭하는 경우 또는 분석스크립트가 없는 페이지로 방문 후 스크립트가 있는 페이지로 이동한 경우 내부유입으로 수집하게 됩니다.

 

8. 직접유입(북마크) : 사이트 방문 시 이전 페이지 정보가 없는 경우 입니다.
도메인 주소를 직접 입력하고 방문하였거나 즐겨찾기, 바탕화면 바로가기, SNS문자의 링크 방문 등으로 유입경로가 남지 않는 경우 입니다.

 

9. 전환 :웹사이트를 방문하여 운영자가 희망하는 행동 (상담신청, 회원가입, 주문등)을 취하는것을 말하며, 직접/간접 전환으로 구분하여 확인할 수 있습니다.

  • 직접전환 : 사용자가 사이트 방문 후 동일한 세션 안에( 30분 이내) 일으킨 전환수 입니다.  
  • 간접전환 : 사용자가 사이트 방문 후 동일한 사용자에게서 14일 이내에 일으킨  전환수 입니다.

10. 분석 스크립트 : 웹 로그분석을 하기 위해 사이트내  반드시 삽입해야 하는 분석소스입니다. 스크립트 삽입 작업이 진행이 되어야만 방문자가 사이트에 도착한 시점부터 일탈하는 시점까지의 모든 이동경로를 추적하고 사이트내 활동된 데이터를 수집할 수 습니다.

 

11. 자연검색 : 검색엔진에서의 검색을 통해 랜딩 URL에 광고 추적코드 없이 유입된 검색어 입니다.

 

12. 유료검색 : 검색을 통해 랜딩 URL에 광고 추적코드가 있는 상태로 유입된 검색어 입니다.

 

13. 랜딩페이지 : 외부유입(광고)을 통해 웹사이트 방문 시 도착하여 처음 보는 페이지를 말합니다.인입 페이지라고도 합니다.

 

14. 리다이렉션/리디렉션(redirection) :URL 포워딩이라고도 하며, 넘겨받은 URL을 웹 브라우저가 열려고 하면 다른 URL로 강제 이동되는 것을 말합니다. 리다이렉션(redirection) 현상이 일어날 경우 방문자의 유입경로 정보를 유실하게 되며 북마크 또는 내부유입으로 수집됩니다.


PV와 UV는 무엇이 다를까요?

 

페이지 뷰(Page Views)

페이지 뷰(Page Views)는 사이트 중 ‘한 페이지’가 사용자의 요청으로 사용자 화면에 표시되는 ‘요청 수’를 세는 단위입니다.

쉽게 말해 페이지가 표시된 횟수라고 볼 수 있습니다. WWW(월드 와이드 웹)에서 하나의 페이지는, HTML과 같은 구조로 되어 있는 다른 페이지들로 연결되는 하이퍼링크로 가지는데요, 이들 페이지를 사용자가 클릭하여 요청하면 사용자의 컴퓨터로 그 내용이 전송되고 1PV로 찍힙니다.

 

순 방문자 수(Unique Visitor)

순 방문자 수라고 불리는 UV(Unique Visitor)는 한 명의 방문자가 여러 번 페이지를 요청하더라도 순수한 통계를 위해 중복되는 값을 제거하고 1번의 방문 기록으로만 잡아 나타내는 것을 의미합니다. 보통 방문자가 자신의 컴퓨터에 기록되는 쿠키값을 남기는 것에 동의함으로써 혹은 IP 기록에 의해 측정하게 됩니다.

그렇기 때문에 사실 ‘순 방문자 수=사람 수’라고 말할 수는 없습니다. 쿠키나 IP주소가 달라지는 경우에는 이들 사용자를 신규 방문자로 잡을 것이기 때문입니다. 컴퓨터를 사용하다가 모바일 폰으로 다시 접속하면 쿠키가 달라져 2UV로 측정될 것입니다.

그림으로 살펴볼까요? 8명의 사용자가 사이트에 방문하였다면 이 시점에 PV는 6PV로 측정됩니다. 이 중에서 3명이 ‘Why 페이지’를 방문하였고 3명은 ‘Features 페이지’, 4명은 ‘Pricing 페이지’, 1명은 ‘FAQ 페이지’를 방문하였습니다. 그럼 아래와 같이 사이트에 총 8UV가 방문하였지만 PV는 19PV가 찍히게 됩니다.

 

페이지의 장점을 측정하기 위한 지표 PV

PV는 한 페이지의 열람 수를 의미하기 때문에 PV수가 증가한다면, 구글이나 네이버, 다음 같은 검색엔진의 평가 또한 높아져 검색 결과 상단에 노출되고 더욱 더 인지도가 올라가게 됩니다. PV는 사이트의 장점을 시각화하는 요소 중 하나이기 때문에 특정 서비스의 경우에는 대표적인 KPI로도 활용할 수 있습니다.

사이트의 PV는 메뉴나 링크를 통해 다른 페이지로 이동하거나 ‘콘텐츠 더보기’ 등의 특정 UI 장치들을 통해 늘릴 수 있으며, 같은 페이지를 반복적으로 새로고침하더라도 PV 수는 증가하게 됩니다.

 

방문한 고객의 특성을 알고 싶을 때 봐야 하는 UV

UV는 웹 사이트에 방문한 고객을 IP 주소나 쿠키 등으로 조합하여 식별하며 특정 기간 동안 웹 사이트를 방문할 때 ‘재방문’한 고객인지, ‘신규 방문’한 고객인지를 걸러냅니다.

뷰저블에서는 아래 UV 그래프에서 기본적으로 신규/재방문 고객의 비중을 함께 시각화하여 보여주고 있는데요, 우측 상단의 상세 지표들을 클릭하면 보고자 하는 신규/재방문 UV만을 걸러서도 볼 수 있습니다.

신규 방문자도 중요하지만, 특히 재방문자는 자발적으로 방문한 경우, 비용을 들이지 않더라도 PV수 증가에 큰 도움을 주기 때문에 점진적으로 늘려나가야 하는 지표입니다.

 



사이트 내 UV와 PV는 차가 크면 클수록 좋아요!

기본적으로 웹 사이트 전체를 아울러 UV와 PV의 차가 클수록, UV 당 평균 PV가 높을수록 사용자가 ‘다른 페이지들도 궁금하니까 더 살펴보아야겠는걸?’라고 생각하기 때문에, 좋은 콘텐츠가 많은 사이트라고 평가내릴 수 있습니다.

 

 

반면 사이트 전체 상, 이 두 지표의 차가 거의 없거나 적다면 콘텐츠의 질이 나빠 다른 기사를 더 살펴보려하지 않거나, 메뉴나 다른 페이지로 이동할 UI상의 접근성이 어렵다고 해석할 수 있습니다.

나아가, 보편적으로 순 방문자 수(UV)와 PV가 상대적으로 크게 차이가 날 수록 많은 검색엔진들에서 ‘좋은 사이트’라고 높이 평가합니다.

 

 

위 두개의 이미지는 중앙일보와 jtbc뉴스 사이트에서 특정 기사를 스크롤한 Below the Fold 하단 영역입니다.

두 기사 모두 콘텐츠가 끝나는 지점에서 계속해서 다른 페이지로 이동할 수 있도록 추천 콘텐츠를 제안하고 있는데요, 사이트 내 PV수를 늘릴 수 있는 좋은 전략이라고 말할 수 있습니다.

 

 

뷰저블에서도 고객의 탐색 흐름이 끊기지 않도록 콘텐츠 최하단에 다음 콘텐츠로 이동할 수 있는 내비게이션을 마련하거나, GNB가 스크롤하여도 계속 노출되도록 스티키 형태로 제공하고 있습니다.

 

 

 

PV와 UV 지표, 어떻게 활용할 수 있나요?

 

먼저 PV 지표를 통해 ‘사용자 행동’을 분석할 수 있습니다.

PV는 ‘고객의 관심’으로도 해석할 수 있는데요, 인기가 집중되는 페이지가 무엇인지를 파악하여 그것이 상품 상세 페이지인지, 이벤트 페이지인지를 알 수 있고 콘텐츠 전략으로도 활용할 수 있습니다.

 

  • e커머스에서, PV수가 높은 상품 상세 페이지를 ‘인기 상품, 많은 사람들이 보는 상품’으로 제안하여 메인이나 개인화된 페이지에 노출하면 고객의 선택지를 좁혀줄 수 있습니다.
  • 미디어 사이트에서, PV수가 높은 기사나 콘텐츠 상세 페이지를 ‘인기 기사’로 제안하여 더 높은 PV수를 달성하도록 유도하고 고객이 빠르게 핵심 화제 콘텐츠를 확인할 수 있도록 도와줍니다.

 

PV는 구글 애널리틱스와 함께 분석하면 기간 내 디바이스나 방문 지역과 같은 상세 조건으로 세그먼트를 걸 수 있는데요, [행동-사이트 콘텐츠-모든 페이지] 메뉴에서 확인할 수 있습니다.

 

 

  • PV수가 높은 페이지를 ‘어떤 검색 키워드’로 방문하는지를 분석하면 고객의 니즈를 파악할 수 있습니다.
  • PV수가 높거나 낮은 페이지의 접속 디바이스를 확인하면, 구체적인 개선점 분석을 위한 디바이스 우선순위를 결정할 수 있습니다.
  • PV수가 높은 페이지의 방문 지역이나 국가 통계를 확인하여, 다른 페이지에도 해당 고객의 방문 특성에 맞는 콘텐츠를 녹여낼 수 있습니다.

 

UV는 ‘기간 내 방문한 사용자 수’를 알 수 있어 애널리틱스의 기간 설정을 2020년 1월 1일부터 2020년 12월 31일까지로 한다면, 아무리 수십 수백 번 접속하더라도 1UV로 찍힙니다.

우리 서비스를 이용하는 진짜 고객의 숫자를 파악할 수 있다고 해석할 수 있죠. 이 기간 내 UV를 월 단위로 계산한 것을 MAU(Monthly Active User), 주 단위로는 WAU(Weekly Active User), 일 단위로 계산한 것을 DAU(Daily Active User)라 부릅니다.

뷰저블의 애널리틱스에서는 페이지 UV 별 기기와 국가별 방문자 통계를 제공하고 있어 사용자의 특성을 이해하는 데 도움됩니다.

 

 

뷰저블 메인 페이지의 국가별 방문자 통계 정보를 살펴보니 한국 외에도 미국과 일본 고객들이 꽤 높은 비중으로 방문하는 것을 확인할 수 있었습니다. 이에 우리는 점진적으로 일본어와 영어도 함께 제공하는 서비스로 거듭났습니다.

현재 아래 메뉴에서 보시는 것처럼, 두 언어로 서비스를 이용할 수 있도록 제공할뿐만 아니라 사이트 또한 두 언어로 구분하여 제공합니다.

 



UV보다 PV수를 늘리는 것이 우리의 일차적인 목표여야 합니다.

 

PV와 UV 모두 사이트에 중요한 지표지만, 일차적으로는 PV수 향상에 집중해야 합니다.

UV를 늘린다는 것은 외부에서 신규 방문자를 끌어와 늘린다는 의미를 갖지만, PV를 늘린다는 것은 이미 방문한 고객이 더 심도 깊게 사이트를 이리저리 탐색할 수 있도록 만드는 것이기 때문에 마케팅 비용을 들이지 않더라도 UX 개선을 통해 간단히 늘릴 수 있기 때문입니다.

주의해야할 점은 PV수를 높이더라도 해당 페이지의 이탈률(Bounce Rate)가 높지 않도록 꾸준히 관리해주어야 합니다. 방문을 많이 하더라도 무언가 마음에 들지 않아 튕겨져 나가버리는 것(Bounce)을 의미하기 때문입니다.

 

 

 

오늘은 PV와 UV 지표 데이터 분석법을 소개하였습니다. 혹시 그동안 단순히 ‘우리 페이지에는 하루 100PV가 발생하는구나’하고 단순히 확인만하고 넘기진 않으셨나요? 뷰저블과 함께 어떻게 우리 사이트의 UV 대비 PV 수를 늘릴 수 있을지, PV수를 ‘향상 추세’로 높일 수 있을지 등을 고민해보세요!

 


활성 사용자 (Active User) 개념잡기

 

웹분석이 모바일 영역으로 확장하면서 기존에는 사용하지 않았던 생소한 용어들이 등장 했습니다. 활성 사용자(Active User)라는 용어도 그 중 하나 입니다. 웹분석에서는 방문수(Visit), 방문자수(Visitor) 등의 용어로 사이트의 방문횟수를 측정하지만, 앱 분석에서는 DAU(Daily Active User), WAU(Weekly Active User), MAU(Monthly Active User)라는 지표로 앱 사용현황을 파악합니다.

 

 

Active User는 ‘기간’동안 앱을 사용한 사용자수

 

방문수(Visit)는 다른 말로 세션(Session)이라고도 하는데요, ‘세션’은 쉽게 말해서 ‘총 방문한 횟수’라고 이해하면 되겠습니다. 세션은 방문할 때마다 또는 앱을 실행할 때마다 증가하는 수치로 보면 되겠습니다. 

 

 

 

 

하지만 기업 입장에서 궁금한 것은 ‘앱을 사용하는 실제 사용자의 수’입니다. 분석 툴은 이를 측정하기 위해 각각의 디바이스마다 UUID(Unique User ID)를 부여하여 조건 기간마다 단 1회만 측정하여 사용자 수를 판단합니다. 하루 동안의 사용자 수를 판단하는 ‘DAU’를 측정하는 방법은 아래와 같습니다. 

 

 

 

 

세션수 기준으로는 3번 방문을 했기 때문에 3회가 측정 되겠지만, DAU는 하루 동안의 중복을 제거한 최초 1회 방문만을 측정하기 때문에 “홍길동이란 한 명의 사용자가 오늘 들어왔다”라는 의미로 1건이 증가하는 것입니다.

한 주간 사용자 수를 판단하는 ‘WAU’는 일요일부터 토요일까지 동일 사용자가 여러 번 사용하더라도 첫 실행만을 파악하여 주간 사용자를 파악합니다.

 

 

 

 

 

‘MAU’는 한 달 동안 동일 사용자가 여러 번 사용하더라도 첫 실행만을 파악하여 월간 사용자를 파악합니다.

 

 

 

 

  

 

앱 의존성(Stickiness) 확인 방법

 

유저가 앱이 제공하는 기능이나 서비스에 얼마만큼 의존하고 있는지를 수치로 표현할 수 있는데 이 수치를 ‘앱 의존성’이라고 부릅니다. 수치가 크게 나올수록 앱 의존성이 높고, 그만큼 잘 되고 있는 앱이라고 할 수 있겠지요. 이 의존성은 아래 수식을 사용해 산출하게 됩니다.

DAU/MAU = 의존성(Stickiness)

어떻게 이 수치가 ‘앱 의존성’을 대표하는 것인지 이해를 돕기 위해 한 가지 예를 들어 보겠습니다.

 

앱을 막 론칭했고 최근 한달간 전체 유저가 1천명에 도달했다고 가정합니다. 그런데 앱이 너무 좋아서 모든 유저가 하루에 한번은 앱을 꼭 실행하고 있습니다. 다시 말해 전체 유저가 매일매일 빼놓지 않고 앱을 사용하고 있는 것이죠. 의존성이 최대인 상황입니다.

 

이 상황을 위의 수식에 대입해 보겠습니다. 한달간 전체 유저가 1천명이니 MAU는 1,000이고, 하루에 앱을 실행하는 사람이 1천명이니 DAU는 1,000입니다. 위 수식에 대입하면 1,000/1,000 = 1, 앱 의존성이 1이 나오네요. 퍼센트로는 100%, 수치 상으로도 의존성이 최대인 상황이죠.

 

그런데 어느 날 앱이 업데이트 되었는데 불편함을 느끼는 유저들이 늘어났습니다. 이 날은 전체 유저 중에 절반이 앱을 사용하지 않았습니다. 이렇게 되면 DAU는 500 이지요. 앱 의존성도 500/1,000 = 0.5, 절반으로 줄었습니다.

 

위와 같이 매일매일의 DAU를 MAU와 연산함으로써 하루하루 달라져가는 앱 의존성을 관찰할 수 있습니다. 유저들이 우리 앱을 잘 사용해 나가고 있는지에 대해서 빠르고 직관적으로 측정하는데 활용하면 좋은 수치입니다.


 

 

 

 

Comments