플로랑 뷔송, 『Behavioral Data Analysis with R and Python』, 시진, 한빛미디어-OREILLY(2023), p49-69.
Learned
인간 행동의 기본 모델
- 행동 과학적 사고방식: 자신이 무엇을 하려는지를 보다 정확하게 생각하도록 하는 장점이 있음
개인 특성(Personal Characteristics)
- 연령, 성별, 가족관계와 같은 인구통계 변수(demographic variable)
- 인구통계 변수를 기여 요소(contributing factor)로 작용하면, 해당 변수가 기여하는 심리적이고 실용적인 개인 특성을 유추할 수 있음
- ‘행동은 사람과 환경의 함수다’란 말이 있음
- 사회적 요소가 인구통계변수보다 중요도가 높은 경우가 존재
- 사회현상과 개인 특성의 상호작용은 ‘조절효과’와 ‘매개효과’를 기반으로 파악 가능
인지와 감정(Cognition and Emotion)
- CSAT, CX
- 고객 만족도(CSAT; Customer SATisfaction) → 설문조사
- 고객 경험(CX; Customer eXperience) → 행동 데이터 관찰
- 고객이 불편했다는 의견을 표면적으로 받아들이기보다 그 안에 숨겨진 요구 사항을 파악해야 함
의도(Intention)
- 인지와 감정에 속한다고 볼 수 있으나, 행동 데이터 분석에서 중요한 역할을 하기에 별도로 분리
- 하고 싶다고 생각한 행동이 실제 행동으로 이어지지 않는 경우가 있음
- 의도-행동 차이(intention-action gap)
- 고객이 기대했던 행동을 하지 않았을 때, 이유가 ‘고객이 행동을 하고 싶어 하지 않아서’인지 ‘의도와 행동 사이에 차이가 있어서’인지 잘 파악해야 함
- 의도 모델링(intent modeling): 관찰된 행동으로부터 의도를 추측하는 방법
- pain point: 의도를 달성하는 것을 방해하는 장애물
행동(action)
- 말로 표현하지 않아도 직접 관찰할 수 있는 움직임
- 행동의 단계를 세분화해서 정의 → 행동을 방해하는 요소를 파악하고 해결할 수 있음
- e.g. 고객 여정(customer journey) 정의
행동 변수 세분화
- 관찰 가능성: 행동은 관찰할 수 있어야 함
- timestamp가 없는 행동은 구체적이지 않고 세분화할 수 없음 (e.g. 중단하겠다고 마음을 먹은 생각)
- 독립성: 집계 변수는 좋은 독립 변수에서 얻을 수 있음 (e.g. 탈퇴율 ⇒ 탈퇴 확률)
- 변수가 집계 상태에서만 의미가 있고, 개별 수준에서 의미 있는 해석을 할 수 없으면 좋은 변수가 아님
- 원자성: 의도가 같은 서로 다른 행동을 집계할 때, 도출한 결론이 각 행동에 동일하게 적용 가능한지 확인
- 변수의 배경이 되는 구체적인 행동을 알고 있어야 함
맥락 이해
- 개인 변수도 중요하지만 맥락 변수(contextual variable)를 충분히 고려해야 함
- 인터뷰나 설문조사와 같은 정성 연구(qualitative research)가 가장 좋은 방법
- timestamp를 유추할 수 있는 단서
- 빈도(frequency): 사건 데이터는 빈도, 단위 시간당 사건/행동 수를 살펴보는 것이 좋음
- 캐치업 현상(catch-up phenomena): 짧은 지속시간 뒤에 긴 지속 시간이 오는 현상
- 사건이나 행동의 지속시간을 측정하여 발견 가능
- 캐치업 현상(catch-up phenomena): 짧은 지속시간 뒤에 긴 지속 시간이 오는 현상
- 지속시간(duration): 감쇠 효과(decaying effect)를 측정하는 방법
- CSAT는 경험이 발생한 시점에 따라 가중치를 두는 것이 좋음
- 근접성: 매우 가까운 시기에 or 연속된 순서로 하는 행동은 우연이 아닐 간능성이 높음
- 사회적인 일상: 주 단위의 공통된 흐름이 있음
- 행동의 시간을 다룰 때는 요일-시간을 기준으로 관리하기보다 ‘주 단위의 시간’ 변수를 관리하는 것을 추천
- 비즈니스 문제에 따라 ‘평일 저녁’과 같은 변수를 관리해도 좋음
- 대안 행동(alternative behavior)
- 분기점을 찾는 것이 좋음
- 어떤 행동 다음 어떤 행동이 자주 발생하는지와 같은 질문으로 ‘행복 경로’를 찾거나 길을 잃고 헤매는 고객을 파악할 수 있음
- 빈도(frequency): 사건 데이터는 빈도, 단위 시간당 사건/행동 수를 살펴보는 것이 좋음
반응형
'Causal inference' 카테고리의 다른 글
Chapter 1. 인과-행동 프레임워크 (0) | 2023.11.24 |
---|---|
[KSSCI 2021] 인과추론의 데이터 과학 - Session 5 (0) | 2023.10.16 |
[KSSCI 2021] 인과추론의 데이터 과학 - Session 18 (0) | 2023.10.15 |
Part 5. Advanced Topics for Analyzing Experiments (0) | 2023.10.12 |
[KSSCI 2021] 인과추론의 데이터 과학 - Session 17 (0) | 2023.10.12 |
댓글