본문 바로가기

Causal inference25

Chapter 2. 행동 데이터를 이해하는 방법 플로랑 뷔송, 『Behavioral Data Analysis with R and Python』, 시진, 한빛미디어-OREILLY(2023), p49-69. Learned 인간 행동의 기본 모델 행동 과학적 사고방식: 자신이 무엇을 하려는지를 보다 정확하게 생각하도록 하는 장점이 있음 개인 특성(Personal Characteristics) 연령, 성별, 가족관계와 같은 인구통계 변수(demographic variable) 인구통계 변수를 기여 요소(contributing factor)로 작용하면, 해당 변수가 기여하는 심리적이고 실용적인 개인 특성을 유추할 수 있음 ‘행동은 사람과 환경의 함수다’란 말이 있음 사회적 요소가 인구통계변수보다 중요도가 높은 경우가 존재 사회현상과 개인 특성의 상호작용은 ‘조.. 2023. 11. 25.
Chapter 1. 인과-행동 프레임워크 플로랑 뷔송, 『Behavioral Data Analysis with R and Python』, 시진, 한빛미디어-OREILLY(2023), p30-48. Learned 분석의 유형 기술 분석(descriptive analytics): 데이터에 대한 설명 제공 비즈니스 보고 (평균, 간단한 지표 등) e.g. 작년 이익은 얼마일까? 예측(prediction): 측정되지 않은 것을 알려줌 e.g. 다음 달에 구독을 취소하는 고객을 몇 명일까? 인과관계(causal analytics): 데이터의 인과관계를 제공 주로 RCT(Randomized Controlled Trial)를 활용 → A/B Test 교란(confounding) 현상을 파악하고 해결할 수 있는 장점이 있음 e.g. 광고를 하지 않으면, 다음.. 2023. 11. 24.
[KSSCI 2021] 인과추론의 데이터 과학 - Session 5 인과추론의 데이터과학. (2021, Sep 9). [Session 5-1] 준실험 연구사례 1: 모바일 커머스가 쇼핑 패턴에 미치는 영향 [Video]. YouTube. 인과추론의 데이터과학. (2021, Sep 12). [Session 5-2] 준실험 연구사례 2: 스마트 스피커가 컨텐츠 소비에 미치는 영향 [Video]. YouTube. Session 5-1 Intro Mobile searching 모바일에서 컴퓨터보다 구글 검색이 활발했음 Retail 관점: 매장에서도 80% 유저가 모바일로 검색을 했음 (OuterBox 2021) E-commerce 환경에서 제품별로 Sales distribution이 다를 수 있음 Sales distribution 정의: 제품이나 서비스의 판매량이나 매출액이 어.. 2023. 10. 16.
[KSSCI 2021] 인과추론의 데이터 과학 - Session 18 인과추론의 데이터과학. (2021, Nov 29). [Session 18-1] 가상의 통제집단 (Synthetic Control) [Video]. YouTube. 인과추론의 데이터과학. (2021, Nov 29). [Session 18-2] 가상의 통제집단 분석 사례 [Video]. YouTube. 인과추론의 데이터과학. (2021, Dec 6). [Session 18-3] 데이터 기반의 인과관계 발견 (Causal Discovery) [Video]. YouTube. Session 18-1 synthetic control: 여러 요인들을 결합해서 만든 합성의 control group counterfactual을 모방하기 위해 만든 것 Causal effect ITE(individual treatment .. 2023. 10. 15.
Part 5. Advanced Topics for Analyzing Experiments 론 코하비, 다이앤 탕, 야 쉬, 『A/B 테스트 신뢰할 수 있는 온라인 종합 대조 실험』, 이기홍, 김기영, 에이콘출판사-MANNING(2022), p260-341. 17. The Statistics behind Online Controlled Experiments Two-Sample t-Test \(H_0: mean(Y^t) = mean(Y^c)\) \(H_A: mean(Y^t) \ne mean(Y^c)\) t-statistic, \(T\) \(T = \displaystyle{\Delta\over \sqrt{var(\Delta)}}\) \(\Delta\): unbiased estimator difference between the Treatment average and the Control avera.. 2023. 10. 12.
[KSSCI 2021] 인과추론의 데이터 과학 - Session 17 인과추론의 데이터과학. (2021, Nov 25). [Session 17] 인과추론을 위한 데이터셋 구성 (코로나19 사례) [Video]. YouTube. Session 17 Kaggle DS4C datasets 2015 메르스 이후, 감염병 환자들의 정보를 신속히 공개하고 있음 Problems Decentralized publication: 형식이 변경될 때마다, 정기적으로 코드 업데이트 or 수동 입력 Absence of a unified formatting: 시도/시군구 합쳐있던지, 이미지로 양식을 올리던지 등등.. Data embedded in natural language: 문자열 구분이 어려웠음, 위치 정보 추출 및 정량화도 어려웠음 Scheme 잘 알려진 Johs hopkins 데이터 대비.. 2023. 10. 12.
[KSSCI 2021] 인과추론의 데이터 과학 - Session 12 인과추론의 데이터과학. (2021, Oct 21). [Session 12] 머신러닝을 통한 비정형 데이터 분석 (마케팅 연구사례) [Video]. YouTube. Session 12 기존 review 영향 연구의 한계점 customers read rich review content, instead of only considering aggregated volume, rating, and variance metrics → 모델에 어떻게 address해야할까 review content are significantly different across product categories ex. Watch: “Accurate” and “Waterproof” → 카테고리별 다른 단어를 어떻게 반영할까 Large-Sca.. 2023. 10. 11.
[KSSCI 2021] 인과추론의 데이터 과학 - Session 16 인과추론의 데이터과학. (2021, Nov 2). [Session 16-1] 구조적 인과모형 (Structural Causal Model) [Video]. YouTube. 인과추론의 데이터과학. (2021, Nov 2). [Session 16-2] 구조적 인과모형에서의 인과추론 [Video]. YouTube. Session 16-1 Key points Structural Causal Models (SCMs)은 causality를 연구하기 위한 포괄적인 framwork Unified framework: SCM subsumes PO-based causality (Potential outcome을 표현 가능) Axiomatization: SCM is the sound and complete language o.. 2023. 10. 11.
Part 4. Advanced Topics for Building anExperimentation Platform 론 코하비, 다이앤 탕, 야 쉬, 『A/B 테스트 신뢰할 수 있는 온라인 종합 대조 실험』, 이기홍, 김기영, 에이콘출판사-MANNING(2022), p219-257. Client-Side Experiments Differences between Server and Client Side Release Process server: continuous integration and deployment (CI/CD) client: 앱 소유자, 앱 스토어, 사용자가 관련됨 Data Communication Internet connectivity: 서버 측 데이터 변경사항이 클라이언트로 전송되지 않거나 지연될 수 있음 Cellular data bandwidth Battery: 데이터 통신이 많을수록 배터리 소모 증.. 2023. 10. 5.
Part 3. Complementary and AlternativeTechniques to Controlled Experiments 론 코하비, 다이앤 탕, 야 쉬, 『A/B 테스트 신뢰할 수 있는 온라인 종합 대조 실험』, 이기홍, 김기영, 에이콘출판사-MANNING(2022), p190-217. Complementary Techniques The Space of Complementary Techniques ideas funnel (Ideas for experiments) 구현이 쉬운 경우: 대조실험을 통해 직접 테스트하는 것을 권장 구현 비용이 많이 드는 경우: Complementary Techniques을 통해 구현 비용을 절감 Validated metrics proxy metric 활용 → 현실에서 측정이 어려운 ‘사용자 만족’과 같은 요소를 가늠할 수 있음 Evidence supporting or refuting hypoth.. 2023. 10. 5.
반응형