반응형
캐시 타니무라, 『SQL로 시작하는 데이터 분석』, 박상근, 한빛미디어-OREILLY(2022), p41-93.
- 정성 데이터: 주로 텍스트 형태로 적힌 의견, 느낌 서술과 같이 명확한 수치로 측정할 수 없는 데이터
- 퍼스트 파티 데이터: 기관에서 직접 수집한 데이터
- 세컨드 파티 데이터: 특정 기관에 서비스를 제공하는 업체에서 수집하는 데이터
- 서드 파티 데이터: 업체에 금액을 지불하고 구매하는 데이터 or 공개 데이터 (e.g. 정부에서 무료로 공개한 데이터)
- 데이터 베이스를 죽이지 않기 위해, LIMIT과 샘플링을 사용하여 쿼리로 반환받을 레코드 수를 제한하는 것이 좋음
- N분위수: ntile (window function) ➡️ 구간을 나눌 때 사용
- 백분위수 값: percent_rank (window function)
반응형
'Language > SQL' 카테고리의 다른 글
『SQL로 시작하는 데이터 분석』 Chapter 6. 이상 탐지 (0) | 2024.11.21 |
---|---|
『SQL로 시작하는 데이터 분석』 Chapter 5. 텍스트 분석 (1) | 2024.11.14 |
『SQL로 시작하는 데이터 분석』 Chapter 4. 코호트 분석 (0) | 2024.11.11 |
『SQL로 시작하는 데이터 분석』 Chapter 3. 시계열 분석 (1) | 2024.11.08 |
『SQL로 시작하는 데이터 분석』 Chapter 1. SQL을 활용한 분석 (0) | 2024.11.02 |
댓글