『SQL로 시작하는 데이터 분석』 Chapter 6. 이상 탐지
캐시 타니무라, 『SQL로 시작하는 데이터 분석』, 박상근, 한빛미디어-OREILLY(2022), p299-347. 일반적인 SQL 이상탐지 workflowSQL로 초기 분석을 수행해 정상 범위의 min, max, mean을 결정별도의 스트리밍 서비스나 실시간 데이터 스토어를 활용해 실시간 모니터링 수행 SQL 코드는 규칙 기반으로 동작하기 때문에,급변하는 이상 패턴의 유형에 맞춰 자동으로 분석하기 위해서는 ML or Python 활용 percent_rank: 각 행 값의 백분위 수 반환percent_rank() over(partition by .. order by..)SELECT place,mag,percentile,count(*)FROM( SELECT place ,mag ,perce..
2024. 11. 21.
『SQL로 시작하는 데이터 분석』 Chapter 1. SQL을 활용한 분석
캐시 타니무라, 『SQL로 시작하는 데이터 분석』, 박상근, 한빛미디어-OREILLY(2022), p19-39. 분석: 호기심을 갖고 '왜' 그 숫자가 나왔는지 질문을 던지는 일다양한 패턴과 이례적인 현상들, 비즈니스가 어떻게 움직이고 인간이 어떻게 행동하는지 이해하기 위한 단서를 찾고 해석SQL: 데이터베이스에 접근하고 데이터를 가져와서 처리하는 데 사용데이터베이스: 하나 이상의 schema가 있음Schema의 오브젝트: Table, view, function테이블: field, indexDQL(Data Query Language): DB에서 원하는 데이터를 가져오기 위해 사용SELECT, JOINDDL(Data Definition Language): DB에서 테이블, 뷰, 사용자 및 기타 오브젝트를 ..
2024. 11. 2.