Chapter 1. 텍스트 데이터에서 찾는 통찰
젠스 알브레히트, 시다르트 라마찬드란, 크리스티안 윙클러, 『파이썬 라이브러리를 활용한 텍스트 분석 Blueprints for Text Analytics Using Python』, 심상진, 한빛미디어-OREILLY(2022), p29-68. EDA 탐색적 데이터 분석 (Exploratory Data Analysis) 수집 수준에서 데이터를 체계적으로 조사하는 과정 (요약, 통계, 결측치 확인 등) NLP에서는 말뭉치(corpus)의 통계적 탐색을 진행 메타 데이터: 범주, 작성자, 날짜/시간 콘텐츠: 단어, 구, 개체 -> 상대적 빈도 활용 단어: 문장 안에서 띄어쓰기가 되어 있는 각각의 단위 ex. 나는 / 도서관에서 / 친구를 / 만났다 구: 2개 이상의 단어가 모여 하나의 단어처럼 쓰이는 덩어리, ..
2023. 3. 26.