AI 이노베이션 스퀘어 고급과정 - 언어지능 수업내용 (20200901-20200928 160시간)
데이터 수집 및 전처리,정규표현식
- 1일차: [데이터 수집]웹 크롤링 및 웹 스크래핑
- Web Scraping 실습 코드 1:
find()
,find_all()
을 이용한 html 페이지 소스 사용하기 - Web Scraping 실습 코드 2:
select()
를 이용한 css selector 사용하기 / 구글 뉴스 클리핑 예제 - Web Scraping 과제: 네이버 / 다음 뉴스의 키워드 기반 뉴스 클리핑
- 구글 뉴스 클리핑 예제를 활용하여 스크랩할 기사의 개수 n와 키워드를 입력하는 자동 모듈 생성
- 스크래핑 코드 이해/웹페이지 html 코드를 해석하는 방법
- Web Scraping 실습 코드 1:
- 2일차: [데이터 수집] 동적 웹 페이지
- Web Scraping 실습 코드 3: 동적 웹 페이지 모듈 Selenium 실습 - 다나와의 관심상품 크롤링
NLTK, KoNLPy,토크나이징,N-gram
워드임베딩, 텍스트 분류, 순환 신경망
프로젝트 예시 및 분석(수행)