KT Aivle School 빅프로젝트
- 2023.05.22 ~ 2023.07.03
- 7명
인공지능 기반 사용자 맞춤 건강기능식품 관리 및 추천 서비스
로그인 | 제품 등록 | 영양소 및 제품 확인 | 제품 추천 | 정기배송&쇼핑 | 복용알림 | 커뮤니티 |
---|---|---|---|---|---|---|
결과 영상 |
---|

- Clova AI 팀의 CRAFT와 deep-text-recognition-benchmark 논문을 참조하여 OCR모델
- OCR 기능의 성능을 개선하기 위해 코사인 유사도 검증을 사용하여 데이터베이스와 직접적으로 유사도를 확인하여 정확도를 높임
- 한글 데이터 "AI Hub 다양한 형태의 한글 문자 OCR"
- 영문 데이터 "Text OCR"
한글 데이터 | 영문 데이터 |
---|---|
https://aihub.or.kr/aihubdata/data/view.do?currMenu=115&topMenu=100&aihubDataSe=realm&dataSetSn=91 | https://www.kaggle.com/datasets/robikscube/textocr-text-extraction-from-images-dataset |
학습 결과 |
---|
- Pycaret을 활용하여 데이터에 적합한 모델 XGBoost 사용
- Optuna를 활용하여 XGBoost Fine-Tuning
- 식품의약품안전처 기반으로 만들어진 랜덤 50만개 데이터
학습 결과 |
---|
- KoBert 토크나이저 활용
- 2 Layers Bi-LSTM + Conv1D 구조
- 네이버 쇼핑 크롤링 리뷰 데이터 29,063
학습 결과 |
---|
워드클라우드 결과 긍정 | 워드클라우드 결과 부정 |
---|---|