Skip to content

제12회 산업통상자원부 공공데이터 활용 아이디어 공모전 최우수상🏆 | LLM 프롬프트 엔지니어링 | 추천 시스템 | 자연어 처리

License

Notifications You must be signed in to change notification settings

Bluemming/Tri-fusion-mapping-algorithm

Repository files navigation

제12회 산업통상자원부 공공데이터 활용 아이디어 공모전

Tri-fusion 매핑 알고리즘

 

팀 구성원
김민경 김유미 민지현

 

🏆 데이터 분석 부문 최우수상 수상

 

기간

2024.04.30 - 2024.07.01

 

목표

  • 인간의 사고 논리를 기반으로 해외 바이어 기업 설명과 수출입 품목 HS코드를 매핑하는 모델 개발
  • LLM 프롬프트 엔지니어링을 이용한 추천 모델 설계

 

사용 데이터

  • 해외 기업 설명 텍스트(영어)
  • HS 코드 품목명 텍스트(한국어)

 

분석 방법

  • HS 코드 품목명 전처리 : 언어 모델과 수작업으로 영어 번역
  • 해외 기업 설명문 전처리 : 기업이 수입할만한 품목을 LLM으로 생성하여 추가, 서비스업 여부 LLM으로 판단
  • 두 데이터를 sentence transformer로 임베딩하여 추천군을 제시 후, 3가지 기법 보팅 앙상블(기준 : 가상 답안 정확도)
    1. 코사인 유사도가 높은 경우끼리 매핑
    2. Reranking 추천 시스템
    3. VAE 추천 시스템-기업 설명문에 표현된 제외할 물품을 예외 처리로 필터링

 

결과

  • 사업적 측면의 니즈를 고려한 LLM 프롬프트 엔지니어링으로 성약 극대화
  • 가상 답안 기준 평균 75%의 높은 정확도
  • 복잡한 태스크에서 단계별 적용하는 기법의 논리성을 확보하여 솔루션 제시

 

분석 상세

About

제12회 산업통상자원부 공공데이터 활용 아이디어 공모전 최우수상🏆 | LLM 프롬프트 엔지니어링 | 추천 시스템 | 자연어 처리

Topics

Resources

License

Stars

Watchers

Forks