본문 바로가기

활동

[2023 KPMG 아이디어톤]

2023 KPMG 아이디어톤에 참여했다.

" 자연어모델 (BERT, RoBERTa, ELECTRA, KoBERT 등)을 사용하여 기업 비즈니스 분야에서의 분석적 인사이트를 도출하거나 예측하는아이디어 및 프로토타입 구현 "

[1차 회의] - 주제 선정

현업에서는 RA(Research Analysist)가 특정 회사에 대한 정보를 리서치한 후 정리해서 전달하는 방식인데 방대한 정보를 빠르게 찾을 수 있도록 하자 ! 는 아이디어에서 출발 -> QA 모델

이전부터 여러 번 도메인에 대한 지식의 중요성을 느낄 수 있었는데, 이번에도 여실히.. 느꼈다.

해당 직무에 대한 경영학과 팀원의 생생한 후기가 큰 힘이 됐다.

[2차 회의] - 무엇을 알려주는 QA 모델?

구체적으로 우리 모델은 무엇을 알려줄까? 우리가 키워드의 범위를 정하고 그 키워드에 대한 QA를 진행하자 !

산업 별 키워드가 조금씩 다를 것으로 예상, 제공된 데이터셋에서 주력 산업을 찾고 이에 대한 정성적, 정량적 요소를 정리하자 ! 또, QA 모델이 제공할 답변에 대한 리소스를 찾아보자 !

우아,, 이렇게 업무를 분담하면 되구나.

프로젝트의 전체적인 흐름도 깔끔히 정리되었고, 역할도 명확히 나눌 수 있었다.

팀장님,, 이런 노련함은 어디서 나오는건지 감탄했다.

[3차 회의] - QA 모델의 범위 설정

사용자가 질문을 했다. 그렇다면 우리 모델은 어디까지, 얼마나 자세히 응답을 해야 할까? rule-based로 구동하자. 특정 키워드가 들어간다면 이에 대응하는 task를 수행해야 하는 걸로 규칙을 세워보자.

정성적 키워드 : 정책, 규제, 인센티브, 기술투자, 신흥기술, 잠재력, 핵심기술, 영향력, 비즈니스 모델, M&A, 파트너십, 해외 진출(KPMG의 일), {국가} {도메인}시장, 신규 법인, 거래범위, {도메인}업 구조, 소송위험, 우발약정, ESG

정량적 키워드 : [매출액, 영업이익, 주가 +a]→[연간, 분기간 = YoY, QoQ] [성장/현황/증감]

키워드와 task를 1:1 매핑해주어 답변의 규칙을 세웠다.

정성적인 지표의 경우는 사용자의 요구에 맞게 다양한 태스크를 수행하고, 정량적인 지표의 경우 수치 자료이므로 한 눈에 파악하기 쉽게 차트로 나타내 표현하기로 !

[4차 회의] - 세부 기능 추가

우리 서비스의 핵심 기능은 QA다. 이외 사용자의 입장에서 어떤 기능을 추가하면 좋을까?

  • 최근 검색어를 기반으로 최신 정보 및 사용자가 속한 팀이 가장 많이 검색한 키워드 보여주기
  • 답변으로 제공되는 보도자료, 공시자료의 경우 자료의 성격에 따라 키워드 기반의 요약본으로 제공하기
  • 폴더를 만들어 리서치할 한 주제에 대한 여러 자료를 효율적으로 관리할 수 있도록 하기
  • 팀 단위로 협업할 상황이 많음을 반영, 구글 드라이브처럼 공용으로 폴더 사용하기
  • TextRank 알고리즘, Priority Matrix 등의 시각화 도구를 이용해 추가적인 정보 제공하기
 
 

그렇게 만들어진 우리 서비스 스케치 !

피그마 요런 아이였구나,, 신세계다

유능한 팀원들 덕에 여러 부분에서 많이 많이 배웠던 고런 프로젝트였다.

'활동' 카테고리의 다른 글

[CUAI 동계 컨퍼런스]  (0) 2023.03.15
[2022 응통 분석 공모전]  (0) 2023.03.15