엔씨소프트(대표 김택진)는 14일 고려대학교 임희석 교수 연구팀과 공동연구를 통해 구축한 인공지능(AI) 대화 데이터‘FoCus Dataset(For Customized conversation dataset)’을 선보였다.

이는 사용자 개인의 페르소나와 외부 지식을 모두 활용하는 AI 대화 데이터셋이다. 약 8000여개의 광범위한 주제를 다룬 1만 5000개 이상의 대화로 구성됐다.

해당 데이터셋을 적용한 AI는 대화하고 있는 사용자의 경험, 선호, 소유, 흥미 등을 파악하고 위키피디아에서 이야기 주제에 대한 최신 지식을 실시간으로 습득해 자연스러운 대화가 가능하다.

특히 초거대 언어 모델을 사용하지 않고도 같은 성능의 대화 기술을 구현할 수 있다. 현재 일반적인 대용량 언어모델은학습과 추론에 많은 비용이 소요됨에도 불구하고, 실시간 지식과 개인의 경험을 반영하는데 한계를 나타내고 있다.

공동연구팀은 지난 2월 인공지능 학회 ‘AAAI 2022’에서 해당 연구 논문을 게재 및 발표했다. 오는 10월에는 세계 전산언어학회인 ‘COLING 2022’에서 데이터 활용 경진 대회를 비롯한 연구 성과를 공유하는 워크샵을 고려대와 공동 개최할 예정이다.

[더게임스데일리 신석호 기자 stone88@tgdaily.co.kr]

저작권자 © 더게임스데일리 무단전재 및 재배포 금지