사용법 안내 챗봇 만들기

기술이 빠른 속도로 발전하는 시대에 전통적인 방식의 사용설명서는 빠르게 과거의 유물이 되어가고 있습니다. 사용설명서의 전달 방식에 어떤 혁신이 필요한지, 한샘글로벌이 실험을 시작합니다. 

소비자의 정보 구독 형식의 변화

한샘글로벌은 지난 35년 간 사용자 설명서 개발을 주력 사업으로 삼으며, 전통적인 인쇄 매뉴얼과 웹 기반 매뉴얼을 통해 일반 소비자에게 정보를 제공해 왔습니다. 이러한 전통적 접근 방식은 수십 년 동안 업계 표준을 정립하고, 고객에게 신뢰성 높은 정보를 전달하는 데 중추적인 역할을 해왔습니다. 그러나 최근 ICT(정보통신기술)의 기술의 급속한 발전과 인공지능 기술의 등장은 소비자의 정보 소비 방식에 혁신적인 변화를 가져왔습니다.

특히, ChatGPT와 같은 대화형 AI 플랫폼의 출현은 전통적인 종이 매뉴얼이나 웹 매뉴얼보다 질의응답 형식을 통한 인터랙티브한 정보 접근을 선호하는 새로운 소비자 행태를 촉진하고 있습니다. 이러한 플랫폼은 언제 어디서든 인터넷 연결만 가능하다면, 실시간으로 필요한 정보를 제공함으로써 사용자 경험을 대폭 개선합니다.

언어 모델을 활용한 챗봇의 변화

초기 챗봇 시스템
초기의 챗봇 시스템은 주로 룰 기반 알고리즘을 활용하여 구축되었습니다. 이 시스템들은 사용자의 질문에 대해 특정 키워드를 인식하고, 이를 기반으로 사전에 설정된 응답을 반환하는 방식으로 동작했습니다. 예를 들어, 고객이 “주문 상태 확인” 이라고 요청하면, 챗봇은 “주문 상태” 라는 키워드를 통해 “주문 번호를 입력해주세요.” 라고 자동으로 응답하는 구조였습니다. 이러한 접근법은 정형화된 질문에는 효과적이었으나, 변형된 질문이나 예상치 못한 사용자의 요구에는 적절히 대응하기 어려웠습니다.

언어 모델 기반 챗봇
이를 극복하기 위해 등장한 언어 모델 기반 챗봇은 인공지능의 발전을 통해 더욱 복잡하고 자연스러운 대화가 가능하게 되었습니다. 특히, 트랜스포머 아키텍쳐를 기반으로 한 모델들은 다양한 문맥에서 발생하는 언어의 미묘한 뉘앙스까지 포착할 수 있는 능력을 보여주었습니다. 예를 들어, GPT와 같은 모델은 사용자의 질문을 깊이 이해하고, 그에 맞는 적절하고 유창한 응답을 생성할 수 있습니다.

언어 모델들은 인상적인 성과를 보여주고 있지만, 여전히 완벽하지 않습니다. 이는 주로 두 가지 큰 이유에서 기인합니다. 첫째, 언어 모델이 학습할 수 있는 데이터에는 현실적으로 한계가 있어, 세상의 모든 지식을 포괄하지 못하기 때문입니다. 둘째, 세상의 지식은 매 순간 새롭게 생성되지만, 언어 모델을 지속적으로 업데이트 하는 데는 막대한 비용과 자원이 소모되기떄문에, 언어 모델이 모든 최신 정보를 학습하는 것은 실질적으로 불가능에 가깝습니다. 이로 인해 언어 모델은 사실이 아닌 정보를 그럴듯하게 하는 Hallucination 문제를 가지고 있습니다.

Retrieval Augmented Generation (RAG) 기술을 이용한 챗봇
이러한 문제를 해결하기 위해 도입된 Retrieval Augmented Generation (RAG) 기술은 언어 모델의 응답 생성 과정에 실시간 정보 검색을 통합하여, 보다 정확하고 신뢰성 있는 답변을 제공합니다. 예를 들어, 사용자가 “초콜릿의 건강 효능” 에 대해 질문할 때, RAG를 활용한 챗봇은 최신의 학술 연구나 검증된 정보원을 참조하여 과학적으로 입증된 답변을 제공할 수 있습니다. 이처럼 필요한 정보를 언어 모델에 효과적으로 통합하는 방식은 매우 강력합니다. 이와 관련된 다양한 방법론들이 지속적으로 제안되며 빠르게 발전하고 있습니다.

하지만 RAG 모델에 있어서 중요한 것은 “사용자의 질문에 대해 관련성 높고 질 좋은 정보”를 제공하는 것이며, 이는 챗봇 기술이 사용자의 요구에 부응하며, 신뢰도와 효율성을 극대화 하는 핵심 요소로 자리 잡고 있습니다.

인간 중심 콘텐츠가 가진 문제점

현재 RAG 방식에서 사용되는 외부 데이터는 대부분 기존에 만들어진 인간 중심 콘텐츠 (Human-Centric Content) 를 벡터 형태로 변환하여 활용하고 있습니다. 이는 인간이 이해하고 사용하기 쉽게 설계된 데이터이며, 이로 인해 AI의 효율성과 정확성은 제한될 수 있습니다.

실제로, RAG 기술을 이용하여 언어 모델을 활용하거나, 혹은 미세 조정 (Fine Tuning) 할 때, 이미 생성된 인간 중심 콘텐츠는 AI가 최적으로 활용하기 어려운 경우가 많습니다. 예를 들어, 고객이 신형 스마트폰의 사용설명서에서 “사진 촬영 방법”에 대한 정보를 요청했다고 가정해 보겠습니다. 사용설명서는 일반적으로 각 기능의 사용법을 단계별로 설명하고 있지만 이런 문서는 인간이 이해하도록 설계되었기 때문에, 이런 콘텐츠를 벡터 형태로 전환시킨 데이터로 AI가 처리할 때, 필수적인 단계나 중요한 주의사항을 누락하거나 잘못 해석할 가능성이 있습니다. 예를 들어, AI가 ‘HDR 모드에서 사진 촬영’을 단순히 ‘HDR 설정’으로 축약해 설명할 경우, 사용자는 실제로 사진을 촬영하는 방법을 완전히 이해하지 못할 수 있습니다. 이러한 문제는 인간 중심 콘텐츠가 AI에 의해 처리될 때 발생할 수 있는 오류의 한 예로서, AI 중심 콘텐츠의 개발이 왜 중요한지를 잘 보여줍니다.

이처럼, AI의 학습 및 응답 생성 과정에 최적화된 데이터, 즉 AI 중심 콘텐츠 (AI-Centric Content)가 필요하지만 참고할 수 있는 다수의 콘텐츠가 인간중심이기 때문에 이런 콘텐츠를 AI를 위한 데이터 설계 및 가공이 중요하고 이 같은 콘텐츠 정보의 AI 친화적 변환은 기술 혁신의 필수 요소가 될 것입니다.

AI 중심 콘텐츠 제작 또는 가공

인간사용자의 다양한 질문에 맞춘 정확한 답변을 AI가 수행하려면 AI가 사용하기 좋도록 데이터 자체가 정제되어 있어야 합니다. 전통적인 인간 소비자와 달리 AI 에이전트(챗봇, AI 검색 도구 등 애플리케이션)가 사용할 콘텐츠 유형은 같지 않습니다. 정보의 기본적인 가치는 이해도와 정확성에 있다는 점에 있어, 우수한 콘텐츠의 기준은 동일하지만, 인간 소비자와 AI 소비자가 선호하는 정보의 양식에는 차이가 있습니다. 인간 소비자는 한정된 시간 안에 정보를 정확하게 이해하고 활용하기 위해 간결한 정보 형식을 선호하는 반면, 방대한 초고속 클라우드 컴퓨팅 능력에 기반한 AI 소비자는 방대하고 상세한 설명을 선호합니다.

[콘텐츠를 사용하는 인간소비자와 AI소비자의 차이 도표]

인간 소비자AI 소비자
콘텐츠 특성간결하고 정확한 콘텐츠
제약된 시간 안에 빠르게 읽고 습득할 수 있는 구성
최대한 많은 설명을 포함하는 콘텐츠
필요한 정보와 관련된 정보를 빠짐없이 수록할수록 성능 증가
예제 제공간단한 예제최대한 많은 예제
예제 수가 많을수록 이해도 및 정확도 향상
이미지 등 시각 정보이해도 향상에 효과 높음활용을 위해 상세한 설명을 추가해야 함
메타데이터최종 사용자와는 무관활용도 높음
퍼블리싱 형식정형화됨(PDF, html, xml…)필요에 따라 실시간으로 커스터마이징 가능 / 비정형화된 활용 방식(챗봇, 앱 등)

한샘글로벌은 이번 실험에 사용할 모델을 대상으로, AI가 참고하기 위한 콘텐츠 데이터 유형, 즉 대표적으로는 사용설명서 형식부터 AI 친화적인 구성과 형식으로 작업했습니다.

추가적인 틈새 정보 (Niche Information) 데이터 개발

틈새 정보란 사용자에게 유용할 수도 있지만 사용설명서에는 수록되지 않은 범위의 정보입니다. 사용자는 그들이 가진 배경, 지식, 상황, 목적에 따라 다양한 질문을 할 수 있기 때문입니다. 정해진 질문과 정해진 답변이 있는 제품설명서의 정보만으로 충분하지 않을 수 있습니다. 예를 든다면:  

  • 제품의 기획 의도와는 다른 방식으로 제품이 활용되는 경우
  • 제3자가 제공하는 서비스와 연계되어 제조사의 상품설명서에 포함되지 않은 정보
  • 제품 출시 이후 시장에서 발생하는 이슈와 관련된 정보

틈새 정보 데이터를 개발하기 위해 우리는 사용자 커뮤니티, 블로그, 사용후기에서 자주 나오는 질문들의 유형을 참고했습니다. 수많은 질문이 있지만 사용자의 행동알고리즘을 고려하여 정보를 분석하고 분류한 뒤 한샘글로벌만의 특화된 AI 중심 콘텐츠로 가공했습니다.

동시에 사용설명서에 수록된 사용법의 범위를 넘어서지만 제품 특성상 반드시 발생하는 FQA 및VOC를 파악하여 사용자의 니즈에 선제적으로 대응할 수 있는 틈새 정보도 개발했습니다.

이런 유형의 Niche 정보가 일반적인 LLM모델의 챗봇보다 한샘글로벌이 고도화시키고 있는 챗봇이 보다 상세하고 유용한 답변을 제공하는 데 활용될 수 있습니다.

챗봇 아키텍처

이 시스템은 인공지능(AI) 대화형 플랫폼으로, 대형 언어 모델(Large Language Models, LLM)과 결합된 Retrieval Augmented Generation(RAG) 접근 방식을 사용합니다. 기본 아이디어는 LLM이 사용자의 질문에 대한 응답을 생성하기 전에 한샘글로벌이 만든 AI콘텐츠기반 백터DB에서 관련 데이터를 검색하고 이를 통합하여 보다 정확하고 풍부한 정보를 제공하는 것입니다.

실험 결과

한샘글로벌이 개발한 사용법 안내 챗봇은 데모 과정을 통해 일반 LLM모델을 베이스로 한 GPT챗봇보다 우수한 답변 능력을 보여 주었습니다. 특히 AI중심 콘텐츠 데이터로 정제한 백터DB와 Nitch정보DB에 데이터를 입력할 때 관련 있는 이미지 정보도 같이 입력했기 때문에 사용자는 이미지까지 포함된 정교한 답변을 안내 받을 수 있었습니다.

무엇보다 일반GPT모델에서 제공할 수 없는 최신 정보나 특정 제품에 대한 구체적이고도 자세한  디테일한 정보를 제공하고 있습니다.

내일 할 일들

이번 실험 프로젝트를 통해 전통적인 사용설명서 제작회사인 한샘글로벌이 AI 시대에 필요한 사용설명서까지 주도적으로 개발할 수 있음을 입증했습니다. 특히 한샘글로벌이 사용설명서개발 분야에서 구축한 35년의 노하우는 AI-centric content를 위한 전환에 있어서 큰 차별화가 된다는 것을 알 수 있었습니다.

한샘봇의 정교화를 위한 많은 테스트는 여전히 남아 있습니다. 또한 지속적인 제작을 위한 방법론의 표준화도 더 다듬어져야 합니다. 사용자의 질문과 관련된 정보를 수집하는 기술도 보다 보편적이고 표준화된 방법이 정립되어야 하고 LLM 입력 프롬프트를 보다 고도화하는 테스트 작업도 계속 진행중입니다. 틈새 정보를 수집한 뒤 어떤 형식의 문서 타입으로 연동시켜야 최적한 결과를 도출하는지도 계속해서 테스트하고 있습니다.

하지만 한샘글로벌이 도전한 이번 실험을 통해, 보다 혁신적인 방식으로 사용법을 전달받고자 하는 소비자의 기대를 충분히 충족시킬 수 있음을 확신할 수 있었으며 새로운 비즈니스로도 확장될 수 있음을 발견했습니다. 한샘글로벌이 만든 챗봇은 특화된 지식 기반을 바탕으로 다양한 분야의 맞춤형 인공지능 애플리케이션으로 구현될 수 있습니다. 모바일 제품군의 사용법, FAQ, 차량 AVN 시스템에 통합된 매뉴얼봇 등 다양한 형태로 활용할 수 있습니다.