로봇 공존 시대의 테크니컬 라이터

구글 딥마인드는 다음의 보고서를 발표했습니다.

  1. RT-2: New model translates vision and language into action”(2023년 7월) RT-2는 시각 정보와 언어를 로봇의 물리적 행동으로 직접 번역하는 VLA(Vision-Language-Action) 모델입니다. 기존 로봇이 “A 지점에서 B 지점으로 가라”는 수학적 명령만 수행했다면, RT-2는 웹상의 방대한 텍스트와 이미지 데이터를 학습하여 “공룡 인형을 건강한 간식 옆에 두어라”와 같은 추상적이고 복잡한 명령을 스스로 해석하고 행동으로 옮깁니다.
  2. Shaping the future of advanced robotics”(2024년 1월) 위 1. 보고서에서 소개한 RT-2에서 더 진화된 AutoRT, SARA-RT, RT-Trajectory를 다루고 있습니다. 로봇이 스스로 환경을 인식하고, 로봇 헌법(Robot Constitution)에 따라 안전하게 행동을 결정하는 시스템적 아키텍처를 다룹니다.
  3. Google DeepMind의 [Gemini Robotics] 공식 페이지 Google의 가장 강력한 멀티모달 모델인 Gemini가 로봇의 ‘뇌’가 되었을 때 어떤 일이 벌어지는지를 보여줍니다. 핵심은 로봇이 단순히 정해진 동작을 수행하는 것이 아니라, 방대한 데이터를 읽고(Reasoning), 상황을 시청각적으로 이해하며(Multimodal), 이를 물리적 행동(Action)으로 연결한다는 점입니다.

위 1의 보고서를 통해, 자연어로 작성된 매뉴얼 즉 텍스트 데이터는 단순히 인간의 이해를 돕는 보조 수단을 넘어 로봇의 물리적 움직임을 만들어내는 “행동의 설계도”로 진화하고 있음을 유추해 볼 수 있습니다.

인간의 일반적인 언어가 곧바로 로봇의 행동으로 이어지는 이러한 변화가 전통적인 테크니컬 라이터(Technical Writer)에게 던지는 시사점은 무엇일까요?

앞으로 이어질 내용은 이번 글의 주제인 “로봇 공존 시대에서의 테크니컬 라이터의 역할 혹은 업무 확장”에 관한 것입니다. 여기에는 “로봇 지식 아키텍처(RKA, Robot Knowledge Architecture)”라는 낯선 단어가 출현합니다. 이는 기존 테크니컬 라이팅에 대한 확장된 역할과 개념을 편의적으로 부르기 위해 만든 단어일 뿐이며, 업계 통용되는 공식 단어는 아님을 밝힙니다.

테크니컬 라이팅 vs 로봇 지식 아키텍처?

로봇 지식 아키텍처(RKA, Robot Knowledge Architecture)는 로봇이 세상을 인지하고 작업을 수행하는 데 필요한 정보를 기계 가독형(Machine-Readable)으로 모듈화한 지식 체계입니다.

“온도가 높으면 끄세요.” (단순 정보)와 같이 일반적인 테크니컬 라이팅은 정보를 선형적으로 나열하는 것이라면, 아키텍처는 [센서 데이터] → [논리 임계값] → [상태 정의] → [물리적 행동 벡터]로 이어지는 데이터의 흐름(Pipeline)을 설계하는 것입니다. (“온도가 높으면 끄세요.”는 예시일 뿐이며, 일반적인 테크니컬 라이팅 문장으로도 지양하는 문장입니다.)

“비상 시 빨간 버튼을 누르세요.”

위 문장의 경우 로봇의 입장에서 보면 어떨까요?

  1. 비상 시 (상황 정의): 비상이 뭐지?
  2. 빨간 버튼 (타깃 정의): 어떻게 생겼지?
  3. 누르기 (동작 정의): 어떻게 누르라는 거지?

이것을 로봇이 이해할 수 있도록 마크다운(Markdown) 문법을 사용해서 작성해보면 다음과 같습니다. 마크다운에서 {: }는 클래스, 속성, ID 등의 메타 정보를 정의합니다. (단, {: }는 Kramdown이나 Jekyll 같은 특정 환경에서만 작동하는 ‘확장 문법’입니다. 실제 현업에서는 HTML5의 data-* 속성이나 JSON Schema 같은 표준화된 방식이 더 선호될 수 있습니다.)

“기기 온도가 [80°C를 초과하는]{: logic=”temp > 80″ unit=”celsius”} [비상 상황]{: .emergency-trigger} 발생 시, [비상 정지 버튼]{: #ESTOP_01 .target-feature=”red,circular”}을 [5kgf 이상의 힘]{: value=”>=5″ unit=”kgf”}으로 [꾹 눌러]{: .action-push} 즉시 정지하십시오.”

  1. 80°C를 초과하는 (트리거 조건): {: logic=”temp > 80″}
  2. 비상 상황 (상황 정의): {: .emergency-trigger}
  3. 비상 정지 버튼 (타깃 정의): {: #ESTOP_01 .target-feature=’red,circular’}
  4. 5kgf 이상의 힘 (물리적 강도): {: value=”>=5″ unit=”kgf”}
  5. 꾹 눌러 (동작 유형): {: .action-push}

DITA의 경우, 의미 단위(Topic)로 관리하는 구조적 특성이 로봇의 행동을 결정짓는 논리적 체계와 일치하기 때문에 RKA 기반 라이팅에 적합한 방식 또는 툴로 볼 수 있습니다.

단, RT-2의 핵심은 LLM을 통해 사전학습한 ‘유연한 일반화 능력’입니다. 위 마크다운으로 태깅한 문장은 문장을 이루는 모든 상황 요소에 대해 RKA로 작성해 본 예로, 유연한 일반화와 엄격한 구조화 사이의 논리적 모순으로 보일 수 있습니다. 테크니컬 라이터는 “80°C 초과”, “5kgf의 압력”, “ISO 안전 규정” 등 확률에 맡겨서는 안 되는 절대적 수치와 법적 제약 조건 외에 로봇이 이미 알고 있는 상식을 다시 정의할 필요가 없습니다.

이제 위 문장은 로봇이 읽는 문장과 인간이 보는(혹은 들리는) 문장으로 이중 렌더링되어 각각의 언어로 치환됩니다.

1. 로봇이 읽는 문장 (Machine Perception Layer)

RT-2 로봇(VLA 모델)은 텍스트의 감성적 수식어를 제거하고, 오직 동작을 결정하는 파라미터만 추출하여 행동 벡터로 변환하기 위한 데이터셋을 구성합니다. (위 1. 보고서 참조)

[Logical Translation] : 로봇의 사고 프로세스

  1. Trigger (발생 조건): logic: “temp > 80” (Sensor_ID: Temp_01)
  2. Status (상태 정의): class: “emergency-trigger” (Mode: EMERGENCY_LEVEL_HIGH)
  3. Target_Object (대상 식별): ID: “ESTOP_01”
    • Search_Filter (대상 속성): {color: “red”, shape: “circular”, label: “Emergency Stop”}
  4. Action_Type (동작 유형): type: “push” (Mode: Contact_Push_Force_Control)
  5. Action_Parameter (실행 수치): value: “>=5”, unit: “kgf”
  6. Flag (최종 의지): Termination_Sequence_Active (동작 완료 후 시스템 즉시 정지)

[Action Vector Mapping] : 로봇의 물리적 출력

  1. Vector Sequence (행동): [1, Δx, Δy, Δz, Δr, Δp, Δy, 150]

2. 인간에게 보이는 문장 (Human Display Layer)

인간 사용자가 보는 화면(매뉴얼, 웹페이지, AR 글래스 등)에서는 딱딱한 태그나 속성값은 모두 사라지고, 가독성과 시인성이 극대화된 형태로 나타납니다.

“기기 온도가 80°C를 초과하는 비상 상황 발생 시, 비상 정지 버튼을 5kgf 이상의 힘으로 꾹 눌러 즉시 정지하십시오.”

RKA 기반 테크니컬 라이팅 필요 기술?

전통적인 테크니컬 라이팅이 ‘인간을 위한 설명서’를 만드는 작업이었다면, RKA 기반 라이팅은 ‘인간과 로봇이 상호작용하는 지식 체계’를 설계하는 과정이라고 할 수 있습니다.

RKA 기반 테크니컬 라이팅을 위해 라이터는 다음과 같은 기술의 습득 혹은 준비가 필요합니다.

구분전통적 테크니컬 라이팅로봇 지식 아키텍처필수 기술 및 도구
주요 대상 & 목적인간 사용자
제품 사용법 참조 및 문제 해결
AI 에이전트 + 인간 사용자
로봇의 추론 지원 및 실시간 행동 제어
인간과 로봇을 위한 정보 구조 설계 능력
정보 구조 (Structure)선형적 목차 (PDF/HTML)
장과 절 위주의 순차적 구성
비선형 데이터 구조 (JSON/Graph)
속성 및 관계 중심의 데이터 블록화
정보 구조 설계 능력
– 문장을 데이터로 분절(Chunking)
– DITA, Markdown, JSON
– VS Code, Linter
정밀도 & 논리 (Logic)문장 기술 및 편집
인간 이해를 위한 서술과 가독성 중심
논리적 모델링 및 데이터 해석
모호함을 제거한 수치와 제약 조건에 대한 논리적 설계
국제 표준(Compliance) 내재화
– ISO 규범 등을 로봇의 행동 제약 조건으로 변환
– 규제 데이터베이스 적용
검증 및 QA텍스트 리뷰
오타 검수 및 문법적 완결성 확인
행동 및 출력 검증 (Action QA)
설계된 지식이 실제 로봇 행동으로 구현되는지 확인
시뮬레이션 기반 지식 검증
지식 데이터가 로봇 행동으로 전이되는지 테스트
지식 순환정적 버전 관리
제품 업데이트에 따른 수동 수정
재귀적 지식 순환
현장 데이터 피드백을 통한 지식 자동 업데이트
지식 피드백 검증
로봇이 제안한 수정안을 법적·윤리적 검토 및 승인
[전통적인 테크니컬 라이팅과 로봇 지식 아키텍처 비고 그리고 필요 스킬 및 도구]

이 지점에서 테크니컬 라이터가 위에서 말한 필요 스킬을 필수적으로 직접 익혀야 한다는 것은 아닙니다. 테크니컬 라이터가 기존 방식으로 자연어로 매뉴얼을 작성하고, 이를 로봇이 LLM으로 1차적으로 구조화(Auto-tagging)하면, 테크니컬 라이터가 그 결과물의 정확성을 검증하는 역할을 수행하는 것만으로 충분히 그 가치를 증명할 수 있습니다.

로봇이 (인간) 사용자용 매뉴얼을 만든다?

위 표 맨 마지막 부분의 ‘지식 순환’ 항목을 통해 테크니컬 라이터의 또다른 역할도 유추해 볼 수 있습니다.

로봇이 기존에 자신이 가지고 있던 데이터와 행동으로 경험한 새로운 데이터를 바탕으로 스스로 성능을 높이는 것을 재귀적 자기 개선(Recursive Self-Improvement)이라고 부릅니다.

기술적 알고리즘은 다르더라도, 새로운 데이터를 바탕으로 스스로 성능을 높인다는 개념을 테크니컬 라이팅에 차용해 보면, 시뮬레이션을 마친 로봇은 자신이 겪은 엣지 케이스(예: “이 각도에서는 손이 끼일 위험이 있음”)를 바탕으로 인간 작업자를 위한 가이드나 실시간 경고 매뉴얼을 역으로 작성할 수 있습니다.

테크니컬 라이터는 로봇이 엣지케이스 등으로 작성한 매뉴얼을 검증하고, 다시 매뉴얼을 배포하는 역할을 합니다.

테크니컬 라이터, 로봇의 지능을 디자인하다

우리는 더 이상 종이 매뉴얼에 국한된 시대에 살고 있지 않습니다. 구글 RT-2가 보여준 사례처럼, 테크니컬 라이터의 텍스트는 로봇의 경험이 되고, 로봇의 경험은 다시 우리의 가이드가 됩니다.

이 글은 테크니컬 라이터의 역할이 ‘설명서 제작’에서 ‘로봇 지능의 정보 구조 설계’로 확장되고 있음을 살펴본 것입니다. RKA 영역은 한편으로는 전통적인 테크니컬 라이터가 새로운 기술과 도구를 습득해야 하는 영역입니다. 하지만 프로그래밍 엔지니어가 이 역할을 완전히 대체할 수는 없습니다. 이는 단순히 글을 쓰거나 코딩만 할 수 있으면 되는 능력이 아니라 ‘정보의 구조 설계 능력’이 핵심이기 때문입니다.

모든 테크니컬 라이터가 ‘로봇 지능의 정보 구조 설계하는 자’로 변모해야 한다는 것은 아닙니다. 다만, 지능형 로봇과 인간이 공존하는 시대에서, 그리고 ‘로봇 지식 아키텍처(Robot Knowledge Architecture)’라는 관점에서 본다면 테크니컬 라이터가 사라지거나 정체하는 직업이 아니라 새롭고 더욱 확장된 기회로 볼 수 있지 않을까 하는 생각을 가져 봅니다.