목차 (Agenda)

Telemetry란 무엇인가요?

Telemetry는 로그·메트릭·트레이스를 수집·전송해 Observability를 지원하는 개념이며, OpenTelemetry는 이를 표준화한 오픈소스입니다.

2025년 09월 08일

Telemetry 란 무엇인가요?

클라우드 네이티브 환경에서 MSA(Microservices Architecture)와 쿠버네티스를 기반으로 서비스를 구축하고 운영하시는 IT 운영자들에게 분산 시스템의 복잡성 속에서 서비스의 안정성과 성능을 확보하는 것은 매우 중요한 과제입니다. 이러한 과제를 해결하는 데 있어 핵심적인 역할을 하는 개념 중 하나가 바로 ‘Telemetry’입니다. 이 글에서는 Telemetry의 기본적인 개념부터 Observability와의 관계, 그리고 OpenTelemetry가 이 용어를 채택한 배경까지 자세히 다루어 보겠습니다.

Telemetry라는 단어의 의미를 알려드립니다.

‘Telemetry’는 고대 그리스어에서 유래한 합성어로, ‘Tele’는 ‘멀리 떨어진’ 또는 ‘원격’을 뜻하고, ‘Metron’은 ‘측정’을 의미합니다. 따라서 Telemetry는 본래 ‘원격 측정’을 뜻하며, 물리적으로 접근하기 어려운 시스템이나 프로세스에서 데이터를 자동으로 수집하고 전송하는 기술을 가리킵니다.

이처럼 telemetry의 기본 아이디어는 측정 장치로부터 떨어진 장소에서 데이터를 수집하고 전달하는 것입니다. 항공우주에서 우주선의 엔진 상태를 지상으로 전송하는 것처럼, IT에서는 애플리케이션이나 인프라가 생성하는 성능·상태 정보를 네트워크를 통해 수집합니다.

다시 말해, 데이터가 ‘어디서 어떻게’ 수집되고 ‘어디로 어떻게’ 전달되는지까지 포함하는 운영 데이터 파이프라인 전체를 의미합니다.

소프트웨어 문맥에서는 텔레메트리가 애플리케이션과 인프라가 스스로 내뿜는 실행 신호(트레이스, 메트릭, 로그 등)를 표준화된 형식으로 수집·전송하는 메커니즘을 뜻합니다. 이러한 데이터는 시스템 내부의 동작을 이해하고, 문제 발생 시 원인을 신속히 규명하는 기반이 됩니다.

특히 클라우드 네이티브 환경에서는 텔레메트리가 필수 요소로 자리 잡았습니다. 컨테이너 오토스케일링, 서비스 메시, 이벤트 기반 아키텍처가 얽히는 순간, 사람의 직관만으로는 전체 상태를 파악하기 어렵기 때문입니다. 따라서 마이크로서비스마다 요청의 흐름(Trace), 양적 상태(Metrics), 사건의 맥락(Logs)을 자동으로 내보내고, 이를 신뢰성 있게 전달하는 체계가 반드시 필요합니다.

이 자동 수집과 전송의 총합이 곧 텔레메트리이며, OpenTelemetry에서는 이러한 텔레메트리 범주를 “시그널(Signals)”이라 부릅니다. 시그널은 운영체제와 애플리케이션이 생성하는 활동의 출력을 설명하는 개념으로, 클라우드 네이티브 시대의 관측성을 구성하는 핵심 요소라 할 수 있습니다.

OpenTelemetry에서 Telemetry라는 단어를 선택한 이유를 알려드립니다

OpenTelemetry는 2019년 Google, Microsoft, Lightstep 등이 주도하던 OpenTracing과 OpenCensus 프로젝트가 통합되면서 출범했습니다. 당시 두 프로젝트가 별도로 존재하면서 개발자들에게 혼란을 주었고, 이를 해소하기 위해 표준화된 단일 프레임워크를 마련한 것이 바로 OpenTelemetry입니다. 그 목표는 모든 서비스에서 고품질의 Telemetry 데이터를 기본적으로 제공하여, 복잡한 마이크로서비스 환경에서도 안정적인 관찰가능성을 확보하는 것이었습니다.

이 과정에서 새롭게 탄생한 프로젝트 이름에 ‘Telemetry’라는 단어가 선택된 데에는 몇 가지 중요한 이유가 있습니다.

첫째, 범위의 확장성입니다.

OpenTracing이 주로 분산 추적(Tracing)에 집중했던 반면, OpenTelemetry는 로그, 메트릭, 트레이스라는 세 가지 핵심 Telemetry 데이터를 모두 다루는 통합 솔루션을 지향했습니다. 따라서 특정 기능에 한정된 명칭(예: OpenLogging, OpenTracing)보다는, 이러한 모든 데이터를 포괄할 수 있는 일반적이고 포괄적인 단어가 필요했습니다.

둘째, 산업적 표준성을 담보하기 위함입니다.

IT 업계에서는 이미 원격 데이터 수집과 모니터링 활동을 통칭하는 말로 ‘Telemetry’가 널리 쓰이고 있었습니다. 분산 시스템과 클라우드 네이티브 환경이 보편화되면서, 다양한 지표를 표준화된 방식으로 수집·처리·전송하는 필요성이 커졌고, Telemetry라는 용어가 이 흐름을 대표하는 단어가 되었습니다.

셋째, 기존 프로젝트의 통합 정신을 반영했습니다.

OpenTracing과 OpenCensus는 각각 분산 추적과 메트릭 수집에 강점을 가졌지만, 범위와 적용에 있어 중복과 한계가 있었습니다. OpenTelemetry는 이 둘의 기능을 결합하고 여기에 로그까지 포함함으로써, 더 넓은 영역을 포괄하는 ‘통합 Observability 프레임워크’를 지향했습니다.

넷째, 언어적 의미와 상징성입니다.

‘Telemetry’는 그리스어 tele(원격)와 metron(측정)에서 유래해 본래 ‘원격 측정’을 뜻합니다. 즉, 원격 시스템에서 발생하는 데이터를 수집해 전달하는 과정을 직관적으로 표현하는 단어입니다. OpenTelemetry는 이 의미를 확장하여, 클라우드 네이티브 애플리케이션에서 발생하는 로그·메트릭·트레이스를 표준화된 형식으로 수집·전송하는 도구라는 정체성을 드러내고 있습니다.

마지막으로, 미래 확장성을 고려한 선택이기도 합니다.

클라우드 네이티브 환경은 계속 진화하며, 앞으로 새로운 형태의 Telemetry 데이터가 등장할 수 있습니다. ‘Telemetry’라는 포괄적이고 유연한 단어를 사용함으로써, OpenTelemetry는 미래의 관측성 요구까지 수용할 수 있는 여지를 확보했습니다.

결국, OpenTelemetry가 ‘Telemetry’라는 단어를 선택한 것은 단순한 명칭의 문제가 아니라, 범위의 확장, 산업 표준화, 프로젝트 통합, 언어적 직관성, 그리고 미래 지향성을 모두 담아낸 결정이라 할 수 있습니다.

Observability와 Telemetry의 관계

Observability와 Telemetry는 서로 떼어 놓고 설명할 수 없는 개념이지만, 초점과 역할에는 분명한 차이가 있습니다. Telemetry는 시스템이 어떤 데이터를 측정하고 수집할 것인가에 관한 기술적 개념이라면, Observability는 그 수집된 데이터를 통해 시스템의 내부 상태를 얼마나 잘 이해하고 예측할 수 있는가라는 시스템적 특성에 집중합니다.

다시 말해, Observability는 시스템의 내부 상태를 외부로 방출되는 Telemetry 데이터만으로 얼마나 정확히 추론할 수 있는지를 나타내는 척도입니다. 좋은 Observability를 갖춘 시스템은 Telemetry를 통해 현재 상태를 진단하고, 문제의 원인을 분석하며, 미래의 위험까지 예측할 수 있습니다.

따라서 Telemetry는 Observability를 달성하기 위한 전제 조건이자 필수 수단입니다. Observability를 확보하려면 로그, 메트릭, 트레이스와 같은 다양한 Telemetry 데이터를 지속적으로 수집해야 하며, 이들이 서로 보완적으로 작용하여 전체적인 통찰을 가능하게 합니다.

로그(Logs)는 특정 시점에 발생한 이벤트의 세부 정보를 기록해 문제 상황을 재현하고 원인을 추적할 수 있게 합니다.
메트릭(Metrics)은 CPU 사용률이나 요청 처리량처럼 시간에 따라 변하는 지표를 통해 시스템의 전반적 상태와 추세를 보여줍니다.
트레이스(Traces)는 분산 시스템에서 요청이 여러 서비스를 거쳐 처리되는 과정을 시각화하여 병목 지점이나 장애 원인을 정확히 찾아냅니다.

이 세 가지는 마치 시스템의 심장 박동, 혈액 검사 결과, 신경계 지도를 보는 것과 같습니다. 각각의 데이터는 부분적인 신호지만, 함께 분석할 때 비로소 시스템 전체의 건강 상태를 입체적으로 이해할 수 있습니다.

관찰가능성(Observability)은 원래 제어 이론에서 비롯된 개념으로, 외부 출력으로 내부 상태를 추론할 수 있는 능력을 뜻합니다. 구글은 복잡한 현대의 분산 시스템을 이해하기 위해서는 단순한 출력만으로는 부족하며, 로그·메트릭·트레이스와 같은 고품질 Telemetry가 필요하다고 설명합니다. Datadog은 모니터링이 단순히 지표를 감시하는 데 그친다면, Observability는 문제의 맥락과 이유까지 파악하는 능력이라고 강조합니다. Elastic 또한 로그·메트릭·트레이스를 ‘세 기둥’으로 정의하며, 이 세 가지가 결합되어야 시스템 성능을 제대로 이해할 수 있다고 말합니다.

결국 Telemetry는 Observability의 재료이고, Observability는 그 데이터를 분석하여 의미와 통찰을 도출하는 과정입니다. 마이크로서비스 아키텍처나 Kubernetes 같은 복잡한 환경에서는 서비스 간 상호작용이 얽히고설켜 있어 장애 원인을 직관적으로 파악하기 어렵습니다. 따라서 충분한 Telemetry 수집과 올바른 계측(Instrumentation) 없이는 Observability를 확보할 수 없으며, 반대로 풍부한 Telemetry 데이터가 확보될 때 비로소 Observability가 실현됩니다.

마무리

결론적으로 OpenTelemetry는 ‘Telemetry’라는 단어가 함축하듯, 분산 시스템의 복잡한 내부 동작을 이해하고 효과적인 Observability를 구현하기 위해 필요한 모든 원격 측정 데이터를 포괄하는 표준화된 프레임워크입니다. 이는 MSA, 쿠버네티스, 클라우드 네이티브 환경에서 안정성과 성능 최적화를 추구하는 IT 전문가와 의사결정자에게 중요한 이정표가 됩니다.

여기에 붙은 “Open”이라는 수식어는 오픈소스와 벤더 중립성을 의미합니다. OpenTelemetry는 표준화된 API, SDK, 계측 도구를 제공하여 특정 벤더에 종속되지 않고 다양한 백엔드로 데이터를 내보낼 수 있게 합니다. 덕분에 기업은 공급업체에 의존하지 않고 자체적인 관찰 가능성 체계를 구축할 수 있습니다. 또한 언어별 라이브러리, 자동 계측 도구, Collector를 제공해 개발자가 복잡한 애플리케이션을 손쉽게 계측할 수 있도록 지원합니다.

따라서 OpenTelemetry라는 이름은 “원격에서 수집된 데이터를 개방형 표준을 통해 전송·활용하는 프레임워크”라는 의미를 담고 있습니다. 이는 단순한 분산 추적을 넘어 로그와 메트릭을 포함한 모든 텔레메트리 데이터를 다루려는 의도와, 커뮤니티 주도의 오픈소스 표준이라는 철학이 결합된 결과입니다. 그 결과 OpenTelemetry는 오늘날 MSA와 클라우드 네이티브 환경에서 관찰 가능성의 사실상 표준으로 자리매김하게 되었습니다.