EngineeringFull-time

Data Pipeline Manager

제2판교 IT센터
상시 채용

직군 소개

좋은 모델보다 먼저 필요한 것은 좋은 데이터와 좋은 평가 체계입니다.

WoRV의 Data & Evaluation Manager는 데이터를 쌓는 사람이 아니라, 데이터 파이프라인 전반을 설계하고 책임지는 사람입니다. 어떤 데이터가 있어야 제품이 더 좋아지는지, 무엇을 기준으로 "출시 가능"하다고 말할 수 있는지 정의하고, 그 기준에 맞춰 수집-정제-평가의 전체 흐름을 운영합니다.

WoRV는 양질의 데이터를 신속하게 취득하기 위한 최선의 방법을 끊임없이 찾습니다. GPS 기반 반자율주행으로 현장 플릿을 운영해 실데이터를 수집할 수도 있고, VLA 모델 기반 자율주행의 운영 데이터를 활용할 수도 있습니다. 수집 방법은 고정되지 않습니다. 이 포지션은 데이터 플라이휠의 첫 사이클을 정의하고 가속하는 것이 본질이며, 리서치팀(VLA/VLM)이 필요로 하는 데이터와 고객 현장에서 수집 가능한 데이터 사이의 간극을 메우는 역할입니다.

현재 WoRV는 농업, 건설, 항만 등 복수의 산업 프로젝트에서 동시에 데이터를 수집하고 있습니다. 각 프로젝트의 데이터가 개별 프로젝트에 그치지 않고 팀 전체의 모델 역량으로 축적되려면, 표준화된 포맷, 메타데이터 체계, 품질 기준, 수집 효율 관리가 필요합니다. 이 전체를 총괄하는 것이 Data & Evaluation Manager입니다.

주요 업무

1. 데이터 파이프라인 총괄

  • 현장 데이터 수집 전략을 수립하고, 수집 효율(준비시간 대비 유효 데이터 비율)을 극대화합니다.
  • 센서/텔레오퍼레이션/현장 운영 데이터의 End-to-End 파이프라인을 설계하고 운영합니다.
  • 데이터 스키마, 버저닝, 메타데이터 체계, 표준 포맷(LeRobot 등)을 정의합니다.
  • 저장 인프라(DGX SSD, NAS HDD 등)와 학습 데이터의 라이프사이클을 관리합니다.

2. 평가 체계 설계 및 운영

  • 고객별 KPI와 제품 공통 KPI를 구분한 평가 프레임워크를 만듭니다.
  • 모델/모듈/시스템 레벨의 offline-online evaluation을 연결합니다.
  • "데이터 → 모델 성능" 관계를 정량적으로 증명하는 실험 체계를 구축합니다.
  • 실패 케이스를 발굴하고 재학습/재평가 루프를 설계합니다.

3. 프로젝트 간 데이터 전략 연결

  • 복수 프로젝트(Navigation, Manipulation)의 데이터 수집 우선순위를 조율합니다.
  • 리서치팀과 협업해 수집 시나리오와 토픽을 정의합니다.
  • 개별 프로젝트의 데이터가 공통 모델 역량으로 축적되는 구조를 만듭니다.
  • 데이터 소유권과 활용 범위에 대한 고객사 계약 구조를 PM과 함께 설계합니다.

자격 요건

  • 데이터 파이프라인 또는 데이터 플랫폼을 설계하고 운영해본 경험이 있는 분
  • 데이터 수집 전략을 수립하고, 현장 운영까지 연결해본 분
  • "무엇을 수집해야 하는가"를 문제 중심으로 판단할 수 있는 분
  • metric을 만들고, metric이 잘못된 방향으로 팀을 끌고 가지 않게 설계할 수 있는 분
  • 리서치팀, PM, 현장 운영 등 여러 이해관계자와 소통하며 우선순위를 조율할 수 있는 분
  • Python, SQL 등 데이터 처리 역량이 있으신 분

우대 사항

  • CV/Robotics/Autonomous Driving 데이터셋 구축 및 운영 경험
  • Labeling ops, taxonomy design, annotation quality control 경험
  • Evaluation harness, benchmark, experiment tracking 경험
  • 다중 모달 센서 데이터(카메라, LiDAR, IMU 등) 처리 경험
  • Active learning / hard case mining / data flywheel 경험
  • HuggingFace 생태계 (LeRobot, Datasets 등) 활용 경험
  • MLOps / 데이터 인프라 구축 경험
  • 데이터 팀 리드 또는 매니징 경험

이런 분을 찾습니다

  • 모델 학습보다 데이터 설계를 더 중요하게 볼 수 있는 분
  • "왜 이 데이터가 없어서 실패했는가?"를 집요하게 파고드는 분
  • 수집 현장과 학습 서버 사이의 전체 흐름을 한 눈에 보고 병목을 찾을 수 있는 분
  • 데이터를 자산으로 바라보고, 재활용 가능한 구조를 설계하려는 분

채용 프로세스

1
서류 전형
2
1차 면접
기술 면접
3
2차 면접
컬처핏 면접
4
처우 협의
5
최종 합류

* 서류전형 합격 여부는 3일 이내로 개별 연락 드립니다

데이터 플라이휠의 첫 사이클을 정의하고 돌릴 매니저를 찾습니다