InternshipFull-time

Machine Learning System Engineer, Intern

제2판교 IT센터

상시 채용

지원하기

Track 1: Accelerating Physical AI

VLA의 연산 구조를 이해하고 최적화하여 on-device 환경에서 동작하는 고성능 추론 엔진을 개발합니다.

연구 방향

이 트랙은 Physical AI를 위한 VLA (Vision-Language-Action) 모델이 어떤 연산 구조로 동작하는지 이해하고, 이를 on-device 환경에서 안정적으로 구동할 수 있도록 전용 런타임을 비롯한 소프트웨어 스택을 설계·구현하는 연구를 지향합니다.

입력에 따라 동적으로 변화하는 모델의 실행 특성을 분석하고, NPU의 추론 효율을 극대화할 수 있는 최적화 기법을 탐색하며, 실제 서비스 환경에서 요구되는 정확도, 지연 시간, 처리량, 메모리 사용량 사이의 균형을 맞추는 것을 목표로 합니다.

단순히 모델을 실행하는 것을 넘어 Physical AI를 실현하기 위한 고성능 추론 엔진을 직접 구현하고 고도화하는 과정을 통해 차세대 서빙 시스템이 어떤 모습일지 함께 그려나갈 수 있습니다.

이런 일을 함께 할 거예요

VLA의 구조를 이해하고 작동 원리를 파헤치기
On-device 환경에서 NPU를 활용해 모델 실행하기
성능 최적화를 위한 최신 기술 습득 및 현장 적용하기

이런 분을 찾고 있어요

C/C++, Python 등 범용 프로그래밍 언어로 원하는 기능을 구현할 수 있으신 분
ML 시스템 관련 논문을 읽고 이해할 수 있을 정도의 CS 기초 지식과 영어 능력을 가지신 분
배움에 대한 열정과 도전 정신이 있으신 분

이런 분들은 꼭꼭 지원하세요!

On-device 환경에서 생성 모델을 실행하고 최적화 해보신 분
멀티모달 언어 모델을 구현 및 최적화 해보신 분
생성 모델 서빙 최적화 기법을 적용하거나 연구해보신 분

채용 프로세스

서류 전형

기술 면접

최종 합류

WoRV ML 시스템 엔지니어 인턴에 합류하세요

VLA 모델의 연산 구조를 이해하고 최적화하여 on-device 환경에서 동작하는 고성능 추론 엔진을 개발합니다

지원하기 커피챗 신청