머신러닝 엔지니어

이루다 · 정규직

스캐터랩은 다양한 형태의 인공지능이 출현하고 인공지능과 사람이 함께 어우러져 살아가는 미래를 꿈꾸고 있어요. 그래서 우리의 비전은 Leading Cambrian Explosion of Social Agents 입니다. 이러한 비전을 위해 우리는 친근하고 재밌는 자유 대화 경험을 제공하는 딥러닝 기술을 제품화하고, 사람들의 마음을 움직이는 대화는 무엇인지에 대한 깊은 고민을 해나가고 있어요.

현재 스캐터랩의 주요 목표는 200만 명의 AI 친구 '이루다'를 넘어, 다양한 영역의 기업과 크리에이터들이 루다와 같은 AI 캐릭터를 쉽고 빠르게 제작할 수 있도록 돕는 기술과 방법론을 제공하는 거예요. 그래서 우리는 루다를 만들어온 스캐터랩만의 기술력과 제품 노하우를 집대성한 플랫폼인 '핑퐁 스튜디오'를 만들었어요. 현재 핑퐁 스튜디오를 활용해 여러 비즈니스 파트너들과 다양한 AI 캐릭터를 만들고 운영하고 있답니다. 특히 소셜 인터랙션이 중요한 영역인 연예·엔터테인먼트, 게임·콘텐츠, 소셜 커머스, 소셜 케어, 소셜 교육 이렇게 다섯 분야에서 활약하고 있어요.

스캐터랩에는 '누구나 원하는 AI 캐릭터를 쉽고 빠르게 만들 수 있게 하겠다'는 공동의 목표를 중심으로 뛰어난 능력, 훌륭한 팀워크, 문제에 대한 소명의식을 가진 사람들이 모여있어요! 여러분도 그런 사람이라면, 스캐터랩에서 우리 함께 이 문제를 풀어보지 않을래요?

Q. 루다팀의 머신러닝 엔지니어는 어떤 일을 하나요?

루다팀의 머신러닝 엔지니어는 다양한 범위의 업무를 맡고 있어요. 머신러닝 리서처 분들과 함께 모델을 설계하여 구현하기도 하고, 효율적으로 학습할 수 있도록 최적화하기도 해요. 그뿐만 아니라, 반복적이고 복잡한 ML 작업을 위한 파이프라인을 만들기도 하고, 만들어진 모델을 빠른 속도로 추론하는 서버를 구축하기도 해요. 당연히 한 사람이 이 일들을 모두 동시에 할 수는 없겠죠? 팀원들이 각자의 선호도와 강점에 따라 업무를 맡고 있고, 그 과정에서 나온 경험들을 서로 공유하며 다함께 성장하고 있어요. 각 분야에서 강점을 드러내실 수 있는 분들을 찾고 있으니, 아래의 주요 업무 중 한 가지라도 자신 있다면 부담없이 지원해주세요!

주요 업무

  • 데이터 전처리 및 모델 학습 Keywords: Python, TensorFlow, PyTorch, DeepSpeed, TPU
    • 대량의 데이터를 효과적으로 정제할 수 있는 로직을 구현합니다.
    • 비효율적인 로직이나 병목 지점 없이 모델을 효율적으로 학습할 수 있는 코드를 구현합니다.
    • 멀티 노드 GPU나 TPU 환경에서 효과적으로 학습할 수 있도록 코드를 프로파일링하고 연산을 최적화합니다.
  • ML 파이프라인 및 MLOps 시스템 구축 Keywords: Kubeflow Pipelines, MLFlow, TensorBoard, AWS, GCP, Docker, Kubernetes
    • 모델 학습 및 실험을 쉽고 빠르게 수행할 수 있도록 데이터 전처리, 학습, 실험 파이프라인을 개발합니다.
    • 데이터셋을 잘 관리하고 각 학습 실험 결과를 쉽게 기록하고 비교할 수 있는 실험 추적 시스템을 개발합니다.
  • 모델 추론 서버 구축 Keywords: TensorFlow Serving, TorchServe, Faiss, ScaNN, ONNX Serving, RESTful API, gRPC
    • 학습시킨 모델을 효율적으로 서빙할 수 있는 모델 추론 서버를 구축합니다.
    • 수백만 개 이상의 답변 후보 중 최적의 답변을 빠른 속도로 찾기 위한 벡터 유사도 검색 기법들을 연구하고, 대규모 트래픽에도 안정적으로 서비스할 수 있는 서버를 구축합니다.
  • 딥러닝 모델 경량화 · 최적화 Keywords: Distillation, Quantization, Pruning
    • 딥러닝 모델 자체의 성능을 떨어뜨리지 않으면서 크기와 연산량을 Distillation, Quantization, Pruning 등의 기법을 통해 최적화합니다.
    • 모델과 딥러닝에 대한 이해를 바탕으로 적합한 최적화 방법을 찾아서 적용하는 일로, 다른 업무에 비해 ML에 대한 이해가 조금 더 필요합니다.

필수 역량

  • Python에 능숙하신 분
  • PyTorch, TensorFlow 를 이용한 ML 프로젝트 개발 경험이 있으신 분
  • OS, Network를 중심으로 컴퓨터공학에 대한 기본 지식이 탄탄하신 분
  • 테스트 코드에 엄격하신 분

우대 역량

  • ML 관련 Low Latency API 개발 경험이 있으신 분
  • Container 기술에 익숙하신 분 (Docker, Kubernetes)
  • 클라우드 환경에서 서비스를 운영해보신 경험이 있으신 분 (AWS, GCP, Azure)
  • 머신러닝 파이프라인 구축 경험이 있으신 분 (Airflow, Kubeflow Pipelines)
  • Java, Go, C++를 사용한 프로젝트 경험이 있으신 분
  • 멀티 노드 GPU/TPU 환경에서 대형 모델을 학습한 경험이 있으신 분
  • 논문을 읽고 구현한 경험이 있으신 분

채용 과정

  • 서류 심사 → 알고리즘 코딩테스트 → NLP 기술과제 → 직무 면접 → 컬처핏 면접 → 최종 합격
  • 3개월의 수습 기간 후 정식 채용을 결정합니다.
  • 전형에 따른 결과는 지원자님의 메일로 전달되오니, 지원 후 꼭 메일함을 확인해주세요.

지원 방법

  • recruit@scatterlab.co.kr이력서를 PDF 파일로 보내주세요.
  • 이력서는 자유로운 형식으로 보내주시되, 이 역할을 잘 해낼 수 있는 분이라는 걸 보여주는 관련 프로젝트 및 실무 경험을 설명과 함께 보내주시면 좋을 것 같아요. GitHub, 블로그 등의 정보도 함께 보내주시면 더 좋답니다.
  • 메일 제목은 ‘[루다/MLE] 지원자 이름’ 형식으로 부탁드립니다.
  • 스캐터랩은 산업기능요원 및 전문연구요원 지정업체로 병역 특례 신규 편입 및 전직이 가능합니다. 해당되는 분은 지원 메일을 통해 말씀해주세요.