(주)엠엔디시스템 (시스템개발문의: 055-385-4832)

스마트공장에 AI를 적용하려면 데이터 수집이 먼저다 본문

스마트공장및개발

스마트공장에 AI를 적용하려면 데이터 수집이 먼저다

dev@mndsystem 2026. 5. 23. 18:07

AI는 도구일 뿐입니다. 그 도구를 제대로 쓰게 해주는 건 결국 현장에서 쌓인 데이터입니다.

요즘 제조 현장에서 AI 도입 얘기가 부쩍 많아졌습니다. 불량을 자동으로 잡아내고, 생산 스케줄을 AI가 짜고, 설비 고장을 미리 예측한다는 이야기를 들으면 솔깃하지 않을 수 없죠. 그런데 막상 도입을 추진하다 보면 생각보다 많은 분들이 벽에 부딪힙니다. AI 알고리즘이 부족해서가 아닙니다. AI가 학습할 데이터가 없어서입니다.

AI는 데이터로 만들어진다

AI를 사람에 비유하면 이해가 쉽습니다. 숙련된 작업자가 불량을 잘 잡아내는 이유는 수년간 수천 개의 제품을 눈으로 보고, 손으로 만져보고, 경험으로 쌓아온 기준이 있기 때문입니다. AI도 똑같습니다. 수많은 데이터를 학습하면서 "이건 정상, 이건 불량"이라는 판단 기준을 스스로 만들어 냅니다.

문제는 AI에게 학습할 데이터를 주지 않으면서 "스스로 판단하라"고 요구하는 데 있습니다. 신입사원을 아무런 교육 없이 바로 현장에 투입하는 것과 다를 게 없습니다.

"쓸만한 AI 모델 하나를 만들려면, 그 전에 쓸만한 데이터 파이프라인이 먼저 있어야 한다."
실제로 AI 프로젝트에서 전체 시간의 60~80%는 데이터 수집과 정제에 쓰입니다. 알고리즘 개발에는 그 나머지만 투입됩니다. 현장에서 "AI 만드는 데 왜 이렇게 오래 걸리냐"고 하실 때, 대부분의 이유는 여기에 있습니다.

스마트공장에서 데이터 수집이 특히 중요한 이유

일반적인 AI 서비스와 달리, 제조 현장의 AI는 몇 가지 특수한 조건을 가집니다.

  • 1
    현장마다 데이터가 다르다.
    A 공장의 코팅 불량 데이터가 B 공장에 그대로 적용되지 않습니다. 설비가 다르고, 원자재가 다르고, 환경이 다릅니다. 일반화된 AI 모델을 가져와도 현장 데이터로 재학습(Fine-tuning)하지 않으면 제대로 동작하지 않습니다.
  • 2
    불량 데이터는 수가 적다.
    잘 만들어진 공장일수록 불량이 드물게 발생합니다. 정상 데이터 1,000개에 불량 데이터 5개라면, AI는 "그냥 다 정상이라고 하면 정확도 99.5%"라는 엉터리 결론을 내놓습니다. 오랜 기간 데이터를 쌓아야 충분한 불량 샘플을 확보할 수 있습니다.
  • 3
    실시간성이 요구된다.
    스마트공장의 AI는 느긋하게 분석할 시간이 없습니다. 코팅 라인이 분당 수십 미터를 달리는 동안, 카메라가 찍고, AI가 판단하고, 불량 위치를 재단 공정에 전달하는 게 1초 안에 이루어져야 합니다. 이를 위한 데이터 파이프라인 설계는 처음부터 체계적으로 준비되어야 합니다.
  • 4
    설비와 공정 데이터가 연결되어야 한다.
    비전 카메라로 불량을 잡아낸다고 끝이 아닙니다. "언제, 어느 설비에서, 어떤 공정 조건(온도·속도·장력)에서 이 불량이 발생했는가"를 연결해야 원인 분석이 가능합니다. 이를 위해 PLC, 센서, MES 데이터가 함께 수집되고 시간 동기화되어야 합니다.
  • 5
    AI는 계속 학습해야 한다.
    처음 만든 모델이 영원히 잘 동작하지 않습니다. 원자재가 바뀌고, 설비가 노후화되고, 계절이 바뀌면 데이터 분포가 달라집니다. 지속적으로 새 데이터를 수집하고 모델을 재학습하는 체계가 없으면 AI 성능은 시간이 지날수록 떨어집니다.

 

어떤 데이터를 수집해야 하는가

무작정 데이터를 많이 쌓는 것도 답이 아닙니다. 목적에 맞는 데이터를 체계적으로 수집하는 게 핵심입니다.

데이터 종류수집 수단활용 AI

제품 외관 이미지 라인 카메라, 비전 시스템 불량 검출, 표면 품질 판정
설비 센서값 PLC, IoT 센서, OPC-UA 예지보전, 이상 탐지
공정 파라미터 SCADA, MES 연동 공정 최적화, 수율 예측
생산 실적 이력 MES, 작업일보 생산 계획 최적화
불량 유형 및 원인 작업자 입력, 검사 시스템 불량 분류, 원인 추적
온·습도, 환경 데이터 환경 센서 품질 영향인자 분석

 

그렇다면 어떻게 시작해야 하는가

AI 도입보다 데이터 수집 인프라를 먼저 구축해야 합니다. 단계별로 접근하는 게 현실적입니다.

1단계 — 지금 당장 데이터를 쌓기 시작한다

AI가 없어도 괜찮습니다. 지금부터 PLC 데이터, 카메라 영상, 작업일보를 디지털로 저장하는 것만으로도 충분한 출발점이 됩니다. 데이터는 시간이 자산입니다. 1년 뒤에 쌓인 데이터로 만드는 AI와 지금 데이터 없이 만드는 AI는 성능이 하늘과 땅 차이입니다.

2단계 — MES로 데이터를 한곳에 모은다

각기 다른 설비에서 각자 따로 쌓이는 데이터는 연결이 안 됩니다. MES(제조실행시스템)를 중심으로 생산 실적, 품질 데이터, 설비 데이터를 한 곳에 모아야 AI가 종합적인 판단을 할 수 있습니다. 데이터 사일로(Data Silo)를 없애는 것이 AI 도입의 선결 조건입니다.

3단계 — 라벨링(Labeling)을 체계화한다

쌓인 데이터가 있어도, "이 이미지가 불량인지 아닌지" 정답(라벨)을 붙여주는 작업이 없으면 AI 학습이 불가능합니다. 숙련 작업자와 함께 불량 기준을 명문화하고, 수집된 데이터에 라벨을 붙이는 체계를 만드는 것이 중요합니다.

4단계 — 그다음에 AI를 붙인다

1~3단계가 어느 정도 갖춰지면, 그때 AI 모델을 붙이는 게 맞습니다. 탄탄한 데이터 위에서 만들어진 AI는 현장 신뢰를 얻고 실제로 작동합니다.

핵심 요약

솔직히..스마트공장에 갑자기 AI바람이 분것은 사실이지만...AI기술은 현장의 마법이 아닙니다.
현장 데이터를 먹고 자라는 학습 기계입니다.

스마트공장에 AI를 성공적으로 적용하려면, 정말로 철처한 데이터 수집 환경이 선행되어야 합니다...정규화가 매우 중요하거든요...
AI 도입보다 데이터 수집 인프라를 먼저 설계해야 합니다.
데이터가 없으면 AI도 없습니다.