컴퓨터 비전이란 무엇입니까?
컴퓨터 비전이 중요한 이유는 무엇인가요?
시각 정보 처리 기술이 등장한 지는 꽤 오래되었지만 대부분의 프로세스에 인간이 직접 개입해야 했고 시간 소모가 심했을 뿐 아니라 오류가 발생하기도 쉬웠습니다. 예를 들어 과거에는 안면 인식 시스템을 구현하려면 개발자가 수천 개의 이미지에 콧등의 너비, 눈 사이의 거리와 같은 주요 데이터 포인트를 수동으로 태그해야 했습니다. 이미지 데이터는 구조화되지 않고 컴퓨터가 구성하기에 복잡하기 때문에 이러한 작업을 자동화하려면 광범위한 컴퓨팅 성능이 필요했습니다. 따라서 비전 애플리케이션은 비용이 많이 들고 대부분의 조직이 사용하기에는 어려움이 많았습니다.
오늘날 이 분야의 발전과 컴퓨팅 능력의 엄청난 발전이 합쳐져 이미지 데이터 처리의 규모와 정확도가 모두 향상되었습니다. 클라우드 컴퓨팅 리소스로 구동되는 컴퓨터 비전 시스템은 이제 누구나 이용할 수 있습니다. 모든 조직이 신원 증명 확인, 콘텐츠 조정, 스트리밍 비디오 분석, 장애 감지 등에 이 기술을 사용할 수 있습니다.
사용 사례
컴퓨터 비전은 어떻게 작동하나요?
컴퓨터 비전 시스템은 인공 지능(AI) 기술을 사용하여 객체 인식 및 객체 분류를 담당하는 인간 두뇌의 기능을 모방합니다. 컴퓨터 과학자는 방대한 양의 정보를 입력하여 컴퓨터가 시각적 데이터를 인식하도록 훈련합니다. 기계 학습(ML) 알고리즘은 이러한 이미지 또는 비디오에서 일반적인 패턴을 식별하고 해당 지식을 적용하여 알 수 없는 이미지를 정확하게 식별합니다. 예를 들어 컴퓨터가 수백만 개의 자동차 이미지를 처리할 경우, 컴퓨터는 이미지에서 차량을 정확하게 탐지할 수 있는 식별 패턴을 구축하기 시작할 것입니다. 컴퓨터 비전은 아래와 같은 기술을 사용합니다.
컨볼루션 신경망
합성곱 신경망(CNN)은 레이블 지정 시스템을 활용하여 시각적 데이터를 분류하고 전체 이미지를 이해합니다. 이미지를 픽셀로 분석하고 각 픽셀에 레이블 값을 부여합니다. 이 값이 입력되면 컨볼루션이라는 수학 연산 수행 후 이미지에 대한 예측을 수행합니다. 사람이 멀리 있는 물체를 인식하려는 것처럼 CNN은 색상, 내부 형태 및 질감과 같은 추가 세부 정보를 채우기 전에 먼저 윤곽선과 단순한 모양을 식별합니다. 마지막으로 예측 프로세스를 여러 번 반복하여 정확도를 높입니다.
순환 신경망
순환 신경망(RNN)은 CNN과 유사하지만 일련의 이미지를 처리하여 이미지 사이의 연관성을 찾아낼 수 있습니다. CNN은 단일 이미지 분석에 사용되는 반면 RNN은 비디오를 분석하고 이미지 간의 관계를 이해할 수 있습니다.
컴퓨터 비전과 이미지 처리의 차이점은 무엇인가요?
이미지 처리는 알고리즘을 사용하여 선명화, 다듬기, 필터링 또는 향상 등의 이미지 변경 작업을 진행합니다. 컴퓨터 비전은 이미지를 변경하지 않고 레이블 지정과 같은 작업을 보고 수행하는 대상을 이해한다는 점에서 다릅니다. 경우에 따라 컴퓨터 비전 시스템이 이미지를 더 잘 이해할 수 있도록 이미지 처리를 사용하여 이미지를 수정할 수 있습니다. 컴퓨터 비전을 사용하여 이미지나 이미지의 일부를 식별한 다음 이미지 처리를 사용하여 이미지를 추가로 수정하는 경우도 있습니다.
컴퓨터 비전이 수행할 수 있는 일반적인 작업은 무엇인가요?
이미지 분류
이미지 분류를 통해 컴퓨터는 이미지를 보고 해당 이미지가 속한 클래스를 정확하게 분류할 수 있습니다. 컴퓨터 비전은 클래스를 이해하고 이에 나무, 비행기, 건물과 같은 레이블을 지정합니다. 일례로 카메라가 사진 속 얼굴을 인식하여 초점을 맞출 수 있습니다.
개체 탐지
개체 탐지는 이미지를 감지하고 위치를 파악하기 위한 컴퓨터 비전 작업입니다. 분류를 사용하여 이미지를 식별, 정렬 및 구성합니다. 개체 탐지는 산업 및 제조 공정에서 자율 애플리케이션을 제어하고 생산 라인을 모니터링하는 데 사용됩니다. 커넥티드 홈 카메라 제조업체 및 서비스 제공업체는 또한 개체 탐지 기능을 활용하여 카메라의 라이브 비디오 스트림을 처리하여 사람과 물체를 실시간으로 감지하고 최종 사용자에게 실행 가능한 경고를 제공합니다.
객체 추적
객체 추적은 딥러닝 모델을 사용하여 범주에 속하는 항목을 식별하고 추적합니다. 이 기능은 여러 분야에 걸쳐 실제 생활에 사용되고 있습니다. 객체 추적의 첫 번째 요소는 개체 탐지입니다. 객체 주변에 경계 상자가 생성되고 객체 ID가 부여되며 프레임을 통해 추적할 수 있습니다. 예를 들어, 객체 추적은 도시 환경에서 교통 모니터링, 인간 감시 및 의료 영상에 활용될 수 있습니다.
세그멘테이션
세그멘테이션은 보이는 픽셀을 기준으로 물체의 이미지를 여러 영역으로 나누어 물체를 식별하는 컴퓨터 비전 알고리즘입니다. 세그멘테이션은 또한 항목의 모양이나 윤곽선을 배치하여 그것이 무엇인지 결정하는 등 이미지를 단순화합니다. 이를 통해 세그멘테이션은 이미지 또는 프레임에 하나 이상의 객체가 있는지 여부도 인식합니다.
예를 들어 영상에 고양이와 개가 있는 경우 세그멘테이션을 사용하여 두 동물을 인식할 수 있습니다. 개체 탐지와 달리, 세그멘테이션은 객체의 주변에 상자를 생성하는 대신 픽셀을 추적하여 객체의 모양을 결정하기 때문에 분석과 레이블 지정이 더 쉬워집니다.
콘텐츠 기반 이미지 검색
콘텐츠 기반 이미지 검색은 대규모 데이터베이스에서 특정 디지털 이미지를 검색할 수 있는 컴퓨터 비전 기술을 응용한 것입니다. 태그, 설명, 레이블 및 키워드와 같은 메타데이터를 분석합니다. 의미 체계 검색은 '건물 사진 찾기'와 같은 명령을 사용하여 적절한 콘텐츠를 검색합니다.
AWS는 어떻게 컴퓨터 비전 작업을 지원하나요?
AWS는 고객의 전문 지식 수준에 상관 없이 모든 포괄적인 데이터 소스 세트에 연결된 가장 광범위하고 완전한 인공 지능 및 기계 학습(AI/ML) 서비스 세트를 제공합니다.
프레임워크를 기반으로 구축하고 자체 인프라를 관리하는 고객을 위해 PyTorch, MXNet, TensorFlow를 비롯한 가장 인기 있는 딥 러닝 프레임워크의 버전을 최적화합니다. AWS는 사용자의 고유한 성능 및 예산 요구를 충족할 수 있도록 프로세서 및 액셀러레이터를 선택하여 광범위하고 심층적인 컴퓨팅, 네트워킹 및 스토리지 인프라 ML 서비스 포트폴리오를 제공합니다.
비즈니스 전반에 걸쳐 표준 컴퓨터 비전 솔루션을 만들려는 고객을 위해 Amazon SageMaker는 비즈니스 분석가를 위한 노코드 제품을 비롯한 완전관리형 인프라, 도구 및 워크플로를 통해 모든 사용 사례에 맞게 데이터를 쉽게 준비하고 ML 모델을 구축, 훈련 및 배포할 수 있도록 합니다.
ML 기술이 부족하거나 시장 출시 시간을 단축하려는 고객 또는 기존 프로세스 또는 애플리케이션에 인텔리전스를 추가하려는 고객을 위해 AWS는 다양한 ML 기반 컴퓨터 비전 서비스를 제공합니다. 이러한 서비스를 사용하면 사전 학습된 API를 통해 AI 애플리케이션에 인텔리전스를 쉽게 추가할 수 있습니다. Amazon Rekognition은 ML로 이미지 및 비디오 분석을 자동화하고 수백만 개의 이미지, 라이브 스트림 및 저장된 비디오를 몇 초 만에 분석합니다.
지금 바로 무료 AWS 계정을 생성하여 컴퓨터 비전을 시작해 보세요.