company
사업영역내부 데이터
자체적으로 보유한 내부 파일 시스템이나
데이터베이스 관리 시스템, 센서 등에 접근하여
데이터 수집
수집 방법:
ETL( Extraction, Transformation, Loading)을 이용하여,
다양한 소스 시스템으로부터 필요한 데이터 추출(extraction) 하여
변환(Transformation) 하는 작업을 거쳐
저장하거나 분석을 담당하는 시스템으로
전송 및 적재(loading) 하는 모든 과정을 포함
외부 데이터
인터넷으로 연결된 외주에서 데이터 수집
수집 방법:
크롤링 엔진(Crawling Engine)을 이용하여, 로봇이 거미줄처럼 얽혀 있는:
인터넷 링크를 따라다니며 방문한 사이트로부터 정보를 수집
딥러닝 알고리즘에 입력 데이터로 활용되는
이미지 및 텍스트 데이터의 전처리, 어노테이션, 라벨링이 가능한 기술력 및 인력을 보유
‘AI 학습용 데이터 구축 사업’ 수행을 통해
약 300만 건 이상의 이미지 데이터 및 약 400만 건의 텍스트를 가공한 경험