• 커뮤니티
  • 테마광장

테마광장

[빅데이터] 빅데이터 자료 유형
작성자 : 광주전남혁신플랫폼 관리자 작성일 : 2022-09-01 13:41

빅데이터 자료 유형

빅데이터의 유형

1. 정형 데이터(Structured Data)
이 유형의 데이터는 조직화와 검색이 가장 간편하여 재무 데이터, 시스템 로그, 인구통계 상세정보 등이 포함한된다. 행과 열의 레이아웃이 사전 정의된 엑셀 스프레드시트는 정형 데이터의 대표적인 예이다.
이들 데이터의 구성요소는 범주화가 용이하여 데이터베이스 설계자가 검색 및 분석 알고리즘을 간단히 정의할 수 있으나 정형 데이터는 규모가 매우 크더라도 빅데이터라고 할 수 없다.

2. 비정형 데이터(Unstructured Data)
이 범주에 속하는 데이터에는 소셜 미디어 게시글, 오디오 파일, 이미지, 주관식 고객 의견 등이 포함된다. 이러한 유형의 데이터는 표준적인 행-열 관계형 데이터베이스로 다룰 수 없어 대량의 비정형 데이터를 검색, 관리, 분석하기 위해서는 수작업 프로세스가 요구된다. 이러한 데이터를 분석하고 이해하여 얻을 수 있는 잠재적 가치는 충분히 크지만 많은 비용이 발생된다는 것이다. 또한 시간도 많이 소요되어 결과를 얻기 전에 무용지물이 되는 경우가 많다.

3. 반정형 데이터(Semi-Structured Data)
이름에서 알 수 있듯이 반정형 데이터는 정형, 비정형 데이터의 하이브리드이다. 전자메일은 이 데이터의 대표적인 예이다. 메시지 본문에는 비정형 데이터가 포함되며, 발신자, 수신자, 제목, 날짜 등 구조화된 속성을 가지고 있다. 지리태그, 타임스탬프, 시맨틱태그를 사용하는 장치도 비정형 콘텐츠와 함께 정형 데이터를 제공하고 있다. 예를 들면 , 식별되지 않은 스마트폰 이미지라도 여전히 셀카 사진이라는 사실과 촬영된 시간, 장소를 알 수 있다. AI 기술로 구동되는 최신 데이터베이스는 이러한 유형의 데이터를 즉시 식별할 수 있으며, 실시간으로 알고리즘을 생성하여 관련된 다양한 데이터 세트를 효과적으로 관리 및 분석할 수 있다.