데이터 포멧 종류데이터는 디스크에 파일로 저장Unstructured와 Semi-structured만 Human Readable함하려는 일에 맞게 최적화 필요UnstructuredSemi-structured (Type 정보가 없음)Structured (Type 정보가 있음)TextJSONPARQUET XMLAVRO CSVORC SequenceFileAvro : Apache에서 개발한 파일 포맷Parquet : 트위터와 클라우데라에서 공동 개발한 Hbase에 최적화된 파일 포맷이다ORC: Hive에서 개발한 Hive에 최적화된 파일 포맷Spark의 주요 파일 타입 특징CSVJSONPARQUETAVRO컬럼 스토리지XXOX압축 가능 OOOO Splittable OOOOHuman ReadableOOXXNes..