데이터 공유란 무엇인가요?

데이터 공유는 여러 애플리케이션, 사용자 또는 조직에서 동일한 데이터 리소스를 사용할 수 있도록 하는 프로세스입니다. 여기에는 데이터 무결성에 영향을 주지 않으면서 여러 주체에게 안전한 데이터 액세스를 지원하는 기술, 관행, 법적 프레임워크 및 문화적 요소가 포함됩니다. 데이터 공유는 조직 내 효율성을 향상시키고 공급업체 및 파트너와의 협업을 촉진합니다. 공유 데이터의 위험과 기회에 대해 인식하는 것은 프로세스에 있어 필수적인 과정입니다.

기업에게 데이터 공유가 중요한 이유는 무엇인가요?

조직들은 인터넷이 등장하기 전부터 데이터를 공유해왔습니다. 하지만 디지털 활용 능력, 기술 및 클라우드 도입의 발전으로, 전례 없는 규모로 데이터가 공유되고 있습니다. 다음은 데이터 공유의 성장에 기여한 세 가지 주요 요인입니다.

  • 데이터 스토리지, 프로세싱 및 전송 기술의 가용성과 경제성의 점진적 개선
  • 데이터를 리소스와 자산으로 취급하는 새로운 산업 마인드
  • 데이터 공유의 위험을 줄이는 것을 목표로 하게 된 정책과 규정의 변화

오늘날 기업들은 데이터 공유가 지역 사회 관계 개선과 새로운 비즈니스 기회 창출에 필수적인 요소라는 사실을 알고 있습니다. 아래에는 몇 가지 이점이 요약되어 있습니다.

고객에게 더 나은 가치 제공

여러 데이터 소스의 정보를 결합하면 서비스의 가치와 성능을 모두 높일 수 있습니다. 이 같은 접근 방식은 연구와 제품 개발의 발전을 촉진합니다. 예를 들어 Warner Bros의 비디오 게임 사업부인 WB Games는 데이터 공유를 사용하여 게임 개발의 창작 과정을 안내합니다. WB Games는 인사이트를 포착, 수집, 분석 및 적용함으로써 개발자가 스토리텔링에 보다 시기 적절하고 민첩하게 접근할 수 있도록 합니다.

WB Games의 AWS 사용 사례 보기 »

데이터 중심의 의사 결정

정보를 투명하게 공유함으로써 팀은 데이터 사일로를 없애고 분석을 개선하는 데 기여합니다. 비즈니스 인텔리전스가 개선되고 이해 관계자가 효과적인 장기적 의사 결정을 내립니다. 예를 들어 GE Renewable Energy는 전 세계적으로 4만 9,000개 이상의 풍력 발전용 터빈을 설치하여 풍력 발전을 하고 있습니다. GE 터빈에는 센서가 장착되어 있으며, 온도, 풍속, 전기 등 터빈 성능과 관련한 요인에 대한 데이터를 수집하는 고급 네트워크에 연결되어 있습니다. GE 데이터 분석 시스템은 터빈 유지 보수 및 생산성과 관련한 의사 결정을 지원합니다.

GE의 AWS 사용 사례 보기 »

긍정적인 사회적 영향

공공 기관과 조직들이 더 많은 데이터를 안전하고 합법적이며 정당한 방식으로 공유할 수 있습니다. 이는 이들이 소속된 지역 사회에 이익이 되는 협업의 기회를 새롭게 창출합니다. 예를 들어 보건 분야의 데이터 공유 노력은 의학 연구에 긍정적으로 기여하여, 게놈 연구 분야에서 엄청난 발전을 가져오고 있습니다.

유전체학 산업의 AWS 사용 사례 보기 »

데이터 공유의 위험 요인은 어떤 것들이 있나요?

데이터 노출은 규제, 경쟁, 재정 및 보안상의 위험을 초래할 수 있습니다. 아래에는 몇 가지 중요한 위협이 요약되어 있습니다.

개인 정보 노출

모든 조직은 자신이 소유한 고객 데이터의 개인 정보를 보호해야 할 법적, 윤리적 의무가 있습니다. 따라서 프라이버시를 침해하지 않고 데이터를 공유할 수 있도록 적절한 조치를 취해야 합니다. 암호화 및 검열과 같은 개인 정보 보호 기술을 활용하면 안전하게 데이터를 공유할 수 있습니다.

데이터 조작

데이터 생산자와 소비자 간의 의사 소통 부족은 분석상의 오류를 초래할 수 있습니다. 분석가가 보고서와 결과를 설명할 때 잘못된 가정을 할 수 있습니다. 예를 들어 특정 달에 고객 주문이 감소하는 원인을 마케팅 예산 축소 탓으로 돌리는데, 제품 재고 확보 지연이 실제 원인일 수 있습니다.

낮은 데이터 품질

데이터 소비자가 데이터의 품질과 가용성을 관리하는 데는 한계가 있습니다. 그런데 데이터 누락 또는 중복, 유효성에 대한 질문, 데이터 문서 부족 및 이와 유사한 문제를 해결해야 할 수 있습니다. 특정 성별, 인종, 종교 또는 민족 집단에 대한 드러나지 않는 편견이 데이터 세트에 존재할 수도 있습니다.

데이터 공유 기술은 어떤 것들이 있나요?

생산자와 소비자 간의 마찰을 줄이고, 위험을 완화하며, 데이터 공유의 가치를 높이는 기술이 많이 있습니다. 다음은 몇 가지 예입니다.

데이터 웨어하우징

데이터 웨어하우스는 여러 사업부의 데이터를 저장하는 중앙 리포지토리입니다. 데이터 웨어하우스 아키텍처는 티어로 구성됩니다. 상단 티어는 보고, 분석 및 데이터 마이닝 도구를 통해 결과를 제시하는 프런트 엔드 클라이언트입니다. 중간 티어는 데이터를 액세스하고 분석하는 데 사용되는 분석 엔진으로 구성됩니다. 아키텍처의 최하위 티어는 데이터가 로드되고 저장되는 데이터베이스 서버입니다. 최상위 티어 및 중간 티어 애플리케이션은 최하위 티어에 저장된 공용 데이터 세트를 공유할 수 있습니다.

데이터 웨어하우스는 내부 데이터 공유에 유용합니다. 공유 데이터에 액세스하는 워크로드를 서로 격리할 수 있습니다.

API

API는 정의 및 프로토콜 집합을 사용하여 두 소프트웨어 구성 요소가 서로 통신할 수 있게 하는 메커니즘입니다. 인터페이스는 두 애플리케이션 간의 서비스 계약이라고 할 수 있습니다. 이 계약은 요청과 응답을 사용하여 두 애플리케이션이 통신하는 방법을 정의합니다. 데이터 공유 API는 세분화된 액세스 제어를 지원하며, 소비자가 요청할 수 있는 데이터를 정확하게 지정합니다.

API에 대해 읽어보기 »

페더레이션 학습

페더레이션 학습은 인공 지능 시스템이 분산된 데이터 세트를 사용하여 훈련할 수 있도록 하는 기계 학습(ML) 기술입니다. 데이터 생산자는 데이터에 대한 통제 권한을 유지하면서 협업 기술 발전에 기여합니다. 예를 들어 암을 감지하는 ML 알고리즘은 다양한 의료 기관의 암 조직 이미지를 사용하여 훈련합니다.

기계 학습에 대해 읽어보기 »

블록체인 기술

블록체인 기술은 비즈니스 네트워크 내에서 정보를 투명하게 공유할 수 있도록 하는 고급 데이터베이스 메커니즘입니다. 블록체인 데이터베이스는 연쇄적으로 연결된 블록에 데이터를 저장합니다. 네트워크의 합의 없이 체인을 삭제하거나 수정할 수 없으므로 이 데이터는 시간 순서대로 일관성이 있습니다. 그 결과 블록체인 기술을 사용하여 주문, 결제, 계정, 기타 트랜잭션을 추적하기 위해 불변하거나 변경 불가능한 원장을 생성할 수 있습니다. 아울러 이 시스템에는 무단 트랜잭션 항목을 방지하고 이러한 트랜잭션의 공유 보기에서 일관되게 생성하는 기본 제공 메커니즘이 있습니다.

블록체인에 대해 읽어보기 »

데이터 교환 플랫폼

개방형 데이터 플랫폼은 여러 주체가 자신의 데이터 세트를 공용으로 등록할 수 있게 해주므로, 데이터 생산자는 데이터를 준비하고 제출하기만 하면 됩니다. 이 플랫폼은 저장과 액세스를 위한 인프라를 제공합니다. 누구나 데이터에 액세스할 수 있습니다.

AWS는 데이터 공유 작업을 어떻게 지원할 수 있나요?

AWS에서 데이터를 공유하면 누구나 데이터를 분석하고 다양한 컴퓨팅 및 데이터 분석 제품을 사용해 데이터를 기반으로 서비스를 구축할 수 있습니다. 이러한 데이터 분석 제품으로는 Amazon Cloud Compute(Amazon EC2), Amazon Athena, AWS Lambda, Amazon EMR 등이 있습니다. 클라우드에서 데이터를 공유하면 사용자가 데이터 확보가 아닌 데이터 분석에 더 많은 시간을 할애할 수 있습니다. 아래에 몇 가지 기술의 예가 나와 있습니다.

  • Amazon Redshift는 데이터를 복사하거나 이동할 필요 없이 즉각적이고 세분화된 빠른 데이터 액세스를 수행할 수 있도록 하는 데이터 웨어하우징 기술입니다. 데이터 웨어하우스에서 업데이트될 때마다 항상 사용자에게 일관된 최신 정보가 표시됩니다.
  • Amazon Managed Blockchain은 확장 가능한 블록체인 네트워크 및 분산형 원장 기술을 손쉽게 생성하고 관리하는 데 사용할 수 있는 완전관리형 서비스입니다.
  • AWS Data Exchange를 사용하면 AWS 서비스를 통해 공개적으로 사용 가능한 데이터 세트를 손쉽게 찾을 수 있습니다.

지금 무료 계정을 만들어 AWS에서 클라우드 데이터 공유를 시작하세요.

데이터 공유 다음 단계

제품 관련 추가 리소스 확인
분석 서비스 확인 
무료 계정에 가입

AWS 프리 티어에 즉시 액세스할 수 있습니다.

가입 
콘솔에서 구축 시작

AWS Management Console에서 구축을 시작하세요.

로그인