Apa itu tata kelola data?
Tata kelola data adalah metodologi yang memastikan agar data berada dalam kondisi yang tepat untuk mendukung inisiatif dan operasi bisnis. Menyelaraskan tata kelola data dengan inisiatif bisnis memiliki banyak manfaat.
- Mendukung pendanaan untuk program tata kelola data
- Memotivasi partisipasi komunitas bisnis
- Mendorong prioritas aktivitas tata kelola data
- Mendorong tingkat integrasi data yang diperlukan di seluruh area bisnis yang terkait
- Membantu menentukan model operasi yang tepat, terutama tingkat sentralisasi dan desentralisasi yang diperlukan.
Apa itu tata kelola analitik?
Tata kelola analitik mengatur data untuk digunakan dalam aplikasi analitik serta mengatur penggunaan sistem analitik. Tim tata kelola analitik Anda dapat menetapkan mekanisme tata kelola, seperti versioning dan dokumentasi laporan analitik. Selalu lacak persyaratan peraturan, buat kebijakan perusahaan, dan berikan pagar pembatas untuk organisasi yang lebih luas.
Mengapa tata kelola data itu penting?
Menurut Gartner, hingga tahun 2025, 80% organisasi yang ingin menskalakan bisnis digital akan mengalami kegagalan karena tidak mengambil pendekatan modern terkait tata kelola data dan analitik. Tidak mengherankan jika Chief Data Officer mengidentifikasi tata kelola data sebagai prioritas utama untuk inisiatif data mereka. Dalam survei tahun 2023 terhadap 350 CDO dan peran yang setara dengan CDO, MIT CDOIQ menemukan bahwa 45% Chief Data Officer mengidentifikasi tata kelola data sebagai prioritas utama. Para pemimpin data tersebut ingin mengimplementasikan model tata kelola agar data dapat tersedia untuk personel dan aplikasi yang tepat ketika mereka membutuhkannya, sekaligus menjaga data tetap aman dan terlindungi, dengan pemberlakuan kontrol yang tepat.
Tata kelola secara historis telah digunakan untuk mengunci data dalam silo, dengan tujuan untuk mencegah kebocoran atau penyalahgunaan data. Namun, konsekuensi dari silo data adalah bahwa pengguna sah akan juga mengalami kesulitan untuk mendapatkan akses ke data ketika mereka membutuhkannya. Secara tidak sengaja, hal ini menyebabkan terhambatnya inovasi yang didorong data.
Anda memiliki dua pendorong yang dapat menjadikan tata kelola sebagai penggerak inovasi: akses dan kontrol. Kunci keberhasilannya adalah dengan menemukan keseimbangan yang tepat antara akses dan kontrol dengan titik penyeimbang yang berbeda-beda untuk setiap organisasi. Ketika Anda terlalu banyak mengontrol, data akan terkunci dalam silo dan pengguna tidak dapat mengakses data saat dibutuhkan. Hal ini tidak hanya akan menghambat kreativitas, tetapi juga berujung pada terciptanya sistem IT bayangan yang menjadikan data kedaluwarsa dan tidak aman. Di sisi lain, ketika Anda memberikan terlalu banyak akses, data akan berada di aplikasi dan penyimpanan data yang kemudian meningkatkan risiko kebocoran data.
Menetapkan tata kelola yang tepat, yang menyeimbangkan akses dan kontrol, akan memberi kita kepercayaan serta keyakinan tehadap data dengan mengedepankan penemuan, kurasi, perlindungan, dan berbagi data yang tepat. Hal ini mendorong inovasi, sekaligus melindungi data.
Apa itu tata kelola machine learning (ML)?
Tata kelola ML menerapkan banyak praktik tata kelola data yang sama untuk ML. Kualitas data dan integrasi data perlu menyediakan data yang diperlukan untuk pelatihan model serta deployment produksi (tempat penyimpanan fitur adalah salah satu aspek penting dalam proses ini). Kecerdasan buatan (AI) yang bertanggung jawab memberikan perhatian khusus pada penggunaan data sensitif untuk pembuatan model. Kemampuan tata kelola ML tambahan mencakup memungkinkan orang-orang untuk berpartisipasi dalam pembuatan model, deployment, dan pemantauan; mendokumentasikan pelatihan model, versioning, kasus penggunaan yang didukung, serta memandu penggunaan model etis; dan memantau model dalam produksi untuk akurasi, penyimpangan, overfitting, dan underfitting.
AI Generatif memerlukan kemampuan tata kelola data tambahan, seperti kualitas dan integritas data, guna mendukung adaptasi model fondasi untuk pelatihan serta inferensi, tata kelola toksisitas dan bias AI Generatif, serta operasi model fondasi (FM): FMOps.
Anda dapat mendukung AI/ML dengan program tata kelola data yang sama. Persiapan data diperlukan untuk mengubah data menjadi bentuk yang dapat digunakan oleh model AI/ML untuk pelatihan dan inferensi produksi, tetapi persiapan data yang paling efisien adalah persiapan yang tidak harus Anda lakukan. Ilmuwan data menghabiskan terlalu banyak waktu dalam menyiapkan data untuk setiap kasus penggunaan. Tim tata kelola data Anda dapat membantu meringankan beban berat yang tidak terdiferensiasi ini. Selain itu, tata kelola data dapat mengawasi pembuatan tempat penyimpanan fitur berbentuk untuk digunakan di seluruh kasus penggunaan AI dan ML.
Terakhir, data sensitif perlu dilindungi dengan baik sehingga tim Anda dapat memitigasi risiko data sensitif yang digunakan untuk melatih model fondasi.
Sama seperti analitik pada umumnya, Anda harus mengelola penggunaan model AI/ML yang Anda buat atau sesuaikan. Idealnya, ini harus berkaitan erat dengan tata kelola analitik karena fungsi tersebut akan mengetahui cara mendukung berbagai bidang bisnis.
Apa saja tantangan utama tata kelola data?
Tantangan strategis yang paling umum untuk tata kelola data adalah penyelarasan program Anda dengan inisiatif bisnis, bukan pengusulan nilai tata kelola data secara langsung. Misalnya, Anda mungkin mengusulkan nilai yang akan memudahkan pengguna akhir menemukan data yang mereka cari, atau Anda mungkin mengusulkan nilai yang akan menyelesaikan berbagai masalah tentang kualitas data. Namun, ini merupakan solusi untuk masalah yang belum tentu ada. Jika melakukannya dengan cara ini, Anda akan bersaing dalam hal pendanaan dan sponsor dengan para inisiatif bisnis yang seharusnya Anda dukung. Sebagai gantinya, gunakan tata kelola data untuk mendukung inisiatif bisnis. Setiap inisiatif bisnis utama membutuhkan data. Tata kelola data harus memastikan bahwa data berada dalam kondisi yang tepat untuk mendukung keberhasilan inisiatif bisnis. Jangan mengabaikan praktik pelaporan dan audit tentang cara tata kelola data mendukung inisiatif ini.
Tantangan strategis umum lainnya untuk tata kelola data adalah menghindari penerapan tata kelola data secara sangat sempit. Definisi yang sangat sempit dapat berupa penyelarasan program dengan area bisnis individu atau kasus penggunaan tanpa mengambil pandangan yang lebih luas di seluruh area bisnis. Definisi yang sangat sempit juga bisa berarti mendefinisikan tata kelola data hanya dengan satu atau dua kemampuan tata kelola data. Misalnya, memiliki katalog data bukan merupakan program tata kelola data.
Apa saja gaya tata kelola data?
Program tata kelola data Anda harus menyeimbangkan sentralisasi dan desentralisasi (termasuk layanan mandiri). Di seluruh organisasi, Anda mungkin akan menemukan perpaduan antara tata kelola tersentralisasi, gabungan, dan terdesentralisasi yang, sekali lagi, bergantung pada kebutuhan bisnis. Anda harus secara maksimal memberdayakan tim domain sekaligus mempertahankan koherensi lintas domain (seperti kemampuan untuk menautkan berbagai data).
- Tata kelola data tersentralisasi: Organisasi pusat pada akhirnya bertanggung jawab atas pernyataan misi, kebijakan, pilihan alat, dan lain-lain. Tindakan harian akan berkali-kali didorong ke lini bisnis (LOB).
- Tata kelola data gabungan: Tata kelola data gabungan mendukung unit bisnis atau inisiatif bisnis individu untuk beroperasi dengan cara yang paling sesuai dengan kebutuhannya. Dengan tata kelola data gabungan, masih ada tim tersentralisasi yang lebih kecil yang memfokuskan pekerjaan mereka pada pemecahan berbagai masalah yang muncul secara berulang, termasuk alat kualitas data di seluruh korporasi, misalnya.
- Tata kelola data mandiri atau terdesentralisasi: Setiap LOB melakukan hal yang dibutuhkan untuk proyek spesifiknya. Setiap proyek menggunakan alat atau proses dari proyek lain apabila cocok untuk digunakan. Popularitas berbagai topik seperti jala data (terdesentralisasi secara mandiri) mengalami peningkatan. Begitu pula dengan tata kelola data mandiri.
Siapa yang membangun tata kelola data?
Membangun program tata kelola data yang berpusat pada bisnis membutuhkan banyak fungsi tugas.
- Sponsor eksekutif memahami berbagai inisiatif bisnis di peta langkah perusahaan dan dapat membantu menentukan prioritas untuk dukungan tata kelola data.
- Pengelola data berasal dari bisnis tersebut dan terlibat dalam detail proyek setiap harinya. Mereka membantu memahami masalah data yang mungkin menyebabkan kendala dengan inisiatif bisnis tertarget.
- Pemilik data membuat kebijakan tentang data, termasuk pihak yang dapat memiliki akses ke data dan dalam keadaan yang memungkinkan data untuk dapat diakses, cara menafsirkan serta menerapkan peraturan, serta definisi istilah kunci
- Rekayasawan data berasal dari bidang IT (biasanya) dan menyediakan alat yang membantu mengamankan data, mengelola kualitas data, mengintegrasikan data dari berbagai sumber, dan menemukan data yang tepat.
Bagaimana cara kerja tata kelola data?
Tata kelola data memerlukan personel, proses, dan solusi teknologi dengan berbagai kemampuan.
Kurasi data dalam skala besar untuk membatasi penyebaran data. Mengkurasi data dalam skala besar berarti mengidentifikasi dan mengelola sumber data yang paling berharga, termasuk basis data, danau data, dan gudang data, sehingga Anda dapat membatasi perkembangan serta transformasi aset data penting. Mengkurasi data juga berarti memastikan bahwa data yang tepat merupakan data yang akurat, baru, dan bebas dari informasi sensitif sehingga pengguna dapat memiliki kepercayaan diri terkait keputusan berbasis data dan aplikasi untuk memasukkan data.
Kemampuan: Manajemen kualitas data, integrasi data, dan manajemen data utama
Temukan dan pahami data Anda dalam konteks untuk mempercepat pengambilan keputusan berbasis data. Memahami data Anda dalam konteks berarti bahwa semua pengguna dapat menemukan dan memahami makna data mereka sehingga dapat menggunakannya dengan percaya diri untuk mendorong nilai bisnis. Dengan katalog data tersentralisasi, data dapat ditemukan dengan mudah, akses dapat diminta, dan data dapat digunakan untuk membuat keputusan bisnis.
Kemampuan: pembuatan profil data, silsilah data, dan katalog data
Lindungi dan bagikan data Anda secara aman dengan kontrol serta kepercayaan diri. Melindungi data Anda berarti dapat mencapai keseimbangan yang tepat antara privasi, keamanan, dan akses data. Kemampuan untuk mengelola akses data di seluruh batas-batas organisasi dengan alat yang intuitif untuk pengguna bisnis dan rekayasa sangatlah diperlukan.
Kemampuan: Siklus hidup data, kepatuhan data, dan keamanan data
Mengurangi risiko bisnis dan meningkatkan kepatuhan terhadap peraturan. Mengurangi risiko berarti memahami cara data digunakan dan pihak yang menggunakan data. Layanan AWS membantu Anda memantau dan mengaudit akses data—termasuk akses melalui model ML—untuk membantu memastikan keamanan data serta kepatuhan terhadap peraturan. Machine learning juga membutuhkan transparansi audit untuk memastikan penggunaan yang bertanggung jawab dan pelaporan yang disederhanakan.
Kemampuan: audit penggunaan untuk data dan ML
Bagaimana cara agar tim tata kelola data menjadi lebih baik?
Kunci efektivitas program tata kelola data adalah dengan menerapkan inisiatif bisnis yang sudah didanai. Pastikan tim Anda memahami domain, sumber, dan elemen data yang diperlukan untuk mendukung inisiatif tersebut.
- Bangun peta langkah tata kelola data yang menunjukkan dukungan terhadap inisiatif bisnis tertarget. Kemudian, mulailah mengidentifikasi tumpang tindih data di antara beberapa inisiatif bisnis yang dipilih.
- Identifikasi aplikasi dan kasus penggunaan kecerdasan bisnis yang perlu didukung dan disediakan oleh data, termasuk kebutuhan akan kesegaran dan privasi.
- Pahami data yang sesuai dengan tujuan untuk setiap inisiatif bisnis yang dipilih.
- Pertahankan dan perluas program tata kelola data dengan menyematkannya dalam model operasi korporasi sehingga perencanaan dan implementasi data menjadi bagian yang alami dari operasi organisasi.
- Atur komunitas analitik untuk layanan mandiri dan konsistensi.
- Dukung kecerdasan buatan (AI) dan machine learning (ML) dengan tata kelola data dan tata kelola ML. Gunakan program tata kelola data yang sama, tetapi perluas ke tempat penyimpanan fitur dan model ML.
Apa saja penawaran AWS untuk tata kelola data?
Dengan tata kelola data ujung ke ujung di AWS, organisasi memiliki kendali atas penempatan data mereka, orang yang mendapatkan akses ke data, dan hal-hal yang dapat dilakukan dengan data pada setiap langkah alur kerja data. Tata kelola data dengan AWS membantu organisasi mempercepat pengambilan keputusan berbasis data dengan memudahkan personel dan aplikasi yang tepat untuk menemukan, mengakses, serta berbagi data yang diperlukan dengan aman serta terjamin. Anda dapat mengkurasi data dengan mengotomatiskan integrasi data dan kualitas data untuk membatasi proliferasi data. Anda dapat menemukan dan memahami data menggunakan katalog tersentralisasi yang meningkatkan literasi data. Anda dapat melindungi data dengan izin yang tepat, yang dapat memungkinkan Anda berbagi data tanpa ragu. Anda dapat mengurangi risiko dan meningkatkan kepatuhan terhadap peraturan dengan memantau dan mengaudit akses data.
- Amazon DataZone – buka data lintas batas organisasi dengan tata kelola bawaan
- AWS Glue – temukan, siapkan, dan integrasikan semua data Anda pada semua skala
- AWS Lake Formation — bangun, kelola, dan amankan danau data dalam hitungan hari
- Amazon QuickSight menyatukan kecerdasan bisnis dalam skala yang sangat besar
- Amazon SageMaker – bangun, latih, dan lakukan deployment model machine learning untuk berbagai kasus penggunaan dengan infrastruktur, alat, serta alur kerja yang terkelola penuh
- Halaman web tata kelola ML
- Amazon Bedrock – bangun dan skalakan aplikasi AI generatif dengan model fondasi (FM)
- Amazon Macie - temukan dan lindungi data sensitif dalam skala besar
- Titik akses Amazon Simple Storage Service (Amazon S3) - penyimpanan objek yang dibangun untuk mengambil sejumlah data dari mana saja
- AWS Data Exchange – temukan, berlangganan, dan gunakan data pihak ketiga di cloud dengan mudah
- AWS Clean Rooms – buat kamar bersih dalam hitungan menit untuk berkolaborasi dengan partner Anda tanpa berbagi data mentah
Mulai menggunakan Tata Kelola Data di AWS dengan membuat akun gratis sekarang juga.