- Analytics›
- Amazon RedShift›
- คำถามที่พบบ่อยเกี่ยวกับ Amazon Redshift
คำถามที่พบบ่อยเกี่ยวกับ Amazon Redshift
หัวข้อของหน้า
ข้อมูลทั่วไปข้อมูลทั่วไป
Amazon Redshift คืออะไร
ลูกค้าหลายหมื่นรายใช้ Amazon Redshift ทุกวันเพื่อเรียกใช้การวิเคราะห์ SQL ในระบบคลาวด์ในการประมวลผลข้อมูลระดับเอกซะไบต์เพื่อให้ได้ข้อมูลเชิงลึกทางธุรกิจ ไม่ว่าข้อมูลที่มีปริมาณมากขึ้นเรื่อยๆ ของคุณจะถูกจัดเก็บไว้ในที่เก็บข้อมูลการดำเนินงาน, Data Lake, บริการข้อมูลสตรีม หรือชุดข้อมูลของบริษัทอื่น Amazon Redshift ก็สามารถช่วยคุณเข้าถึง ผสานรวม และแชร์ข้อมูลอย่างปลอดภัยโดยมีการโอนย้ายหรือคัดลอกน้อยที่สุด Amazon Redshift จะผสานการทำงานกับฐานข้อมูล AWS, การวิเคราะห์ และบริการแมชชีนเลิร์นนิงอย่างล้ำลึกเพื่อนำวิธีการ Zero-ETL มาใช้ หรือช่วยคุณเข้าถึงข้อมูลที่มีอยู่เพื่อใช้ในการวิเคราะห์ในแบบเกือบเรียลไทม์ สร้างโมเดลแมชชีนเลิร์นนิงใน SQL และเปิดใช้การวิเคราะห์ของ Apache Spark โดยใช้ข้อมูลใน Redshift Amazon Redshift แบบไม่ต้องใช้เซิร์ฟเวอร์ช่วยให้วิศวกร นักพัฒนา นักวิทยาศาสตร์ข้อมูล และนักวิเคราะห์สามารถเริ่มต้นทำงานได้ง่ายๆ และปรับขนาดการวิเคราะห์ได้อย่างรวดเร็วในสภาพแวดล้อมที่ไม่ต้องมีการบริหารจัดการ ด้วยกลไก Massively Parallel Processing (MPP) และสถาปัตยกรรมที่แยกการประมวลผลและการจัดเก็บข้อมูลออกจากกันเพื่อให้ได้นวัตกรรมการทำงานที่มีประสิทธิภาพ ปรับขนาดได้ และขับเคลื่อนด้วยแมชชีนเลิร์นนิง (ตัวอย่างเช่น AutoMaterialized Views) Amazon Redshift สร้างขึ้นมาเพื่อการปรับขนาดและมอบประสิทธิภาพการทำงานในราคาคุ้มค่ากว่าถึง 5 เท่าเมื่อเทียบกับคลังข้อมูลบนระบบคลาวด์อื่นๆ
เหตุผลหลักที่ลูกค้าเลือกใช้ Amazon Redshift มีอะไรบ้าง
ลูกค้าหลายพันรายเลือกใช้ Amazon Redshift เพื่อเร่งเวลารับข้อมูลเชิงลึก เนื่องจากเป็นระบบการวิเคราะห์ที่มีประสิทธิภาพที่ผสานการทำงานได้ดีกับฐานข้อมูลและบริการแมชชีนเลิร์นนิง จึงทำให้การใช้งานดียิ่งขึ้น และสามารถใช้เป็นบริการศูนย์กลางในการส่งมอบผลลัพธ์ตามความต้องการด้านการวิเคราะห์ Amazon Redshift แบบไม่ต้องใช้เซิร์ฟเวอร์ช่วยจัดเตรียมและปรับขนาดความจุคลังข้อมูลโดยอัตโนมัติเพื่อมอบประสิทธิภาพระดับสูงสำหรับเวิร์กโหลดที่ใช้ทรัพยากรมากและคาดเดาไม่ได้ Amazon Redshift มอบประสิทธิภาพชั้นนำที่คุ้มกับราคาสำหรับเวิร์กโหลดการวิเคราะห์ที่หลากหลาย ไม่ว่าจะเป็นการทำแดชบอร์ด การพัฒนาแอปพลิเคชัน การแชร์ข้อมูล งาน ETL (Extract, Transform, Load) และอื่นๆ อีกมากมาย เนื่องจากมีลูกค้าหลายหมื่นรายที่เรียกใช้การวิเคราะห์ข้อมูลในระดับเทระไบต์ไปจนถึงเพตะไบต์ Amazon Redshift จึงช่วยเพิ่มประสิทธิภาพเวิร์กโหลดให้กับลูกค้าในสภาพแวดล้อมจริงโดยอิงจากการตรวจวัดประสิทธิภาพระยะไกลของกลุ่มอินสแตนซ์ และส่งมอบการทำงานที่ปรับขนาดเวิร์กโหลดได้ในเชิงเส้นในขณะควบคุมต้นทุนให้ต่ำอยู่เสมอ นวัตกรรมการทำงานที่ทันสมัยนี้มีให้บริการลูกค้าโดยไม่มีค่าใช้จ่ายเพิ่มเติม Amazon Redshift ช่วยให้คุณได้รับข้อมูลเชิงลึกจากการเรียกใช้การวิเคราะห์เชิงคาดการณ์แบบเรียลไทม์ในส่วนข้อมูลทั้งหมดทั่วทั้งฐานข้อมูลเชิงปฏิบัติการ, Data Lake, คลังข้อมูล, ข้อมูลการสตรีม และชุดข้อมูลของบุคคลภายนอก Amazon Redshift ยังรองรับความปลอดภัยระดับชั้นนำของอุตสาหกรรมด้วยการผสานรวมการจัดการข้อมูลระบุตัวตนและระบบเชื่อมโยงข้อมูลสำหรับการเข้าสู่ระบบครั้งเดียว (SSO), การยืนยันตัวตนโดยใช้หลายปัจจัย (MFA), การควบคุมการเข้าถึงระดับคอลัมน์, การรักษาความปลอดภัยระดับแถว, การควบคุมการเข้าถึงตามบทบาท, Amazon Virtual Private Cloud (Amazon VPC) และการปรับขนาดคลัสเตอร์ที่เร็วขึ้น
Amazon Redshift ช่วยให้การจัดการคลังข้อมูลและการวิเคราะห์เป็นเรื่องง่ายขึ้นได้อย่างไร
Amazon Redshift ได้รับการจัดการอย่างเต็มรูปแบบโดย AWS ดังนั้นคุณจึงไม่ต้องกังวลไปกับงานการจัดการคลังข้อมูลอีกต่อไป เช่น การจัดเตรียมฮาร์ดแวร์ การแพตช์ซอฟต์แวร์ การตั้งค่า การกำหนดค่า การตรวจสอบโหนดและไดรฟ์เพื่อกู้คืนจากความล้มเหลว หรือการสำรองข้อมูล AWS จะคอยจัดการงานที่จำเป็นในการตั้งค่า ดำเนินการ และปรับขนาดคลังข้อมูลในนามของคุณ ช่วยให้คุณให้ความสำคัญกับการสร้างแอปพลิเคชันของคุณได้เต็มที่ Amazon Redshift แบบไม่ต้องใช้เซิร์ฟเวอร์ช่วยจัดเตรียมและปรับขนาดความจุคลังข้อมูลโดยอัตโนมัติ เพื่อมอบประสิทธิภาพระดับสูงสำหรับปริมาณงานที่ใช้ทรัพยากรมากและคาดเดาไม่ได้ และคุณจ่ายเฉพาะทรัพยากรที่คุณใช้เท่านั้น Amazon Redshift ยังมีความสามารถในการปรับค่าอัตโนมัติและแสดงคำแนะนำสำหรับการจัดการคลังเก็บข้อมูลของคุณใน Redshift Advisor อีกด้วย สำหรับ Redshift Spectrum นั้น Amazon Redshift ช่วยจัดการโครงสร้างพื้นฐานของการประมวลผลทั้งหมด การปรับสมดุลโหลด การวางแผน การกำหนดเวลา และการดำเนินการสืบค้นข้อมูลที่จัดเก็บไว้ใน Amazon S3 Amazon Redshift ช่วยให้คุณสามารถวิเคราะห์ข้อมูลทั้งหมดได้ด้วยการผสานการทำงานอย่างราบรื่นในบริการฐานข้อมูล พร้อมมีคุณสมบัติต่างๆ เช่น Amazon Aurora Zero-ETL ไปจนถึง Amazon Redshift และการสืบค้นแบบรวมไปจนถึงการเข้าถึงข้อมูลที่มีอยู่จากฐานข้อมูลเชิงปฏิบัติการอย่าง Amazon RDS และ Data Lake ของ Amazon S3 Redshift ช่วยให้สามารถนำข้อมูลเข้าอย่างมีประสิทธิภาพโดยไม่ต้องใช้โค้ด เป็นไปป์ไลน์ข้อมูลแบบอัตโนมัติที่นำเข้าข้อมูลการสตรีมหรือไฟล์จาก Amazon S3 โดยอัตโนมัติ Redshift ยังผสานการทำงานกับ AWS Data Exchange ช่วยให้ผู้ใช้สามารถค้นหา สมัครรับข้อมูล และสืบค้นชุดข้อมูลของบุคคลภายนอก และผสานรวมเข้ากับข้อมูลของตนเพื่อให้ได้ข้อมูลเชิงลึกที่ครบถ้วนครอบคลุม การผสานรวมการทำงานในตัวลงใน Amazon SageMaker ช่วยให้ลูกค้าสามารถดำเนินการได้จากคลังข้อมูลของตน และสร้าง ฝึกฝน และออกแบบโมเดลแมชชีนเลิร์นนิงใน SQL Amazon Redshift ตอบสนองความต้องการด้านการวิเคราะห์ SQL ทั้งหมดซึ่งมีความคุ้มค่ากว่าคลังข้อมูลบนระบบคลาวด์อื่นๆ ถึง 5 เท่า
มีตัวเลือกการนำไปใช้จริงใดบ้างสำหรับ Amazon Redshift
Amazon Redshift เป็นบริการที่มีการจัดการเต็มรูปแบบและมีตัวเลือกทั้งแบบเตรียมใช้งานและแบบไม่ต้องใช้เซิร์ฟเวอร์ ซึ่งช่วยให้การเรียกใช้และการปรับขนาดการวิเคราะห์มีประสิทธิภาพยิ่งขึ้นโดยไม่ต้องจัดการคลังข้อมูลของคุณ คุณสามารถเรียกใช้งานตำแหน่งข้อมูล Amazon Redshift แบบไม่ต้องใช้เซิร์ฟเวอร์โฉมใหม่เพื่อเตรียมใช้งานคลังข้อมูลโดยอัตโนมัติในไม่กี่วินาที หรือคุณสามารถเลือกตัวเลือกที่มีการเตรียมใช้งานสำหรับเวิร์กโหลดที่คาดเดาได้ก็ได้
ฉันจะเริ่มต้นใช้งาน Amazon Redshift ได้อย่างไร
คุณสามารถเริ่มสืบค้นข้อมูลได้เพียงไม่กี่ขั้นตอนในคอนโซลการจัดการของ AWS คุณสามารถใช้ประโยชน์จากชุดข้อมูลตัวอย่างที่โหลดไว้ล่วงหน้า ซึ่งรวมถึงชุดข้อมูลวัดประสิทธิภาพ TPC-H, TPC-DS และตัวอย่างการสืบค้นอื่นๆ เพื่อเริ่มการวิเคราะห์ได้ทันที หากต้องการเริ่มต้นใช้งาน Amazon Redshift แบบไม่ต้องใช้เซิร์ฟเวอร์ ให้เลือก “ลองใช้ Amazon Redshift แบบไม่ต้องใช้เซิร์ฟเวอร์” และเริ่มสืบค้นข้อมูล เริ่มต้นที่นี่
ประสิทธิภาพของ Amazon Redshift กับคลังข้อมูลอื่น ๆ แตกต่างกันอย่างไร
ผลการวัดประสิทธิภาพ TPC-DS แสดงให้เห็นว่า Amazon Redshift มีความคุ้มค่าที่สุดตั้งแต่แรกเริ่ม แม้จะใช้ชุดข้อมูลขนาด 3 TB ที่ค่อนข้างเล็กก็ตาม Amazon Redshift มีความคุ้มค่ากว่าคลังข้อมูลบนระบบคลาวด์อื่นๆ ถึง 5 เท่า ซึ่งหมายความว่าคุณจะได้รับประโยชน์จากความคุ้มค่าระดับชั้นนำของ Amazon Redshift นี้ตั้งแต่แรกเริ่มโดยไม่ต้องปรับแต่งอะไรเองเลย จากประสิทธิภาพการตรวจวัดระยะไกลในกลุ่มอินสแตนซ์ของเรา เรายังทราบอีกว่าเวิร์กโหลดส่วนใหญ่นั้นเป็นเวิร์กโหลดการสืบค้นระยะสั้น (เวิร์กโหลดที่ทำงานน้อยกว่า 1 วินาที) สำหรับเวิร์กโหลดเหล่านี้ เกณฑ์มาตรฐานล่าสุดแสดงให้เห็นว่า Amazon Redshift มีความคุ้มค่ากว่าคลังข้อมูลบนระบบคลาวด์อื่นๆ ถึง 7 เท่า ทั้งด้านการทำงานพร้อมกันในระดับสูงและเวิร์กโหลดที่มีเวลาแฝงต่ำ เรียนรู้เพิ่มเติมที่นี่
ฉันสามารถรับความช่วยเหลือเพื่อเรียนรู้เพิ่มเติมและเริ่มต้นใช้งาน Amazon Redshift ได้หรือไม่
ได้ ผู้เชี่ยวชาญของ Amazon Redshift พร้อมตอบคำถามต่างๆ และให้การสนับสนุน โปรดติดต่อเรา แล้วคุณจะได้รับการติดต่อกลับจากเราภายในหนึ่งวันทำการเพื่อพูดคุยว่า AWS สามารถช่วยเหลือองค์กรของคุณอย่างไรได้บ้าง
Amazon Redshift Managed Storage คืออะไร
Amazon Redshift Managed Storage มีให้เลือกใช้แบบไร้เซิร์ฟเวอร์และมาพร้อมกับประเภทโหนด RA3 ช่วยให้คุณสามารถปรับขนาดและจ่ายค่าบริการสำหรับการประมวลผลและพื้นที่จัดเก็บแยกกันได้ ซึ่งทำให้คุณสามารถกำหนดขนาดของคลัสเตอร์ตามความต้องการในการประมวลผลของคุณเพียงอย่างเดียว โดยจะใช้พื้นที่จัดเก็บเฉพาะที่ SSD ประสิทธิภาพสูงเป็นแคชชั้นที่ 1 โดยอัตโนมัติ และใช้ประโยชน์ของการปรับประสิทธิภาพให้เหมาะสม เช่น อุณหภูมิของบล็อกข้อมูล อายุของบล็อกข้อมูล และรูปแบบของปริมาณงานเพื่อการทำงานมีประสิทธิภาพสูงในขณะที่ปรับขนาดพื้นที่จัดเก็บไปยัง Amazon S3 โดยอัตโนมัติเมื่อจำเป็นโดยไม่ต้องดำเนินการใดๆ
ฉันจะใช้พื้นที่จัดเก็บที่มีการจัดการของ Amazon Redshift อย่างไร
หากคุณใช้โหนด Amazon Redshift Dense Storage หรือ Dense Compute อยู่แล้ว คุณสามารถใช้ Elastic Resize เพื่ออัปเกรดคลัสเตอร์ที่มีอยู่เดิมให้เป็นอินสแตนซ์การประมวล RA3 แบบใหม่ได้ Amazon Redshift Serverless และคลัสเตอร์ที่ใช้อินสแตนซ์ RA3 จะใช้พื้นที่จัดเก็บที่มีการจัดการโดย Redshift โดยอัตโนมัติเพื่อจัดเก็บข้อมูล โดยไม่จำเป็นต้องดำเนินการอื่นใดนอกเหนือจากการใช้ Amazon Redshift แบบไม่ต้องใช้เซิร์ฟเวอร์ หรืออินสแตนซ์ RA3 เพื่อใช้คุณสมบัตินี้
ฉันจะเรียกใช้การสืบค้นจาก Redshift สำหรับข้อมูลที่จัดเก็บไว้ใน AWS Data Lake ได้อย่างไร
Amazon Redshift Spectrum เป็นคุณสมบัติหนึ่งของ Amazon Redshift ที่ให้คุณสามารถเรียกใช้การสืบค้นกับ Data Lake ใน Amazon S3 ได้โดยไม่ต้องมีการโหลดข้อมูลหรือ ETL เมื่อสร้างการสืบค้น SQL ระบบจะส่งการสืบค้นนั้นไปยังตำแหน่งข้อมูลของ Amazon Redshift ซึ่งจะสร้างและปรับแผนการสืบค้นให้ดีขึ้น Amazon Redshift จะระบุว่าข้อมูลใดอยู่ในเครื่องและข้อมูลใดอยู่ใน Amazon S3 แล้วสร้างแผนในการลดจำนวนข้อมูล S3 ที่ต้องอ่านให้น้อยที่สุด จากนั้นส่งคำขอโปรแกรมทำงานของ Amazon Redshift Spectrum จากแหล่งทรัพยากรร่วมเพื่ออ่านและประมวลผลข้อมูลจาก Amazon S3
ฉันควรพิจารณาใช้อินสแตนซ์ RA3 เมื่อใด
พิจารณาเลือกใช้โหนด RA3 ในกรณีต่อไปนี้
- คุณต้องการความยืดหยุ่นในการปรับขนาดและจ่ายค่าบริการประมวลผลแยกกับพื้นที่จัดเก็บ
- คุณสืบค้นข้อมูลเพียงส่วนหนึ่งของข้อมูลทั้งหมด
- ปริมาณข้อมูลของคุณเพิ่มขึ้นอย่างรวดเร็วหรือคาดว่าจะเพิ่มขึ้นอย่างรวดเร็ว
- คุณต้องการความยืดหยุ่นในการปรับขนาดคลัสเตอร์ตามความต้องการด้านประสิทธิภาพของคุณเท่านั้น
เมื่อข้อมูลเพิ่มขึ้นเรื่อยๆ ไปจนถึงระดับเพตะไบต์ ปริมาณข้อมูลที่คุณนำเข้าไปยังคลังข้อมูล Amazon Redshift ของคุณก็จะเพิ่มขึ้นด้วยเช่นกัน คุณอาจกำลังมองหาวิธีที่จะวิเคราะห์ข้อมูลทั้งหมดของคุณอย่างคุ้มค่า
อินสแตนซ์ RA3 ของ Amazon Redshift โฉมใหม่พร้อมพื้นที่จัดเก็บที่มีการจัดการ ช่วยให้คุณสามารถเลือกจำนวนโหนดโดยขึ้นอยู่กับข้อกำหนดด้านประสิทธิภาพการทำงาน และจ่ายค่าบริการเฉพาะพื้นที่จัดเก็บข้อมูลที่มีการจัดการซึ่งคุณใช้งานเท่านั้น ซึ่งช่วยให้คุณมีความยืดหยุ่นในการกำหนดขนาดคลัสเตอร์ RA3 ของคุณตามปริมาณข้อมูลที่คุณประมวลผลในแต่ละวันโดยไม่เพิ่มค่าใช้จ่ายด้านพื้นที่จัดเก็บข้อมูลแต่อย่างใด อินสแตนซ์ RA3 ที่สร้างขึ้นบน AWS Nitro System พร้อมพื้นที่จัดเก็บที่มีการจัดการจะใช้ SSD ประสิทธิภาพสูงสำหรับข้อมูล Hot (ข้อมูลที่เข้าถึงบ่อย) และใช้ Amazon S3 สำหรับข้อมูล Cold (ข้อมูลที่เข้าถึงไม่บ่อย) ซึ่งใช้งานได้ง่าย จัดเก็บข้อมูลได้คุ้มค่า และสืบค้นได้รวดเร็ว
คุณสมบัติใดบ้างที่ฉันสามารถใช้เพื่อการวิเคราะห์ตามตำแหน่งได้
Amazon Redshift Spatial มีการวิเคราะห์ข้อมูลเชิงลึกจำนวนมากตามตำแหน่งกับข้อมูลของคุณ ซึ่งรวมข้อมูลเชิงพื้นที่และข้อมูลธุรกิจได้อย่างราบรื่นในการวิเคราะห์เพื่อการตัดสินใจ Amazon Redshift เปิดตัวการสนับสนุนการประมวลผลข้อมูลเชิงพื้นที่แบบเนทีฟในเดือนพฤศจิกายน 2019 โดยมีประเภทข้อมูลพหุสันฐาน GEOMETRY และฟังก์ชันเชิงพื้นที่ SQL ที่สำคัญหลายรายการ ขณะนี้เรารองรับประเภทข้อมูล GEOGRAPHY และไลบรารีฟังก์ชันเชิงพื้นที่ SQL ของเราได้เติบโตขึ้นเป็น 80 เรารองรับประเภทข้อมูลและมาตรฐานเชิงพื้นที่ทั่วไปทั้งหมด รวมถึง Shapefiles, GeoJSON, WKT, WKB, eWKT และ eWKB หากต้องการเรียนรู้เพิ่มเติม โปรดไปที่หน้า เอกสารประกอบ หรือหน้า บทแนะนำสอนการใช้งาน Amazon Redshift Spatial
SQL ของ Athena มีการรองรับการใช้งานอย่างไรเทียบกับ Redshift และฉันควรจะเลือกอะไรระหว่างบริการทั้งสองนี้
Amazon Athena และ Amazon Redshift แบบไม่ต้องใช้เซิร์ฟเวอร์ ตอบสนองความต้องการและกรณีการใช้งานที่แตกต่างกันแม้ว่าทั้งสองบริการจะเป็นแบบไม่ต้องใช้เซิร์ฟเวอร์และให้บริการแก่ผู้ใช้ SQL ก็ตาม
ด้วยสถาปัตยกรรม Massively Parallel Processing (MPP) ที่แยกที่จัดเก็บและการประมวลผลออกจากกัน รวมถึงความสามารถในการปรับประสิทธิภาพอัตโนมัติที่สนับสนุนโดยแมชชีนเลิร์นนิง คลังข้อมูลอย่าง Amazon Redshift ไม่ว่าจะเป็นแบบไม่ต้องใช้เซิร์ฟเวอร์หรือแบบเตรียมใช้งาน ก็ล้วนเป็นตัวเลือกที่ยอดเยี่ยมสำหรับลูกค้าที่ต้องการประสิทธิภาพการทำงานที่คุ้มราคาในทุกขนาดการใช้งานสำหรับเวิร์กโหลด BI และการวิเคราะห์ข้อมูลที่ซับซ้อน ลูกค้าสามารถใช้ Amazon Redshift เป็นองค์ประกอบศูนย์กลางของสถาปัตยกรรมข้อมูลที่มีการผสานการทำงานขั้นละเอียดพร้อมให้เข้าถึงข้อมูลที่มีอยู่ หรือนำเข้าหรือย้ายข้อมูลลงในคลังข้อมูลได้ง่ายๆ เพื่อการวิเคราะห์ข้อมูลที่มีประสิทธิภาพสูงผ่าน ZeroETL และไม่ต้องใช้โค้ด ลูกค้าสามารถเข้าถึงข้อมูลที่จัดเก็บไว้ใน Amazon S3, ฐานข้อมูลเชิงปฏิบัติการอย่าง Aurora และ Amazon RDS, คลังข้อมูลของบุคคลภายนอกผ่านการผสานการทำงานกับ AWS Data Exchange และผสานรวมกับข้อมูลที่จัดเก็บไว้ในคลังข้อมูล Amazon Redshift เพื่อการวิเคราะห์ข้อมูล ผู้ใช้สามารถเริ่มต้นการจัดทำคลังข้อมูลได้ง่ายๆ และดำเนินการแมชชีนเลิร์นนิงเพิ่มเติมจากข้อมูลทั้งหมดนี้ด้วย
Amazon Athena เหมาะสำหรับใช้ในการวิเคราะห์เชิงโต้ตอบและการสำรวจข้อมูลที่อยู่ใน Data Lake หรือแหล่งที่มาของข้อมูลใดๆ ผ่านเฟรมเวิร์กส่วนเชื่อมต่อแบบขยายได้ (รวมถึงตัวเชื่อมต่อที่ใช้งานได้ฟรีทันทีกว่า 30 รายการสำหรับแอปพลิเคชันและระบบการวิเคราะห์ข้อมูลในสถานที่หรือบนระบบคลาวด์อื่นๆ) โดยไม่ต้องกังวลถึงการนำเข้าหรือประมวลผลข้อมูล Amazon Athena สร้างขึ้นบนเครื่องมือและเฟรมเวิร์กแบบโอเพนซอร์ส เช่น Spark, Presto และ Apache Iceberg ลูกค้าจึงมีความยืดหยุ่นในการใช้ Python หรือ SQL หรือทำงานกับข้อมูลรูปแบบเปิด หากลูกค้าต้องการวิเคราะห์ข้อมูลเชิงโต้ตอบโดยใช้เฟรมเวิร์กและข้อมูลรูปแบบโอเพนซอร์ส Amazon Athena ถือเป็นการเริ่มต้นที่ยอดเยี่ยม
ความยืดหยุ่นในด้านขนาดมีผลกับโหนด Redshift Reserved หรือไม่
ไม่ อินสแตนซ์ Redshift Reserved นั้นไม่มีความยืดหยุ่น และมีผลกับประเภทโหนดที่แน่นอนที่คุณสำรองไว้เท่านั้น
การวิเคราะห์ SQL ของ Amazon SageMaker
ประโยชน์ของการใช้ Redshift ใน SageMaker สำหรับการวิเคราะห์ SQL มีอะไรบ้าง
SageMaker ช่วยลดความยุ่งยากในการวิเคราะห์ SQL ด้วยการจัดหาแพลตฟอร์มที่ครอบคลุมและใช้งานง่ายซึ่งเชื่อมต่อแหล่งที่มาของข้อมูลหลายแหล่งและปรับปรุงการสำรวจข้อมูล ด้วยอินเทอร์เฟซสไตล์โน้ตบุ๊คที่ยืดหยุ่น คุณสามารถเข้าถึงข้อมูลจาก Amazon Simple Storage Service (Amazon S3), Amazon Redshift และแหล่งที่มาของข้อมูลอื่น ๆ รวมถึงเขียนและเรียกใช้การสืบค้นในเอ็นจิ้นต่าง ๆ และสร้างภาพรวมภายในเครื่องมือโดยตรง แพลตฟอร์มจะจัดการข้อมูลเมตาของคุณโดยอัตโนมัติ ทำให้สามารถเข้าใจและค้นพบข้อมูลได้ง่ายขึ้น การผสานรวมกับบริการ AWS อื่น ๆ อย่างราบรื่นของแพลตฟอร์มนี้ช่วยให้คุณสามารถก้าวไปไกลกว่าการวิเคราะห์ SQL แบบดั้งเดิม เปลี่ยนข้อมูลของคุณให้กลายเป็นข้อมูลเชิงลึกที่ใช้งานได้โดยมีความซับซ้อนทางเทคนิคน้อยที่สุด
ฉันจำเป็นต้องโอนย้ายข้อมูลจาก Amazon S3 หรือคลังข้อมูล Amazon Redshift ที่มีอยู่เพื่อใช้ SageMaker สำหรับการวิเคราะห์ SQL หรือไม่
ไม่ คุณไม่จำเป็นต้องโอนย้ายข้อมูลของคุณเพื่อใช้ SageMaker สำหรับการวิเคราะห์ SQL คุณสามารถค้นหาและสืบค้นข้อมูลได้โดยตรงจากหลายแหล่ง ซึ่งรวมถึง Amazon S3 (แค็ตตาล็อกข้อมูลของ AWS Glue และบัคเก็ตของตาราง Amazon S3), Amazon Redshift (แบบไม่ต้องใช้เซิร์ฟเวอร์และจัดเตรียมไว้) และแหล่งที่มาของข้อมูลแบบรวมศูนย์เพิ่มเติม 13 แหล่งที่เข้ากันได้กับเวิร์กโฟลว์วิศวกรรม SQL Amazon SageMaker Lakehouse เชื่อมต่อกับข้อมูลปัจจุบันของคุณได้อย่างราบรื่น คุณจึงสามารถมุ่งเน้นไปที่ข้อมูลเชิงลึกแทนที่จะใช้เวลาในการเคลื่อนย้ายข้อมูล เพียงไม่กี่ขั้นตอนง่ายๆ คุณก็จะสามารถสำรวจข้อมูลของคุณ เรียกใช้แบบสอบถาม และค้นพบข้อมูลธุรกิจที่มีค่าได้โดยไม่ต้องมีปัญหาทางเทคนิค
ฉันจะโหลดข้อมูลและเริ่มต้นใช้งาน SageMaker สำหรับการวิเคราะห์ SQL ได้อย่างไร
SageMaker มีสองวิธีในการนำข้อมูลของคุณเข้าสู่แพลตฟอร์มสำหรับการวิเคราะห์ SQL เพื่อเริ่มต้นใช้งาน SageMaker SQL จะช่วยให้คุณสามารถเรียกใช้การสืบค้นกับข้อมูลเหล่านั้นโดยตรงด้วย Data Lake ได้เมื่อคุณจัดเก็บข้อมูลใน Amazon S3 หรือคุณสามารถอัปโหลดข้อมูลลงในคลังข้อมูลของคุณโดยเรียกใช้คำสั่ง COPY หากคุณมีข้อมูลในเดสก์ท็อปของคุณ SageMaker ช่วยให้คุณสามารถอัปโหลดไฟล์ข้อมูลโดยตรงจากคอมพิวเตอร์ของคุณเอง โดยการลากและวางไฟล์ข้อมูลลงในแพลตฟอร์ม SageMaker นอกจากนี้คุณยังสามารถใช้ ETL แบบไร้รอยต่อเพื่อนำข้อมูลจากคลังข้อมูลการดำเนินงานของคุณได้ กระบวนการทั้งหมดได้รับการออกแบบมาเพื่อขจัดอุปสรรคทางเทคนิค ซึ่งช่วยให้คุณสามารถมุ่งเน้นไปที่การค้นพบข้อมูลเชิงลึกมาก แทนที่จะใช้เวลาไปกับกระบวนการโหลดข้อมูลที่ซับซ้อน
ประสบการณ์การใช้งานบันทึกการสืบค้น SageMaker เป็นอย่างไร
Amazon SageMaker Unified Studio (เวอร์ชันทดลองใช้) มีอินเทอร์เฟซแบบโน้ตบุ๊คที่ทรงพลังและใช้งานง่าย เพื่อการวิเคราะห์ SQL แบบครบวงจร คุณสามารถเขียนและเรียกใช้โค้ด SQL ในเซลล์แยกกัน สร้างแผนภูมิและการแสดงภาพ รวมถึงสำรวจข้อมูลรวมจากแหล่งต่าง ๆ เช่น Amazon S3, Amazon Redshift และแหล่งแบบรวมต่าง ๆ ผ่าน SageMaker Lakehouse แพลตฟอร์มนี้ยังมีฟีเจอร์ที่มีประโยชน์เช่น การป้อนอัตโนมัติและการตรวจสอบไวยากรณ์เพื่อช่วยเหลือในการเขียน SQL ของคุณ คุณยังสามารถใช้ฟังก์ชัน AI ช่วยสร้างได้กับ SQL ช่วยสร้างของ Amazon Q ซึ่งให้คำแนะนำโค้ด SQL โดยใช้ภาษาธรรมชาติ SageMaker ได้รับการออกแบบมาเพื่อทำให้การวิเคราะห์ SQL ใช้งานง่าย ยืดหยุ่น และเข้าถึงได้สำหรับผู้ใช้ข้อมูลทุกคน
ฉันจะแชร์การสืบค้น SQL หรือโมเดลข้อมูลใน SageMaker ได้อย่างไร
Amazon SageMaker Unified Studio (เวอร์ชันทดลองใช้) มี “โปรเจกต์” ซึ่งเป็นพื้นที่ทำงานดิจิทัลแบบร่วมมือที่ช่วยทีมที่ช่วยให้ทีมงานสามารถจัดระเบียบและจัดการงานการวิเคราะห์ข้อมูลได้ ซึ่งฟีเจอร์ดังกล่าวเป็นเหมือนโฟลเดอร์ที่แชร์กันซึ่งคุณสามารถจัดเก็บการสืบค้น SQL, โมเดลข้อมูล, โค้ด และทรัพยากรอื่น ๆ ในตำแหน่งเดียวที่ปลอดภัยได้ การสร้างโปรเจกต์จะช่วยให้คุณสร้างสภาพแวดล้อมแบบรวมศูนย์ที่สามารถเชิญสมาชิกในทีม กำหนดสิทธิ์การเข้าถึงที่เฉพาะเจาะจง และทำงานร่วมกันได้อย่างราบรื่น โดยภายในพื้นที่นี้ คุณสามารถแจกจ่าย Querybooks ซึ่งเป็นที่เก็บการสืบค้นและโมเดลข้อมูลของคุณ รวมถึงให้สิทธิ์เข้าถึงแหล่งที่มาของข้อมูล เช่น Amazon S3 และ Redshift ตลอดจนจัดเตรียมทรัพยากรคอมพิวเตอร์ที่ใช้ร่วมกันได้ แพลตฟอร์มนี้รองรับการควบคุมเวอร์ชันผ่านการผสานรวม Git ซึ่งช่วยให้ทีมของคุณสามารถติดตามการเปลี่ยนแปลง ทำงานร่วมกันในโค้ด และรักษาประวัติการทำงานการวิเคราะห์ SQL ของคุณได้อย่างชัดเจน วิธีการนี้ช่วยให้มั่นใจได้ว่าสมาชิกในทีมทุกคนสามารถดู แก้ไข และเรียกใช้การสืบค้นในขณะที่รักษาความปลอดภัยและความสม่ำเสมอในเวิร์กโหลดการวิเคราะห์ SQL ของคุณ
โมเดลการกำหนดราคาสำหรับการวิเคราะห์ SQL ใน SageMaker คืออะไร
ไม่มีค่าใช้จ่ายเพิ่มเติมในการใช้ตัวแก้ไข SQL ใน SageMaker คุณจะจ่ายเฉพาะค่าใช้จ่ายสำหรับการใช้งานเอ็นจิ้นประมวลผลข้อมูลที่พร้อมใช้งาน เช่น Amazon Athena และ Amazon Redshift เท่านั้น
SLA สำหรับการวิเคราะห์ SQL ใน Amazon SageMaker คืออะไร
ข้อตกลงระดับบริการ (SLA) ของการวิเคราะห์ SQL Analytics ใน Amazon SageMaker เชื่อมโยงโดยตรงกับ SLA ของเครื่องมือ SQL พื้นฐาน: Amazon Redshift และ Amazon Athena ลูกค้าสามารถค้นหาข้อมูลข้อผูกพันในการบริการโดยละเอียดในหน้าข้อตกลงระดับบริการที่เกี่ยวข้องสำหรับ Amazon Redshift และ Amazon Athena
ไม่ต้องใช้เซิร์ฟเวอร์
Amazon Redshift แบบไม่ต้องใช้เซิร์ฟเวอร์คืออะไร
Amazon Redshift แบบไม่ต้องใช้เซิร์ฟเวอร์ คือตัวเลือกแบบไม่ต้องใช้เซิร์ฟเวอร์ของ Amazon Redshift ที่ช่วยให้เรียกใช้และปรับขนาดการวิเคราะห์ได้อย่างมีประสิทธิภาพยิ่งขึ้นภายในเวลาไม่กี่วินาทีโดยไม่จำเป็นต้องตั้งค่าและจัดการโครงสร้างพื้นฐานคลังข้อมูล Redshift แบบไม่ต้องใช้เซิร์ฟเวอร์ช่วยให้ผู้ใช้ทุกคน รวมถึงนักวิเคราะห์ข้อมูล นักพัฒนา นักธุรกิจ และนักวิทยาศาสตร์ข้อมูล ได้รับข้อมูลเชิงลึกจากข้อมูลเพียงแค่โหลดและสืบค้นข้อมูลในคลังข้อมูล
ฉันจะเริ่มใช้งาน Amazon Redshift แบบไม่ต้องใช้เซิร์ฟเวอร์ได้อย่างไร
คุณสามารถเลือก "กำหนดค่า Amazon Redshift แบบไม่ต้องใช้เซิร์ฟเวอร์" และเริ่มสืบค้นข้อมูลได้เพียงทำไม่กี่ขั้นตอนในคอนโซลการจัดการของ AWS คุณสามารถใช้ประโยชน์จากชุดข้อมูลตัวอย่างที่โหลดไว้ล่วงหน้า เช่น ข้อมูลสภาพอากาศ ข้อมูลสำมะโน และชุดข้อมูลวัดประสิทธิภาพ พร้อมกับการสืบค้นตัวอย่างเพื่อเริ่มการวิเคราะห์ทันที คุณสามารถสร้างฐานข้อมูล สคีมา ตาราง และโหลดข้อมูลจาก Amazon S3, แชร์ข้อมูลของ Amazon Redshift หรือกู้คืนจากสแนปช็อตคลัสเตอร์ที่มีการเตรียมใช้งานของ Redshift ที่มีอยู่ และคุณยังสามารถสืบค้นข้อมูลโดยตรงในรูปแบบเปิด (เช่น Parquet หรือ ORC) ใน Data Lake ของ Amazon S3 หรือสืบค้นข้อมูลในฐานข้อมูลปฏิบัติการ เช่น Amazon Aurora และ Amazon RDS PostgreSQL และ MySQL ดูคู่มือเริ่มต้นใช้งาน
การใช้งาน Amazon Redshift แบบไม่ต้องใช้เซิร์ฟเวอร์มีข้อดีอย่างไรบ้าง
หากคุณไม่มีประสบการณ์ในการจัดการคลังข้อมูล คุณก็ไม่ต้องกังวลกับการตั้งค่า การกำหนดค่า การจัดการคลัสเตอร์ หรือการปรับแต่งคลังข้อมูล คุณสามารถให้ความสำคัญกับการรับข้อมูลเชิงลึกที่สำคัญจากข้อมูลของคุณ หรือการนำเสนอผลลัพธ์ทางธุรกิจหลักของคุณผ่านข้อมูล และจ่ายค่าบริการเฉพาะส่วนที่คุณใช้เท่านั้น ช่วยให้ดูแลจัดการต้นทุนได้ตลอด โดยคุณยังคงได้รับประโยชน์จากประสิทธิภาพชั้นยอดทั้งหมดของ Amazon Redshift, คุณสมบัติ SQL ที่หลากหลาย, การผสานรวมกับที่เก็บข้อมูลดิบและคลังข้อมูลปฏิบัติการอย่างราบรื่น และคุณสมบัติวิเคราะห์เชิงคาดการณ์ในตัวและการแชร์ข้อมูล หากคุณต้องการควบคุมคลังข้อมูลอย่างละเอียด คุณสามารถจัดเตรียมคลัสเตอร์ Redshift ได้
Amazon Redshift แบบไม่ต้องใช้เซิร์ฟเวอร์ใช้งานร่วมกับบริการอื่น ๆ ของ AWS ได้อย่างไรบ้าง
คุณสามารถใช้ฟังก์ชันการวิเคราะห์ที่หลากหลายทั้งหมดของ Amazon Redshift ได้ต่อไป เช่น การรวบรวมที่ซับซ้อน การสืบค้นโดยตรงไปยังข้อมูลใน Data Lake ของ Amazon S3 และฐานข้อมูลเชิงปฏิบัติการ, มุมมองผลการสืบค้น, ขั้นตอนกระบวนการที่จัดเก็บไว้, การสนับสนุนข้อมูลกึ่งมีโครงสร้าง และ ML อีกทั้งยังมีประสิทธิภาพสูงในทุกระดับขนาดอีกด้วย บริการที่เกี่ยวข้องทั้งหมดที่ Amazon Redshift ใช้งานร่วมกันได้ (เช่น Amazon Kinesis, AWS Lambda, Amazon QuickSight, Amazon SageMaker, Amazon EMR, AWS Lake Formation และ AWS Glue) ยังคงใช้งานกับ Amazon Redshift แบบไม่ต้องใช้เซิร์ฟเวอร์ต่อไปได้
มีกรณีใช้งานใดบ้างที่ฉันสามารถจัดการด้วย Amazon Redshift แบบไม่ต้องใช้เซิร์ฟเวอร์ได้
คุณสามารถเรียกใช้กรณีการใช้งานการวิเคราะห์ทั้งหมดต่อไปได้ Amazon Redshift แบบไม่ต้องใช้เซิร์ฟเวอร์ พร้อมเวิร์กโฟลว์การเริ่มต้นใช้งานที่เรียบง่าย การปรับขนาดอัตโนมัติ และการจ่ายค่าบริการตามที่ใช้งานช่วยให้การเรียกใช้การพัฒนาและการทดสอบสภาพแวดล้อมที่ต้องเริ่มต้นอย่างรวดเร็ว การวิเคราะห์ธุรกิจเฉพาะทาง เวิร์กโหลดที่มีความต้องการด้านการประมวลผลที่แตกต่างกันและคาดเดาไม่ได้ และเวิร์กโหลดที่ไม่ต่อเนื่องหรือไม่สม่ำเสมอมีประสิทธิภาพและคุ้มค่ายิ่งขึ้น
การนำข้อมูลเข้าและการโหลดข้อมูล
ฉันจะโหลดข้อมูลเข้าคลังข้อมูล Amazon Redshift ได้อย่างไร
คุณสามารถโหลดข้อมูลเข้าไปยัง Amazon Redshift ได้จากแหล่งที่มาของข้อมูลต่าง ๆ มากมาย ได้แก่ Amazon S3, Amazon RDS, Amazon DynamoDB, Amazon EMR, AWS Glue, AWS Data Pipeline และ/หรือโฮสต์ที่เปิดใช้ SSH บน Amazon EC2 หรือในองค์กร Amazon Redshift จะพยายามโหลดข้อมูลของคุณโดยพร้อมกันเข้าไปยังโหนดประมวลผลแต่ละโหนด เพื่อเพิ่มอัตราที่คุณสามารถนำข้อมูลเข้าไปยังคลัสเตอร์คลังข้อมูลของคุณได้ ไคลเอ็นต์สามารถเชื่อมต่อเข้ากับ Amazon Redshift โดยใช้ ODBC หรือ JDBC และออกคำสั่ง SQL 'insert' เพื่อแทรกข้อมูลได้ โปรดทราบว่า วิธีนี้จะช้ากว่าการใช้ S3 หรือ DynamoDB เนื่องจากวิธีการดังกล่าวจะโหลดข้อมูลโดยพร้อมกันไปยังโหนดประมวลผลแต่ละโหนด ขณะที่คำสั่ง ‘insert’ ของ SQL จะโหลดผ่านโหนดนำตัวเดียว สำหรับรายละเอียดเพิ่มเติมเกี่ยวกับการโหลดข้อมูลเข้าไปยัง Amazon Redshift โปรดดูที่ คู่มือการเริ่มใช้งานของเรา
การคัดลอกอัตโนมัติของ Redshift แตกต่างจากคำสั่งคัดลอกอย่างไร
การคัดลอกอัตโนมัติของ Redshift ช่วยให้สามารถใช้คำสั่งคัดลอกอัตโนมัติโดยการติดตามโฟลเดอร์ใน Amazon S3 และนำเข้าไฟล์ใหม่ๆ โดยที่ลูกค้าไม่ต้องดำเนินการเอง หากไม่ใช้ฟังก์ชันการคัดลอกอัตโนมัติ คำสั่งคัดลอกจะเริ่มต้นขั้นตอนการนำเข้าไฟล์สำหรับไฟล์ที่มีอยู่ทันที การคัดลอกอัตโนมัติจะส่งคำสั่งคัดลอกที่มีอยู่และสามารถ 1/ ทำให้ขั้นตอนการนำเข้าไฟล์เป็นแบบอัตโนมัติ โดยตรวจติดตามเส้นทางต่างๆ ใน Amazon S3 ที่ระบุสำหรับไฟล์ใหม่ๆ 2/ ใช้การกำหนดค่าการคัดลอกซ้ำ ลดความต้องการในการสร้างและเรียกใช้คำสั่งคัดลอกใหม่ๆ สำหรับงานการนำเข้าซ้ำๆ และ 3/ ติดตามไฟล์ที่โหลดมาเพื่อหลีกเลี่ยงการคัดลอกข้อมูลซ้ำ
ฉันจะเริ่มต้นใช้การคัดลอกอัตโนมัติของ Redshift ได้อย่างไร
ในการเริ่มต้น ลูกค้าควรมีโฟลเดอร์ใน Amazon S3 ซึ่งสามารถเข้าถึงได้โดยคลัสเตอร์/ตำแหน่งข้อมูลแบบไม่ต้องใช้เซิร์ฟเวอร์ของ Redshift โดยใช้บทบาทใน IAM ที่เกี่ยวข้อง และสร้างตาราง Redshift ที่จะใช้เป็นเป้าหมาย หลังจากที่เส้นทาง Amazon S3 และตาราง Redshift พร้อมแล้ว ลูกค้าสามารถสร้างงานคัดลอกโดยใช้คำสั่งคัดลอกได้ หลังจากสร้างงานคัดลอกแล้ว Redshift จะเริ่มติดตามเส้นทาง Amazon S3 ที่ระบุในการทำงานเบื้องหลัง และเริ่มคำสั่งคัดลอกที่ผู้ใช้กำหนดเพื่อคัดลอกไฟล์ใหม่ๆ ลงในตารางเป้าหมายโดยอัตโนมัติ
การผสานการทำงาน Amazon Redshift สำหรับ Apache Spark มีกรณีการใช้งานใดบ้าง
กรณีการใช้งานที่สำคัญมีดังนี้: 1/ ลูกค้าที่ใช้ Amazon EMR และ AWS Glue เพื่อเรียกใช้งาน Apache Spark ที่จะเข้าถึงและโหลดข้อมูลลงใน Amazon Redshift อันเป็นส่วนหนึ่งของไปป์ไลน์การนำข้อมูลเข้าและการแปลงข้อมูล (แบตช์และการสตรีม) 2/ ลูกค้าที่ใช้ Amazon SageMaker ในการดำเนินงานแมชชีนเลิร์นนิงโดยใช้ Apache Spark และจะต้องเข้าถึงข้อมูลที่จัดเก็บไว้ใน Amazon Redshift สำหรับกระบวนการสร้างฟีเจอร์ใหม่และการแปลงข้อมูล 3/ ลูกค้า Amazon Athena ที่ใช้ Apache Spark ในการวิเคราะห์เชิงโต้ตอบกับข้อมูลที่อยู่ใน Amazon Redshift
การผสานการทำงาน Amazon Redshift สำหรับ Apache Spark มีข้อดีอย่างไรบ้าง
Baikal มีประโยชน์ดังต่อไปนี้:
- ใช้งานง่ายในการเริ่มต้นและเรียกใช้แอปพลิเคชัน Apache Spark บนข้อมูลใน Amazon Redshift โดยไม่ต้องกังวลกับขั้นตอนที่ต้องดำเนินการด้วยตนเองซึ่งเกี่ยวข้องกับการตั้งค่าและการบำรุงรักษา Spark สำหรับเวอร์ชันที่ไม่ผ่านการรับรอง
- ความสะดวกในการใช้ Apache Spark จากบริการต่าง ๆ ของ AWS เช่น Amazon EMR, AWS Glue, Amazon Athena และ Amazon SageMaker พร้อม Amazon Redshift ด้วยการกำหนดค่าที่น้อยที่สุด
- ปรับปรุงประสิทธิภาพขณะเรียกใช้แอปพลิเคชัน Apache Spark บน Amazon Redshift
ฉันควรใช้ Amazon Aurora Zero-ETL เพื่อเชื่อมข้อมูลไปยัง Amazon Redshift แทนการสืบค้นข้อมูลจากส่วนกลางเมื่อใด
การเชื่อมข้อมูลจาก Amazon Aurora Zero-ETL ไปยัง Amazon Redshift ช่วยให้ลูกค้าของ Amazon Aurora และ Amazon Redshift สามารถเรียกใช้การวิเคราะห์ในแบบเกือบเรียลไทม์และแมชชีนเลิร์นนิงสำหรับข้อมูลการดำเนินการในระดับเพตะไบต์ได้ โดยเสนอโซลูชันที่มีการจัดการเต็มรูปแบบเพื่อจัดทำข้อมูลการดำเนินการจาก Amazon Aurora ที่มีอยู่ใน Amazon Redshift หลังจากเขียนออกมาได้ภายในไม่กี่วินาที ด้วยการเชื่อมข้อมูลจาก Amazon Aurora Zero-ETL ไปยัง Amazon Redshift ลูกค้าเพียงแค่ต้องเลือกตาราง Amazon Aurora ที่มีข้อมูลที่ตนต้องการเพื่อวิเคราะห์โดยใช้ Amazon Redshift และคุณสมบัตินี้จะทำซ้ำสคีมาและข้อมูลลงใน Amazon Redshift อย่างราบรื่น ซึ่งจะช่วยลดความจำเป็นที่ลูกค้าจะต้องสร้างและจัดการไปป์ไลน์ข้อมูลที่ซับซ้อน และมีเวลาให้ความสำคัญกับการพัฒนาแอปพลิเคชันของตนแทน การเชื่อมข้อมูลจาก Amazon Aurora Zero-ETL ไปยัง Amazon Redshift ช่วยให้ลูกค้าสามารถทำซ้ำข้อมูลจากคลัสเตอร์ฐานข้อมูล Amazon Aurora หลายแหล่งลงในอินสแตนซ์ Amazon Redshift เดียวกันเพื่อรับข้อมูลเชิงลึกที่ครบถ้วนทั่วแอปพลิเคชันต่างๆ ไปพร้อมกับรวบรวมสินทรัพย์การวิเคราะห์หลัก ประหยัดต้นทุนอย่างมาก และดำเนินงานได้อย่างมีประสิทธิภาพ การเชื่อมข้อมูลจาก Amazon Aurora Zero-ETL ไปยัง Amazon Redshift ช่วยให้ลูกค้าสามารถเข้าถึงการวิเคราะห์หลักและความสามารถด้านแมชชีนเลิร์นนิงของ Amazon Redshift ได้ด้วย เช่น มุมมองผลการสืบค้น การแชร์ข้อมูล และการเข้าถึงแหล่งเก็บข้อมูลและ Data Lake หลายแหล่งจากส่วนกลาง ซึ่งช่วยให้ลูกค้าสามารถรวมการวิเคราะห์หลักในแบบเกือบเรียลไทม์เพื่อรับข้อมูลเชิงลึกสุดรวดเร็วที่จะช่วยในการตัดสินใจทางธุรกิจอย่างมีข้อมูล นอกจากนี้ ลูกค้าจะใช้ Amazon Aurora สำหรับธุรกรรมและ Amazon Redshift สำหรับการวิเคราะห์ จึงไม่จำเป็นต้องใช้แหล่งข้อมูลการประมวลผลร่วมกัน ทำให้ได้โซลูชันที่มีประสิทธิภาพการทำงานและการดำเนินงานที่เสถียร
การเชื่อมข้อมูลจาก Amazon Aurora Zero-ETL ไปยัง Amazon Redshift มีความสัมพันธ์กับ/ทำงานร่วมกับบริการอื่น ๆ ของ AWS อย่างไร
การบูรณาการ ETL แบบไร้รอยต่อของ Amazon Aurora กับ Amazon Redshift นำเสนอการผสานรวมที่ราบรื่นระหว่างบริการทั้งสองสำหรับการวิเคราะห์ธุรกรรม
การนำเข้าข้อมูลการสตรีมทำงานอย่างไร
ข้อมูลการสตรีมแตกต่างจากตารางฐานข้อมูลแบบเดิมตรงที่เมื่อคุณสืบค้นการสตรีม คุณกำลังได้รับวิวัฒนาการความสัมพันธ์ที่แปรเปลี่ยนตามเวลา ในขณะที่ตารางจะบันทึกสแนปช็อต ณ จุดเวลาใดเวลาหนึ่งของความสัมพันธ์ที่แปรเปลี่ยนตามเวลานี้ ลูกค้าของ Amazon Redshift คุ้นเคยกับการทำงานกับตารางทั่วไปและดำเนินการประมวลผลขั้นปลาย (เช่น การแปลงข้อมูล) ของข้อมูลโดยใช้โมเดลแบตช์แบบเดิม เช่น “ELT” เรามอบวิธีการใช้มุมมองผลการสืบค้น (MV) ของ Redshift เพื่อให้ลูกค้าสามารถเห็นมุมมองผลการสืบค้น ณ จุดเวลาใดเวลาหนึ่งของการสตรีมได้ง่ายๆ ซึ่งรวมกันเป็นเวลาที่ใช้ในการสืบค้น และรวดเร็วพอที่จะรองรับเวิร์กโฟลว์ ELT
การแบ่งปันข้อมูล
กรณีการใช้งานสำหรับการแชร์ข้อมูลมีอะไรบ้าง
กรณีการใช้งานที่สำคัญมีดังนี้
- การแชร์ข้อมูลของคลัสเตอร์ ETL ส่วนกลางกับคลัสเตอร์ BI/การวิเคราะห์จำนวนมาก เพื่อแยกปริมาณงานในการอ่านและดูแลควบคุมเพิ่มเติม
- ผู้ให้บริการข้อมูลแชร์ข้อมูลกับผู้บริโภคภายนอก
- การแชร์ชุดข้อมูลทั่วไป เช่น ลูกค้า ผลิตภัณฑ์ในกลุ่มธุรกิจต่างๆ และการทำงานร่วมกันเพื่อการวิเคราะห์ในวงกว้างและวิทยาศาสตร์ข้อมูล
- การกระจายศูนย์ข้อมูลเพื่อให้จัดการได้ง่ายขึ้น
- การแชร์ข้อมูลระหว่างสภาพแวดล้อมการพัฒนา การทดสอบ และการผลิต
- การเข้าถึงข้อมูล Redshift จากบริการวิเคราะห์อื่นๆ ของ AWS
การสืบค้นข้ามฐานข้อมูลใน Amazon Redshift คืออะไร
การสืบค้นข้ามฐานข้อมูลทำให้คุณสามารถสืบค้นและรวมข้อมูลจากฐานข้อมูล Redshift ต่างๆ ที่คุณมีสิทธิ์เข้าถึงเข้าด้วยกันได้อย่างราบรื่น ไม่ว่าคุณกำลังเชื่อมต่อกับฐานข้อมูลใดอยู่ก็ตาม ซึ่งรวมถึงฐานข้อมูลที่อยู่ในคลัสเตอร์ และชุดข้อมูลสำหรับแชร์ที่มีให้จากคลัสเตอร์ระยะไกล การสืบค้นข้ามฐานข้อมูลช่วยให้คุณสามารถจัดระเบียบข้อมูลเป็นฐานข้อมูลที่แยกกันได้อย่างยืดหยุ่นเพื่อให้รองรับการกำหนดค่าแบบหลายผู้ใช้ได้
ใครใช้งาน AWS Data Exchange เป็นหลัก
AWS Data Exchange ช่วยให้ลูกค้า AWS สามารถแลกเปลี่ยนและใช้ข้อมูลของบุคคลภายนอกใน AWS ได้อย่างปลอดภัยและมีประสิทธิภาพมากขึ้น นักวิเคราะห์ข้อมูล ผู้จัดการผลิตภัณฑ์ ผู้จัดการพอร์ตโฟลิโอ นักวิทยาศาสตร์ข้อมูล นักวิจัยเชิงปริมาณ ช่างเทคนิคด้านการทดลองทางคลินิก และนักพัฒนาในเกือบทุกอุตสาหกรรมต่างต้องการเข้าถึงข้อมูลจำนวนมากขึ้นเพื่อดำเนินการวิเคราะห์ ฝึกฝนโมเดล ML และตัดสินใจโดยใช้ข้อมูลเป็นหลัก แต่ไม่มีอะไรที่สามารถค้นหาข้อมูลจากผู้ให้บริการหลายรายได้ อีกทั้งผู้ให้บริการแต่ละรายยังส่งมอบข้อมูลแตกต่างกัน ทำให้ต้องเจอกับสื่อทางกายภาพ, ข้อมูล FTP และการเรียก API ตามความต้องการแบบต่างๆ มากมาย ในทางกลับกัน องค์กรจำนวนมากต้องการให้ข้อมูลของตนพร้อมสำหรับวัตถุประสงค์ด้านการวิจัยหรือการค้า แต่การสร้างและการดูแลการส่งข้อมูล การให้สิทธิ์ และเทคโนโลยีการเรียกเก็บเงินนั้นยากและมีต้นทุนสูง ซึ่งลดการให้ข้อมูลที่มีค่าให้ต่ำลงไปอีก
ความสามารถในการเพิ่มทรัพยากรและการทำงานพร้อมกัน
ฉันสามารถปรับขนาดและประสิทธิภาพของคลัสเตอร์คลังข้อมูล Amazon Redshift ได้อย่างไร
Amazon Redshift Serverless จะจัดเตรียมความจุของคลังข้อมูลโดยอัตโนมัติ และปรับทรัพยากรพื้นฐานอย่างชาญฉลาด Amazon Redshift แบบไม่ต้องใช้เซิร์ฟเวอร์จะปรับความจุในไม่กี่วินาทีเพื่อมอบประสิทธิภาพที่สูงอย่างสม่ำเสมอ และลดความยุ่งยากในการปฏิบัติงานสำหรับเวิร์กโหลดที่มีความต้องการสูงและผันผวนมากที่สุด คุณสมบัติการปรับขนาดพร้อมกันเปิดโอกาสให้คุณสนับสนุนผู้ใช้และการสืบค้นพร้อมกันได้อย่างไม่จำกัดจำนวน โดยมีประสิทธิภาพการสืบค้นที่รวดเร็วสม่ำเสมอ เมื่อมีการเปิดใช้งานการปรับขนาดพร้อมกัน Amazon Redshift จะเพิ่มความจุคลัสเตอร์ให้โดยอัตโนมัติเมื่อประสบการณ์คลัสเตอร์ของคุณเพิ่มขึ้นในคิวการสืบค้น
สำหรับการเพิ่มทรัพยากรด้วยตนเอง หากคุณต้องการเพิ่มประสิทธิภาพในการสืบค้นและการตอบสนองต่อ CPU, หน่วยความจำ หรือการใช้งาน I/O เกินกำลัง คุณสามารถเพิ่มจำนวนโหนดภายในคลัสเตอร์คลังข้อมูลได้โดยใช้ Elastic Resize ผ่าน คอนโซลการจัดการของ AWS หรือ API ModifyCluster หากคุณปรับเปลี่ยนคลัสเตอร์คลังข้อมูล ระบบจะดำเนินการปรับเปลี่ยนตามที่คุณร้องขอโดยทันที ตัวชี้วัดสำหรับการใช้งานการประมวลผล การใช้งานพื้นที่จัดเก็บ และปริมาณการเขียน/อ่านข้อมูลในคลัสเตอร์คลังข้อมูล Redshift สามารถใช้งานได้ฟรีผ่านคอนโซลการจัดการของ AWS หรือ API ของ Amazon CloudWatch นอกจากนี้ คุณยังสามารถเพิ่มตัวชี้วัดที่ผู้ใช้กำหนดผ่านฟังก์ชันตัวชี้วัดแบบกำหนดเองของ Amazon CloudWatch ได้เช่นกัน
Amazon Redshift Spectrum ช่วยให้คุณสามารถเรียกใช้คลัสเตอร์ Redshift ได้หลายตัวซึ่งมีการเข้าถึงข้อมูลเดียวกันใน Amazon S3 คุณสามารถใช้คลัสเตอร์ที่ต่างกันสำหรับกรณีใช้งานที่ต่างกันได้ ตัวอย่างเช่น คุณสามารถใช้หนึ่งคลัสเตอร์สำหรับการรายงานมาตรฐานและอีกหนึ่งคลัสเตอร์สำหรับการสืบค้นข้อมูล ฝ่ายการตลาดของคุณสามารถใช้คลัสเตอร์ของตนเองที่แตกต่างจากฝ่ายปฏิบัติการได้ Redshift Spectrum จะกระจายการดำเนินการสืบค้นไปยังโปรแกรมทำงานของ Redshift Spectrum ทั้งหลายนอกเหนือจากแหล่งทรัพยากรที่ใช้ร่วมกันเพื่ออ่านและประมวลผลข้อมูลจาก Amazon S3 และดึงผลลัพธ์กลับไปยังคลัสเตอร์ Redshift เพื่อการประมวลผลใดๆ ที่เหลืออยู่
ฉันจะยังสามารถใช้งานคลัสเตอร์คลังข้อมูลของฉันในระหว่างการปรับขนาดได้หรือไม่
ขึ้นอยู่กับสถานการณ์ เมื่อคุณใช้คุณสมบัติการปรับขนาดพร้อมกัน คลัสเตอร์จะพร้อมให้ใช้งานเพื่ออ่านและเขียนอย่างเต็มที่ในระหว่างการปรับขนาดพร้อมกัน ด้วย Elastic Resize คลัสเตอร์จะไม่พร้อมให้ใช้งานเป็นเวลาสี่ถึงแปดนาทีของช่วงเวลาที่ปรับขนาด ด้วยความยืดหยุ่นในการเก็บข้อมูลของ Redshift RA3 ในพื้นที่จัดเก็บที่มีการจัดการ คลัสเตอร์จะพร้อมให้ใช้งานได้อย่างเต็มที่ และข้อมูลจะถูกย้ายระหว่างพื้นที่จัดเก็บที่มีการจัดการกับโหนดประมวลผลโดยอัตโนมัติ
Elastic Resize คืออะไรและแตกต่างจากการปรับขนาดพร้อมกันอย่างไร
Elastic Resize จะเพิ่มหรือลบโหนดจากคลัสเตอร์ Redshift เดียวภายในไม่กี่นาทีเพื่อจัดการกับอัตราการโอนถ่ายข้อมูลการสืบค้น ตัวอย่างเช่น เวิร์กโหลด ETL สำหรับจำนวนชั่วโมงที่กำหนดในการรายงานแบบต่อวันหรือสิ้นเดือนอาจจำเป็นต้องใช้ทรัพยากร Amazon Redshift เพิ่มเติมเพื่อให้เสร็จสมบูรณ์ทันเวลา การปรับขนาดพร้อมกันจะเพิ่มทรัพยากรคลัสเตอร์เพิ่มเติมเพื่อเพิ่มความสามารถในการทำงานพร้อมกันของการสืบค้นโดยรวม
ฉันสามารถเข้าถึงคลัสเตอร์การปรับขนาดพร้อมกันได้โดยตรงหรือไม่
ไม่ได้ การปรับขนาดพร้อมกันเป็นแหล่งรวมทรัพยากรขนาดใหญ่ของ Amazon Redshift และลูกค้าไม่สามารถเข้าถึงได้โดยตรง
การรักษาความปลอดภัย
Amazon Redshift รักษาความปลอดภัยให้กับข้อมูลของฉันอย่างไร
Amazon Redshift รองรับความปลอดภัยระดับชั้นนำของอุตสาหกรรมด้วยการผสานรวมการจัดการข้อมูลระบุตัวตนและระบบเชื่อมโยงข้อมูลสำหรับการเข้าสู่ระบบครั้งเดียว (SSO), การยืนยันตัวตนโดยใช้หลายปัจจัย (MFA), การควบคุมการเข้าถึงระดับคอลัมน์, การรักษาความปลอดภัยระดับแถว, การควบคุมการเข้าถึงตามบทบาท และ Amazon Virtual Private Cloud (Amazon VPC) Amazon Redshift ช่วยเข้ารหัสข้อมูลของคุณในขณะที่ถ่ายโอนและจัดเก็บ คุณสมบัติด้านการรักษาความปลอดภัยทั้งหมดของ Amazon Redshift พร้อมใช้งานได้ทันทีโดยไม่ต้องมีค่าใช้จ่ายเพิ่มเติมเพื่อตอบสนองความต้องการด้านการรักษาความปลอดภัย ความเป็นส่วนตัว และการปฏิบัติตามข้อกำหนดที่เข้มงวดที่สุด คุณจะได้สัมผัสข้อดีจาก AWS ที่สนับสนุนมาตรฐานความปลอดภัยและใบรับรองการปฏิบัติตามข้อกำหนดมากกว่าผู้ให้บริการรายอื่นๆ รวมถึง ISO 27001, SOC, HIPAA/HITECH และ FedRAMP
Redshift รองรับการควบคุมการเข้าถึงแบบละเอียดหรือไม่
ใช่ Amazon Redshift รองรับการควบคุมการเข้าถึงตามบทบาท การควบคุมการเข้าถึงในระดับแถวจะช่วยให้คุณกำหนดอย่างน้อยหนึ่งบทบาทให้แก่ผู้ใช้ได้ และกำหนดสิทธิ์อนุญาตของระบบและอ็อบเจกต์ตามบทบาท คุณสามารถใช้บทบาทของระบบได้ทันที ไม่ว่าจะเป็นผู้ใช้ที่มีสิทธิ์ใช้งานสูงสุด, DBA, ผู้ปฏิบัติงาน และผู้ดูแลระบบความปลอดภัย หรือจะสร้างบทบาทของคุณเองก็ได้
Amazon Redshift รองรับการปกปิดข้อมูลหรือการทำให้เป็นข้อมูลโทเค็นหรือไม่
ฟังก์ชันที่กำหนดโดยผู้ใช้ของ AWS Lambda (UDF) ช่วยให้คุณสามารถใช้ฟังก์ชัน AWS Lambda เป็น UDF ใน Amazon Redshift และเรียกใช้จากการสืบค้นบน Redshift SQL ได้ ฟังก์ชันนี้ช่วยให้คุณสามารถเขียนส่วนขยายแบบกำหนดเองสำหรับการสืบค้น SQL ของคุณ เพื่อให้สามารถผสานรวมเข้ากับบริการอื่นๆ หรือผลิตภัณฑ์จากบุคคลภายนอกได้ดียิ่งขึ้น คุณสามารถเขียน Lambda UDF เพื่อเปิดใช้งานการสร้างโทเค็นภายนอก การมาสก์ข้อมูล การระบุตัวตนหรือการไม่ระบุตัวตนของข้อมูลโดยการผสานรวมกับผู้จัดจำหน่าย เช่น Protegrity และปกป้องหรือยกเลิกการปกป้องข้อมูลที่ละเอียดอ่อนตามสิทธิ์และกลุ่มของผู้ใช้ในระหว่างเวลาสืบค้น
การรองรับการมาสก์ข้อมูลแบบไดนามิกช่วยให้ลูกค้าปกป้องข้อมูลที่ละเอียดอ่อนได้อย่างง่ายดายและควบคุมการเข้าถึงอย่างละเอียดด้วยการจัดการนโยบายการมาสก์ข้อมูล สมมติว่าคุณมีแอปพลิเคชันที่มีผู้ใช้และอ็อบเจกต์หลายรายซึ่งมีข้อมูลที่ละเอียดอ่อนที่ไม่สามารถเปิดเผยต่อผู้ใช้ทั้งหมดได้ คุณมีข้อกำหนดในการจัดเตรียมระดับความปลอดภัยอย่างละเอียดที่แตกต่างกัน ซึ่งคุณต้องการใช้กับผู้ใช้กลุ่มต่างๆ Redshift Dynamic Data Masking สามารถกำหนดค่าได้เพื่ออนุญาตให้ลูกค้ากำหนดค่าข้อมูลที่มาสก์ในแบบที่สอดคล้องกัน รักษารูปแบบ และเปลี่ยนกลับไม่ได้ เมื่อคุณสมบัตินี้เป็น GA คุณจะเริ่มใช้งานได้ทันที ผู้ดูแลระบบด้านการรักษาความปลอดภัยสามารถสร้างและใช้นโยบายด้วยคำสั่งเพียงเล็กน้อย
Amazon Redshift รองรับการเข้าสู่ระบบครั้งเดียวหรือไม่
ใช่ ลูกค้าที่ต้องการใช้ผู้ให้บริการข้อมูลประจำตัวสำหรับองค์กร เช่น Microsoft Azure Active Directory, Active Directory Federation Services, Okta, Ping Federate หรือผู้ให้บริการข้อมูลประจำตัวที่เป็นไปตามมาตรฐาน SAML อื่นๆ สามารถกำหนดค่า Amazon Redshift ให้รองรับการเข้าสู่ระบบครั้งเดียวได้ คุณสามารถเข้าสู่ระบบคลัสเตอร์ Amazon Redshift ได้ด้วยข้อมูลประจำตัวของ Microsoft Azure Active Directory (AD) วิธีนี้จะช่วยให้คุณสามารถเข้าสู่ระบบ Redshift โดยไม่ซ้ำซ้อนกับข้อมูลประจำตัวของ Azure Active Directory ใน Redshift
Amazon Redshift รองรับการยืนยันตัวตนโดยใช้หลายปัจจัย (MFA) หรือไม่
ใช่ คุณสามารถใช้การยืนยันตัวตนโดยใช้หลายปัจจัย (MFA) เพื่อเพิ่มความปลอดภัยในการตรวจสอบสิทธิ์เพื่อเข้าสู่คลัสเตอร์ Amazon Redshift
ความพร้อมใช้งานและความคงทน
ในกรณีที่โหนดบางตัวหยุดทำงาน จะเกิดอะไรขึ้นกับความพร้อมใช้งานของคลัสเตอร์คลังข้อมูลและความคงทนของข้อมูล
Amazon Redshift จะตรวจจับและเปลี่ยนโหนดที่ทำงานล้มเหลวในคลัสเตอร์คลังข้อมูลของคุณโดยอัตโนมัติ บนคลัสเตอร์ Dense Compute (DC) และ Dense Storage (DS2) ข้อมูลจะถูกเก็บไว้ในโหนดประมวลผลเพื่อให้แน่ใจว่าข้อมูลจะมีความทนทานสูง เมื่อเปลี่ยนโหนดแล้ว ระบบจะรีเฟรชข้อมูลจากสำเนาบนโหนดอื่น คลัสเตอร์ RA3 และ Redshift ที่ไม่ต้องใช้เซิร์ฟเวอร์จะไม่ได้รับผลกระทบในลักษณะเดียวกันนี้ เนื่องจากข้อมูลถูกจัดเก็บไว้ใน Amazon S3 และไดรฟ์ในเครื่องเป็นเพียงแคชข้อมูลเท่านั้น คลัสเตอร์คลังข้อมูลจะไม่สามารถใช้งานในการสืบค้นและไม่สามารถอัปเดตได้จนกว่าระบบจะจัดเตรียมโหนดเปลี่ยนแทนให้และเพิ่มโหนดไปยังฐานข้อมูล Amazon Redshift ช่วยให้สามารถใช้งานโหนดเปลี่ยนแทนได้ทันทีและโหลดข้อมูลที่มีการเข้าถึงบ่อยที่สุดจาก Amazon S3 ก่อน เพื่อให้คุณดำเนินการสืบค้นข้อมูลของคุณต่อได้อย่างรวดเร็วที่สุด คลัสเตอร์โหนดแบบเดี่ยวไม่รองรับการทำสำเนาข้อมูล ในกรณีที่ไดรฟ์หยุดทำงาน คุณต้องกู้คืนคลัสเตอร์จากสแนปช็อตบน S3 เราแนะนำให้ใช้อย่างน้อยสองโหนดสำหรับการทำสำเนาข้อมูล
หาก Availability Zone (AZ) ของคลัสเตอร์คลังข้อมูลของฉันเกิดขัดข้อง จะเกิดอะไรขึ้นกับความพร้อมใช้งานของคลัสเตอร์คลังข้อมูลและความคงทนของข้อมูล
หากคลังข้อมูล Amazon Redshift ของ Availability Zone เป็นการนำไปใช้แบบ Single-AZ และ Availability Zone ของคลัสเตอร์ไม่พร้อมใช้งาน Amazon Redshift จะย้ายคลัสเตอร์ของคุณไปยัง AWS Availability Zone (AZ) อื่นโดยอัตโนมัติโดยไม่มีการสูญเสียข้อมูลหรือเปลี่ยนแปลงแอปพลิเคชัน โดยคุณต้องเปิดใช้งานความสามารถในการย้ายระบบในการตั้งค่าคลัสเตอร์เพื่อเปิดใช้ฟังก์ชันนี้
ทำไมฉันจึงควรใช้การใช้งานอินสแตนซ์แบบ Multi-AZ
ตอนนี้ลูกค้าสามารถปรับปรุงความพร้อมใช้งานของ Redshift ได้โดยเรียกใช้คลังข้อมูลในการใช้งานอินสแตนซ์แบบ Multi-AZ ซึ่งแตกต่างจากการนำไปใช้แบบ Single-AZ การใช้งานอินสแตนซ์แบบ Multi-AZ ช่วยให้คุณเรียกใช้คลังข้อมูลได้ในหลาย AWS Availability Zones (AZ) พร้อมกัน และปฏิบัติงานต่อไปเมื่อเกิดสถานการณ์ที่ต้องหยุดทำงานโดยไม่คาดคิด ไม่ต้องเปลี่ยนแปลงแอปพลิเคชันเพื่อรักษาความต่อเนื่องทางธุรกิจเนื่องจากการใช้งานอินสแตนซ์แบบ Multi-AZ ได้รับการจัดการเป็นคลังข้อมูลเดียวที่มีตำแหน่งข้อมูลเดียว การใช้งานอินสแตนซ์แบบ Multi-AZ ช่วยลดเวลาการกู้คืนโดยรับประกันความสามารถในการกู้คืนโดยอัตโนมัติ และเหมาะสำหรับลูกค้าที่มีแอปพลิเคชันการวิเคราะห์ที่สำคัญต่อธุรกิจ ซึ่งต้องการความพร้อมใช้งานและความสามารถในการฟื้นตัวต่อการหยุดทำงานของ AZ ในระดับสูง ซึ่งยังช่วยให้ลูกค้าสามารถใช้โซลูชันที่สอดคล้องกับคำแนะนำของ Reliability Pillar ของเฟรมเวิร์ก AWS Well-Architected ได้มากขึ้น หากต้องการเรียนรู้เพิ่มเติมเกี่ยวกับ Amazon Redshift Multi-AZ โปรดดูที่นี่
RPO และ RTO คืออะไร RPO และ RTO ใดบ้างที่รองรับการใช้งานอินสแตนซ์แบบ Multi-AZ
RPO ย่อมาจาก Recovery Point Objective และเป็นคำที่ใช้อธิบายการรับประกันความใหม่ของข้อมูลในกรณีที่หยุดทำงาน RPO คือระยะเวลาสูงสุดที่ยอมรับได้ นับจากจุดกู้คืนข้อมูลล่าสุด ซึ่งจะกำหนดสิ่งที่พิจารณาว่าเป็นการสูญหายของข้อมูลที่ยอมรับได้ระหว่างจุดกู้คืนล่าสุดและการหยุดชะงักของบริการ Redshift Multi-AZ รองรับ RPO = 0 หมายความว่าข้อมูลจะรับประกันว่าเป็นข้อมูลล่าสุดและเป็นปัจจุบันในกรณีที่หยุดทำงาน การทดสอบก่อนการเปิดตัวของเราพบว่า RTO ที่มีการปรับใช้การใช้งานอินสแตนซ์แบบ Multi-AZ ของ Amazon Redshift นั้นใช้เวลาน้อยกว่า 60 วินาทีหรือน้อยกว่าในกรณีที่เกิดความล้มเหลวของ AZ ซึ่งไม่น่าจะเกิดขึ้นได้
Redshift Multi-AZ เปรียบเทียบกับคุณสมบัติ Redshift Relocation ที่มีอยู่อย่างไร
Redshift Relocation จะเปิดใช้งานเป็นค่าเริ่มต้นบนคลัสเตอร์ RA3 ใหม่และตำแหน่งข้อมูลแบบไม่ต้องใช้เซิร์ฟเวอร์ทั้งหมด ซึ่งช่วยให้คลังข้อมูลสามารถเริ่มต้นใหม่ใน AZ อื่นได้ในกรณีที่เกิดการหยุดทำงานขนาดใหญ่ โดยไม่สูญเสียข้อมูลหรือค่าใช้จ่ายเพิ่มเติม แม้ว่าการใช้คุณสมบัติย้ายระบบจะไม่มีค่าใช้จ่าย แต่ก็มีข้อจำกัด เพราะเป็นวิธีที่พยายามอย่างเต็มที่โดยขึ้นอยู่กับความพร้อมใช้งานของทรัพยากรใน AZ ที่กู้คืน และระยะเวลาที่ใช้ในการกู้คืนข้อมูล (RTO) อาจได้รับผลกระทบจากปัญหาอื่นที่เกี่ยวข้องกับการเริ่มต้นคลัสเตอร์ใหม่ ซึ่งอาจส่งผลให้ใช้เวลากู้คืนตั้งแต่ 10 ถึง 60 นาที Redshift Multi-AZ รองรับความต้องการความพร้อมใช้งานในระดับสูงโดยมอบ RTO ที่วัดได้ในระดับสิบวินาทีและรับประกันการทำงานต่อเนื่อง เนื่องจากไม่อยู่ภายใต้ข้อจำกัดด้านความจุหรือปัญหาอื่นๆ ที่อาจเกิดขึ้นในการสร้างคลัสเตอร์ใหม่
การสืบค้นและการวิเคราะห์
Amazon Redshift และ Redshift Spectrum ใช้งานร่วมกับแพ็คเกจซอฟต์แวร์ธุรกิจอัจฉริยะและเครื่องมือ ETL ที่ฉันต้องการได้หรือไม่
ได้ Amazon Redshift ใช้ SQL ตามมาตรฐานอุตสาหกรรมและสามารถเข้าถึงได้โดยใช้ไดรฟ์เวอร์ JDBC และ ODBC แบบมาตรฐาน คุณสามารถดาวน์โหลดไดรฟ์เวอร์ JDBC และ ODBC แบบกำหนดเองของ Amazon Redshift ได้จากแท็บ Connect Client ของ Redshift Console เรามีการผสานการทำงานที่ได้รับการตรวจสอบแล้วกับ ผู้จัดจำหน่าย BI และ ETL ยอดนิยม โดยบางรายเสนอ ช่วงทดลองใช้งานฟรี เพื่อช่วยให้คุณสามารถเริ่มใช้งานการโหลดและการวิเคราะห์ข้อมูล นอกจากนั้น คุณยังสามารถไปที่ AWS Marketplace เพื่อติดตั้งใช้จริงและกำหนดค่าโซลูชันที่ได้รับการออกแบบมาเพื่อใช้งานร่วมกับ Amazon Redshift ได้ภายในไม่กี่นาที
Amazon Redshift Spectrum รองรับเครื่องมือไคลเอ็นต์ของ Amazon Redshift ทุกแบบ เครื่องมือไคลเอ็นต์สามารถเชื่อมต่อกับตำแหน่งข้อมูลของคลัสเตอร์ Amazon Redshift ต่อไปได้โดยใช้การเชื่อมต่อ ODBC หรือ JDBC ไม่จำเป็นต้องปรับเปลี่ยนใดๆ
คุณต้องใช้โครงสร้างและความสามารถในการสืบค้นแบบเดียวกันเพื่อเข้าถึงตารางใน Redshift Spectrum ตามที่คุณมีสำหรับตารางในพื้นที่จัดเก็บภายในคลัสเตอร์ Redshift ของคุณ โดยระบบจะอ้างอิงตารางภายนอกโดยใช้ชื่อสคีมาที่กำหนดไว้ในคำสั่ง CREATE EXTERNAL SCHEMA ในที่ซึ่งลงทะเบียนคำสั่งเอาไว้
Amazon Redshift Spectrum รองรับรูปแบบข้อมูลและรูปแบบการบีบอัดประเภทใดบ้าง
ปัจจุบัน Amazon Redshift Spectrum รองรับรูปแบบข้อมูลแบบโอเพนซอร์สหลากหลายแบบด้วยกัน ได้แก่ Avro, CSV, Grok, Amazon Ion, JSON, ORC, Parquet, RCFile, RegexSerDe, Sequence, Text และ TSV <br>ปัจจุบัน Amazon Redshift Spectrum รองรับการบีบอัด Gzip และ Snappy
จะเกิดอะไรขึ้นหากตารางในพื้นที่จัดเก็บภายในของฉันมีชื่อเหมือนกันกับตารางภายนอก
คุณสามารถใช้ชื่อสคีมาในการเลือกตารางที่คุณต้องการโดยใช้ schema_name.table_name ในการสืบค้น เหมือนที่ทำกับตารางภายใน
ฉันใช้งาน Hive Metastore ในการจัดเก็บข้อมูลเมตาเกี่ยวกับ Data Lake S3 ของฉัน ฉันสามารถใช้ Redshift Spectrum ได้หรือไม่
ใช่ คำสั่ง CREATE EXTERNAL SCHEMA รองรับ Hive Metastore แต่เราไม่ยังไม่รองรับ DDL สำหรับ Hive Metastore ในตอนนี้
ฉันจะรับรายการตารางฐานข้อมูลภายนอกทั้งหมดที่สร้างขึ้นในคลัสเตอร์ได้อย่างไร
คุณสามารถสืบค้นตารางระบบ SVV_EXTERNAL_TABLES เพื่อรับข้อมูลดังกล่าวได้
Redshift รองรับความสามารถในการใช้แมชชีนเลิร์นนิงด้วย SQL หรือไม่
ใช่ คุณสมบัติ Amazon Redshift ML ช่วยให้ผู้ใช้ SQL สามารถสร้าง ฝึกอบรม และติดตั้งใช้งานโมเดลแมชชีนเลิร์นนิง (ML) ได้อย่างง่ายดายด้วยการใช้คำสั่ง SQL ที่คุ้นเคย Amazon Redshift ML ช่วยให้คุณสามารถใช้ประโยชน์จากข้อมูลของคุณใน Amazon Redshift ด้วย Amazon SageMaker ซึ่งเป็นบริการ ML ที่มีการจัดการอย่างเต็มรูปแบบ Amazon Redshift รองรับทั้งการเรียนรู้แบบไม่มีผู้ดูแล (K-Means) และการเรียนรู้แบบมีผู้ดูแล (อัลกอริทึม Autopilot, XGBoost, MLP) คุณยังสามารถใช้บริการ AI ด้านภาษาของ AWS เพื่อแปล ตรวจทาน และวิเคราะห์ช่องข้อความในการสืบค้น SQL ด้วยฟังก์ชัน Lambda UDF ที่สร้างไว้ล่วงหน้าได้ด้วย ดูบล็อกโพสต์
Amazon Redshift มี API เพื่อสืบค้นข้อมูลหรือไม่
Amazon Redshift มี Data API ที่คุณสามารถเข้าถึงข้อมูลได้อย่างสะดวกจาก Amazon Redshift ด้วยแอปพลิเคชัน Cloud-Native แบบดั้งเดิมทุกประเภท บริการบนเว็บแบบไม่ต้องใช้เซิร์ฟเวอร์และอยู่ในคอนเทนเนอร์ รวมถึงแอปพลิเคชันที่ขับเคลื่อนด้วยเหตุการณ์ Data API ช่วยลดความซับซ้อนในการเข้าถึง Amazon Redshift เนื่องจากคุณไม่จำเป็นต้องกำหนดค่าไดรฟ์เวอร์และจัดการการเชื่อมต่อฐานข้อมูล คุณสามารถเรียกใช้คำสั่ง SQL ไปยังคลัสเตอร์ Amazon Redshift ได้อย่างง่ายดายเพียงแค่เรียกตำแหน่งข้อมูล API ที่ปลอดภัยซึ่งได้รับจาก Data API Data API ดูแลในส่วนของการจัดการการเชื่อมต่อฐานข้อมูลและการบัฟเฟอร์ข้อมูล และ Data API เป็นแบบอะซิงโครนัส คุณจึงสามารถดึงผลลัพธ์ได้ในภายหลัง ผลการสืบค้นของคุณจะถูกจัดเก็บไว้เป็นเวลา 24 ชั่วโมง
ฉันสามารถใช้ข้อมูลประจำตัวประเภทใดบ้างกับ Data API ของ Amazon Redshift
Data API รองรับทั้งข้อมูลประจำตัว IAM และข้อมูลประจำตัวที่ใช้คีย์ลับจาก AWS Secrets Manager Data API รวมเข้ากับข้อมูลประจำตัว AWS Identity and Access Management (IAM) ดังนั้นคุณจึงสามารถใช้งานผู้ให้บริการข้อมูลประตัวอย่าง Okta หรือ Azure Active Directory หรือข้อมูลประจำตัวฐานข้อมูลที่จัดเก็บใน Secrets Manager โดยไม่ต้องผ่านข้อมูลประจำตัวฐานข้อมูลในการเรียกใช้ API
ฉันสามารถใช้ Data API ของ Amazon Redshift จาก AWS CLI ได้หรือไม่
ได้ คุณสามารถใช้ Data API จาก AWS CLI โดยใช้ตัวเลือกบรรทัดคำสั่งที่เป็นข้อมูลของ AWS Redshift ได้
Data API ของ Redshift ผสานการทำงานกับบริการของ AWS อื่นหรือไม่
คุณสามารถใช้ Data API จากบริการอื่น เช่น AWS Lambda, AWS Cloud9, AWS AppSync และ Amazon EventBridge ได้
ฉันต้องจ่ายค่าบริการการใช้งาน Data API ของ Amazon Redshift แยกต่างหากหรือไม่
ไม่ Data API ไม่มีค่าบริการแยกต่างหาก
การบูรณาการ ETL แบบไร้รอยต่อ
ETL แบบไร้รอยต่อคืออะไร
ETL แบบไร้รอยต่อ เป็นชุดของการบูรณาการที่มีการจัดการอย่างสมบูรณ์โดย AWS ซึ่งจะลบหรือลดความจำเป็นในการสร้างไปป์ไลน์ข้อมูลสำหรับกระบวนการ Extract, Transform and Load (ETL) ให้น้อยที่สุด ETL แบบไร้รอยต่อทำให้ข้อมูลพร้อมใช้งานใน SageMaker Lakehouse และ Amazon Redshift จากแหล่งปฏิบัติการต่าง ๆ แหล่งธุรกรรม และแอปพลิเคชันองค์กร ETL เป็นกระบวนการของการรวม ล้าง และปรับข้อมูลจากแหล่งที่มาต่างๆ ให้เป็นมาตรฐาน เพื่อให้พร้อมสำหรับเวิร์กโหลดการวิเคราะห์ AI, และ ML กระบวนการ ETL แบบเดิมใช้เวลานานและซับซ้อนในการพัฒนา บำรุงรักษา และปรับขนาด ทว่า การบูรณาการ ETL แบบไร้รอยต่อช่วยอำนวยความสะดวกในการเคลื่อนย้ายข้อมูลแบบจุดต่อจุดโดยไม่จำเป็นต้องสร้างและใช้งานไปป์ไลน์ข้อมูล ETL
ดูที่ ETL แบบไร้รอยต่อคืออะไร เพื่อเรียนรู้เพิ่มเติม
อุปสรรคของ ETL ใดบ้างที่การบูรณาการ ETL แบบไร้รอยต่อสามารถแก้ได้
การบูรณาการ ETL แบบไร้รอยต่อช่วยแก้ปัญหาความท้าทายในการเคลื่อนย้ายข้อมูลที่มีอยู่มากมายในกระบวนการ ETL แบบเดิม รวมถึง:
- ความซับซ้อนของระบบที่เพิ่มขึ้นเนื่องจากกฎการทำแผนที่ข้อมูลที่ซับซ้อน การจัดการข้อผิดพลาด และข้อกำหนดด้านความปลอดภัย
- ค่าใช้จ่ายเพิ่มเติมจากปริมาณข้อมูลที่เพิ่มขึ้น การอัพเกรดโครงสร้างพื้นฐาน และการบำรุงรักษา
- เวลาล่าช้าในการวิเคราะห์ AI และ ML เนื่องจากการพัฒนาและการปรับใช้โค้ดที่กำหนดเอง ทำให้โอกาสพลาดสำหรับกรณีการใช้งานแบบเรียลไทม์
ETL แบบไร้รอยต่อมีประโยชน์อย่างไรบ้าง
- ความคล่องตัวที่เพิ่มขึ้น: ETL แบบไร้รอยต่อช่วยลดความยุ่งยากของสถาปัตยกรรมข้อมูลและลดความพยายามด้านวิศวกรรมข้อมูล ช่วยให้สามารถรวมแหล่งที่มาของข้อมูลใหม่ได้โดยไม่จำเป็นต้องประมวลผลข้อมูลจำนวนมากอีกครั้ง ความยืดหยุ่นนี้ช่วยเพิ่มความคล่องตัว สนับสนุนการตัดสินใจที่ขับเคลื่อนด้วยข้อมูลและนวัตกรรมที่ฉับไว
- ประหยัดค่าใช้จ่าย: ETL แบบไร้รอยต่อใช้เทคโนโลยีการรวมข้อมูลที่เป็นแบบ Cloud-Native และปรับขนาดได้ จึงช่วยให้ธุรกิจสามารถปรับค่าใช้จ่ายให้เหมาะสมตามการใช้งานจริงและความต้องการในการประมวลผลข้อมูล องค์กรลดต้นทุนโครงสร้างพื้นฐาน ความพยายามในการพัฒนา และค่าใช้จ่ายในการบำรุงรักษา
- การเข้าถึงข้อมูลที่รวดเร็ว: กระบวนการ ETL แบบเดิมๆ มักเกี่ยวข้องกับการอัปเดตแบตช์เป็นระยะๆ ส่งผลให้ความพร้อมใช้งานของข้อมูลล่าช้า ในทางกลับกัน การบูรณาการ ETL แบบไร้รอยต่อ ให้การเข้าถึงข้อมูลแบบเกือบเรียลไทม์ เพื่อช่วยจัดหาข้อมูลใหม่ ๆ สำหรับการวิเคราะห์ AI/ML และการรายงาน คุณจะได้รับข้อมูลเชิงลึกที่แม่นยำและทันท่วงทีมากขึ้นสำหรับกรณีการใช้งาน เช่น แดชบอร์ดแบบเรียลไทม์ ประสบการณ์การเล่นเกมที่ปรับให้เหมาะสม การตรวจสอบคุณภาพข้อมูล และการวิเคราะห์พฤติกรรมลูกค้า องค์กรต่างๆ สามารถทำการคาดการณ์ที่ขับเคลื่อนด้วยข้อมูลด้วยความมั่นใจมากขึ้น ปรับปรุงประสบการณ์ของลูกค้า และส่งเสริมข้อมูลเชิงลึกที่ขับเคลื่อนด้วยข้อมูลทั่วทั้งธุรกิจ
ปัจจุบัน AWS มีการบูรณาการ ETL แบบไร้รอยต่อใดบ้าง
ในงาน re:Invent 2024 เราจะประกาศการบูรณาการ ETL แบบไร้รอยต่อสี่รายการต่อไปนี้:
- Amazon SageMaker Lakehouse และ Amazon Redshift รองรับการบูรณาการ ETL แบบไร้รอยต่อจากแอปพลิเคชันแล้ว
- การบูรณาการ ETL แบบไร้รอยต่อของ Amazon DynamoDB กับ Amazon SageMaker Lakehouse
- การบูรณาการ ETL แบบไร้รอยต่อของ Amazon OpenSearch Service เข้ากับ Amazon CloudWatch Logs
- การบูรณาการ ETL แบบไร้รอยต่อของ Amazon OpenSearch Service เข้ากับ Amazon Security Lake
นับตั้งแต่เปิดตัวการบูรณาการ ETL แบบไร้รอยต่อ เราได้เพิ่มการผสานข้อมูลใหม่เจ็ดรายการ:
- การบูรณาการ ETL แบบไร้รอยต่อของ Amazon Aurora MySQL เข้ากับ Amazon Redshift
- การบูรณาการ ETL แบบไร้รอยต่อกับ PostgreSQL ของ Amazon Aurora ด้วย Amazon Redshift
- Amazon Relational Database Service (Amazon RDS) สำหรับการบูรณาการ ETL แบบไร้รอยต่อ ของ MySQL กับ Amazon Redshift
- การบูรณาการ ETL แบบไร้รอยต่อ Amazon DynamoDB พร้อม Amazon OpenSearch Service
- การบูรณาการ ETL แบบไร้รอยต่อของ Amazon DocumentDB กับ Amazon OpenSearch Service
- การบูรณาการ ETL แบบไร้รอยต่อของ Amazon OpenSearch Service กับ Amazon Simple Storage Service (Amazon S3)
- การผสานรวม Zero-ETL Amazon DynamoDB กับ Amazon Redshift
โมเดลการกำหนดราคาสำหรับ ETL แบบไร้รอยต่อคืออะไร
หากต้องการเรียนรู้เพิ่มเติมเกี่ยวกับราคา โปรดไปที่หน้าราคาของ Amazon Redshift, AWS Glue และ SageMaker Lakehouse
ฉันสามารถเรียนรู้เพิ่มเติมเกี่ยวกับ ETL แบบไร้รอยต่อและฟีเจอร์ใหม่นี้ได้ที่ไหน
หากต้องการเรียนรู้เพิ่มเติมเกี่ยวกับ ETL แบบไร้รอยต่อ โปรดไปที่ ETL แบบไร้รอยต่อคืออะไร
การเปลี่ยนแปลงโครงสร้างข้อมูลจัดการกับการการผสานรวม ETL แบบไร้รอยต่อ
ต่อไปนี้เป็นประเด็นสำคัญบางประการเกี่ยวกับวิธีการจัดการการเปลี่ยนแปลงโครงสร้างข้อมูล:
- คำสั่ง DDL เช่น CREATE TABLE, ALTER TABLE, DROP TABLE และอื่น ๆ จะได้รับการจำลองโดยอัตโนมัติจาก Aurora ไปยัง Amazon Redshift
- การผสานรวมทำให้เกิดการตรวจสอบและการปรับเปลี่ยนที่จำเป็นในตาราง Amazon Redshift สำหรับการเปลี่ยนแปลงโครงสร้างข้อมูลข้อมูลที่จำลองไว้ ตัวอย่างเช่นการเพิ่มคอลัมน์ใน Aurora จะเพิ่มคอลัมน์ใน Amazon Redshift ด้วย
- การจำลองแบบและการซิงค์โครงสร้างข้อมูลจะเกิดขึ้นแบบเรียลไทม์โดยอัตโนมัติ โดยมีความล่าช้าน้อยที่สุดระหว่างฐานข้อมูลต้นทางและเป้าหมาย
- ความสอดคล้องของโครงสร้างข้อมูลจะคงอยู่แม้ว่าการเปลี่ยนแปลง DML เกิดขึ้นควบคู่ไปกับการเปลี่ยนแปลง DDL
ฉันจะเรียกใช้การแปลงข้อมูลของฉันโดยใช้การบูรณาการ ETL แบบไร้รอยต่อได้อย่างไร
คุณสามารถสร้างมุมมองผลการสืบค้นในฐานข้อมูล Amazon Redshift ในระบบท้องถิ่นของคุณเพื่อแปลงข้อมูลที่จำลองผ่านการผสานรวม ETL แบบไร้รอยต่อ เชื่อมต่อกับฐานข้อมูลท้องถิ่นของคุณและใช้การสืบค้นข้ามฐานข้อมูลเพื่อเข้าถึงฐานข้อมูลปลายทาง คุณสามารถใช้ชื่ออ็อบเจ็กต์ที่มีคุณสมบัติครบถ้วนพร้อมหมายเหตุประกอบสามส่วน (destination-database-name.schema-name.table-name) หรือสร้างโครงสร้างข้อมูลภายนอกอ้างอิงฐานข้อมูลปลายทางและคู่โครงสร้างข้อมูล และใช้หมายเหตุประกอบสองส่วน (external-schema-name.table-name) ได้
การสำรองและการกู้คืนข้อมูล
Amazon Redshift สำรองข้อมูลของฉันอย่างไร ฉันจะกู้คืนคลัสเตอร์จากข้อมูลสำรองได้อย่างไร
คลัสเตอร์ Amazon Redshift RA3 และ Amazon Redshift แบบไม่ต้องใช้เซิร์ฟเวอร์ใช้ Redshift Managed Storage ซึ่งมีสำเนาล่าสุดของข้อมูลอยู่เสมอ คลัสเตอร์ DS2 และ DC2 ทำสำเนาข้อมูลบนคลัสเตอร์เพื่อให้แน่ใจว่าสำเนาล่าสุดจะพร้อมใช้งานในกรณีที่เกิดการหยุดทำงาน ระบบจะสร้างการสำรองข้อมูลขึ้นโดยอัตโนมัติในคลัสเตอร์ Redshift ทุกประเภทและจะคงไว้เป็นเวลา 24 ชั่วโมง และจุดกู้คืนแบบไม่ต้องใช้เซิร์ฟเวอร์จะสำรองข้อมูลไว้ในช่วง 24 ชั่วโมงที่ผ่านมา
และคุณยังสามารถสร้างข้อมูลสำรองของคุณเองที่สามารถเก็บไว้ได้อย่างไม่มีกำหนดด้วยเช่นกัน ข้อมูลสำรองเหล่านี้สร้างขึ้นได้ทุกเมื่อและสามารถแปลงข้อมูลสำรองอัตโนมัติจากจุดกู้คืนของ Amazon Redshift หรือ Amazon Redshift แบบไม่ต้องใช้เซิร์ฟเวอร์เป็นข้อมูลสำรองของผู้ใช้ได้เพื่อเก็บรักษาให้ยาวนานขึ้น
Amazon Redshift ยังสามารถจำลองสแนปช็อตหรือจุดกู้คืนของคุณแบบไม่พร้อมกันไปยัง Amazon S3 ใน Region อื่นสำหรับกระบวนการกู้คืนจากความเสียหาย
บนคลัสเตอร์ DS2 หรือ DC2 ระบบจะจำกัดพื้นที่จัดเก็บข้อมูลสำรองฟรีตามพื้นที่จัดเก็บทั้งหมดบนโหนดในคลัสเตอร์คลังเก็บข้อมูล และจะนำไปใช้เฉพาะกับคลัสเตอร์คลังเก็บข้อมูลที่เปิดใช้งานอยู่เท่านั้น
ตัวอย่างเช่น หากคุณมีพื้นที่คลังเก็บข้อมูลทั้งหมด 8 TB เราจะจัดเตรียมพื้นที่จัดเก็บข้อมูลสำรองให้สูงสุด 8 TB โดยไม่มีค่าบริการเพิ่มเติม หากคุณต้องการขยายระยะเวลาเก็บรักษาข้อมูลสำรองไปเกินหนึ่งวัน คุณสามารถขยายระยะเวลาได้โดยใช้ คอนโซลการจัดการของ AWS หรือ API ของ Amazon Redshift หากต้องการดูข้อมูลเพิ่มเติมเกี่ยวกับสแนปช็อตอัตโนมัติ โปรดดูที่คู่มือการจัดการ Amazon Redshift
Amazon Redshift จะสำรองเฉพาะข้อมูลที่มีการเปลี่ยนแปลงเท่านั้น ดังนั้นสแนปช็อตส่วนใหญ่จึงใช้พื้นที่จัดเก็บข้อมูลสำรองฟรีเพียงเล็กน้อย หากคุณต้องการกู้คืนข้อมูลสำรอง คุณสามารถเข้าถึงทุกการสำรองข้อมูลอัตโนมัติได้ในหน้าต่างการเก็บรักษาข้อมูลสำรอง เมื่อคุณเลือกได้ว่าจะกู้คืนข้อมูลสำรองใด เราจะจัดเตรียมคลัสเตอร์คลังข้อมูลใหม่ให้และกู้คืนข้อมูลของคุณไปยังคลัสเตอร์ดังกล่าว
ฉันสามารถจัดการการเก็บรักษาข้อมูลสำรองและสแนปช็อตอัตโนมัติได้อย่างไร
คุณสามารถใช้ คอนโซลการจัดการของ AWS หรือ API ModifyCluster เพื่อจัดการระยะเวลาที่ข้อมูลสำรองอัตโนมัติของคุณจะถูกเก็บไว้ได้โดยการแก้ไขพารามิเตอร์ RetentionPeriod หากคุณต้องการปิดข้อมูลสำรองอัตโนมัติทั้งหมด สามารถทำได้โดยกำหนดระยะเวลาการเก็บข้อมูลเป็น 0 (ไม่แนะนำ)
หากฉันลบคลัสเตอร์คลังข้อมูล จะเกิดอะไรขึ้นกับข้อมูลสำรองของฉัน
หากคุณลบคลัสเตอร์คลังข้อมูล คุณจะสามารถระบุได้ว่าจะสร้างสแนปช็อตสุดท้ายเมื่อดำเนินการลบหรือไม่ ซึ่งช่วยให้สามารถกู้คืนคลัสเตอร์คลังข้อมูลที่ลบทิ้งไปแล้วได้ในภายหลัง สแนปช็อตแบบแมนนวลของคลัสเตอร์คลังข้อมูลที่สร้างไว้ก่อนหน้านี้ทั้งหมดจะได้รับการเก็บรักษาไว้และเรียกเก็บเงินตาม อัตราค่าบริการมาตรฐานของ Amazon S3 เว้นแต่คุณเลือกที่จะลบออก
การเฝ้าติดตามและการบำรุงรักษา
ฉันสามารถตรวจสอบประสิทธิภาพของคลัสเตอร์คลังข้อมูล Amazon Redshift ได้อย่างไร
ตัวชี้วัดสำหรับการใช้งานการประมวลผล การใช้งานพื้นที่จัดเก็บ และปริมาณการเขียน/อ่านข้อมูลในคลัสเตอร์คลังข้อมูล Amazon Redshift สามารถใช้งานได้ฟรีผ่าน คอนโซลการจัดการของ AWS หรือ API ของ Amazon CloudWatch และคุณยังสามารถเพิ่มตัวชี้วัดตามผู้ใช้กำหนดเพิ่มเติมผ่านฟังก์ชันตัวชี้วัดแบบกำหนดเองของ Amazon CloudWatch ได้อีกด้วย คอนโซลการจัดการของ AWS มีแดชบอร์ดการติดตามสำหรับช่วยคุณติดตามสภาพและประสิทธิภาพของคลัสเตอร์ทั้งหมดของคุณ นอกจากนี้ Amazon Redshift ยังมอบข้อมูลเกี่ยวกับประสิทธิภาพของการสืบค้นและคลัสเตอร์ผ่านคอนโซลการจัดการของ AWS อีกด้วย ข้อมูลนี้ช่วยให้คุณสามารถดูได้ว่าผู้ใช้และการสืบค้นใดที่กำลังใช้งานทรัพยากรระบบมากที่สุดเพื่อดำเนินการวิเคราะห์ปัญหาด้านประสิทธิภาพโดยดูแผนการสืบค้นและสถิติการดำเนินการ อีกทั้งคุณยังเห็นการใช้ทรัพยากรบนโหนดประมวลผลแต่ละตัว เพื่อดูว่าคุณมีข้อมูลและการสืบค้นที่สมดุลกันบนทุกโหนดหรือไม่
ระยะเวลาบำรุงรักษาคืออะไร ฉันจะสามารถใช้งานคลัสเตอร์คลังข้อมูลของระหว่างการบำรุงรักษาซอฟต์แวร์ได้หรือไม่
Amazon Redshift จะดำเนินการบำรุงรักษาเป็นครั้งคราวเพื่อปรับใช้การแก้ไข การปรับปรุง และคุณสมบัติใหม่ๆ ให้กับคลัสเตอร์ของคุณ คุณสามารถเปลี่ยนระยะเวลาบำรุงรักษาตามกำหนดได้โดยการแก้ไขคลัสเตอร์ทั้งทางโปรแกรมหรือโดยใช้ Redshift Console โดยจะไม่สามารถใช้งานคลัสเตอร์ Amazon Redshift ในการทำงานทั่วไปได้ระหว่างระยะเวลาการบำรุงรักษา สำหรับข้อมูลเพิ่มเติมเกี่ยวกับระยะเวลาบำรุงรักษาและกำหนดการตาม Region โปรดดูที่ ระยะเวลาบำรุงรักษา ในคู่มือการจัดการ Amazon Redshift