Kundengeschichten/Software und Internet

2022
Salesforce-Logo

Salesforce UIP nutzt Amazon-EC2-Spot-Instances, um die Datenverarbeitungszeiten um mehr als 90 % zu reduzieren und monatlich über 1 Million USD zu sparen

1 Million USD

pro Monat gespart

200–250 TB

zum früheren Preis von 100 TB verarbeitet 

4 Stunden bis 15 Minuten

Verkürzung der Bearbeitungszeit

Konfigurationstests

innerhalb weniger Stunden erforscht und getestet

Übersicht

Das Unified Intelligence Platform Team (UIP) von Salesforce verwaltet einen Petabyte-großen Data Lake und war auf der Suche nach Innovationen für die Analyse und Verarbeitung von Daten, um Kosten zu sparen und die Effizienz zu steigern. Mit Amazon Web Services (AWS) für eine Mischung aus Instance-Bereitstellungsmodellen von Amazon Elastic Compute Cloud (Amazon EC2), die sichere und anpassbare Datenverarbeitungskapazität für praktisch jeden Workload bietet, konnte das UIP-Team eine skalierbare, elastische Datenverarbeitungsinfrastruktur aufbauen. Die neu gestaltete Recheninfrastruktur benötigt weniger Zeit für die Verarbeitung der doppelten Datenmenge und spart dem Unternehmen monatlich über 1 Million USD.

Salesforce nutzt AWS für seine Daten-Workflows, während AWS Salesforce für sein Customer Relationship Management nutzt. Diese Partnerschaft macht es Entwicklern mit beiden Technologien einfacher, Kundenanwendungen zu erstellen und zu starten, AWS-Services nativ in Salesforce zu nutzen und Daten und Workflows zwischen Salesforce und AWS sicher zu verbinden.

Business coworkers discussing new ideas and brainstorming in a modern office

Chance| Effiziente Architektur auf AWS

Ende 2019 begann das UIP-Team, seine On-Premises-Cluster auf Amazon EMR zu übertragen, eine Cloud-Big-Data-Plattform, die verwendet wird, um groß angelegte verteilte Datenverarbeitungsaufträge, interaktive SQL-Abfragen und Anwendungen für Machine Learning mit Open-Source-Analytik-Frameworks wie Apache Spark, Apache Hive und Trino auszuführen. Die Verwendung von Amazon EMR hilft Salesforce, die Komplexität der Verwaltung seiner Big-Data-Frameworks zu reduzieren, und bietet eine native Integration für Amazon-EC2-Spot Instances, die Unternehmen dabei helfen, ungenutzte Amazon-EC2-Kapazitäten in der Cloud zu nutzen.

Das Team identifizierte seine Workloads auf Apache Spark als gute Kandidaten für den Einsatz von Spot Instances als Teil einer Strategie zur Kostenoptimierung. Apache Spark auf Amazon EMR bietet automatische Wiederholungsversuche, die für Ausfallsicherheit sorgen, wenn eine Spot Instance aufgrund von Amazon-EC2-Kapazitätsanforderungen zurückgefordert wird. Außerdem verwendet das UIP-Team Spark Streaming, um Daten in Zeitfenstern von 5 Minuten zu verarbeiten, ein weiterer Faktor, der dazu beiträgt, die Wahrscheinlichkeit von Wiederholungsversuchen zu minimieren.

Um die größte Verfügbarkeit zum niedrigsten Preis zu erzielen, experimentierte Salesforce UIP mit der Verwendung von Spot Instances neben anderen Amazon-EC2-Kaufoptionen. Es wurden Szenarien mit verschiedenen Prozentsätzen von Spot Instances und Amazon-EC2-On-Demand-Instances durchgeführt, bei denen die Unternehmen die Rechenkapazität sekundenweise und ohne langfristige Verpflichtung bezahlen und die volle Kontrolle über den Lebenszyklus der Instances haben. Für seine On-Demand-Instances hat Salesforce UIP Savings Plans verwendet, ein flexibles Preismodell, das im Vergleich zu On-Demand niedrigere Preise bietet, im Austausch für eine bestimmte Nutzungsverpflichtung. In dem Bestreben, die Zuverlässigkeit des Clusters mit den Preisnachlässen der Instances zu kombinieren, ermittelte das UIP-Team eine optimale Konfiguration, bei der 60 Prozent der Amazon-EC2-Nutzung von Spot Instances und der Rest von Savings Plans abgedeckt wird. Um seine Service Level Agreements (SLAs) einzuhalten, hat Salesforce UIP seine Flotten mit Blick auf die Leistung konzipiert. Dabei werden die Arbeitslasten in SLA- und Nicht-SLA-Cluster aufgeteilt, je nach den Prozessoreigenschaften und der Fähigkeit, die Zeitanforderungen des SLA zu erfüllen. „Beim Aufbau unserer Flotte liegt der wahre Vorteil darin, wie viele Instance-Typen man verwenden kann“, sagt Eric Legault, Principal Engineer bei Salesforce. „Die Nutzung von AWS hat uns geholfen, mit vielen verschiedenen Rechnerkonfigurationen zu spielen und verschiedene Szenarien auszuprobieren. Wir haben einfach die Konfiguration geändert, und ein paar Stunden später konnten wir sehen, ob es tatsächlich funktioniert hat oder nicht. Ich denke, das war ein großer Teil des Erfolgs.“

kr_quotemark

Amazon EMR Managed Scaling spielt eine große Rolle bei unserer Fähigkeit, die flexiblen Möglichkeiten der Cloud zu nutzen. Allein durch den innovativen Einsatz der Spot Instances reduzieren wir die Kosten erheblich.“

Eric Legault
Principal Engineer, Salesforce

Lösung | Mit Spot Instances Millionen sparen

In Übereinstimmung mit den bewährten Methoden von AWS für die Verwendung von Spot Instances baute das Team zusätzliche Stabilität in seine Flotte ein, indem es von zwei oder drei Instance-Typen auf 27 Instance-Typen umstieg und dabei die gleiche Kapazität beibehielt. Das UIP-Team betreibt 12 Cluster, die auf unterschiedliche Zwecke spezialisiert sind und Instance-Typen verwenden, die für CPU-, Speicher- oder ausgeglichene Workloads optimiert sind. Sie sind mit einer Mischung aus Intel- und AMD-Prozessoren ausgestattet. „Je mehr Instance-Typen Sie haben, desto widerstandsfähiger ist Ihr Cluster“, sagt Legault.

Salesforce UIP verarbeitet jetzt 200–250 TB pro Tag und schreibt etwa die doppelte Datenmenge zu denselben Kosten, die zuvor für die Verarbeitung von 100 TB erforderlich waren. Durch die Umstellung der Aufnahmeverarbeitung auf einen Streaming-Ansatz und die Verwendung von Spot Instances zur Erweiterung der Infrastruktur bei gleichzeitiger Kostenkontrolle konnte das Team auch die Verarbeitungseffizienz verbessern und die Zeit für die Aufnahme und Verarbeitung der Daten von vier Stunden auf 15 Minuten reduzieren. Um einen besseren Einblick in seine Berechnungsmetriken zu erhalten, verwendet Salesforce Amazon CloudWatch, einen Überwachungs- und Beobachtungsdienst für AWS-Ressourcen. Das Team überwacht die Anwendungen mithilfe von benutzerdefinierten Dashboards. Diese wurden mit der Open-Source-Software Grafana erstellt und ermöglichen eine Visualisierung der Betriebsmetriken.

Die UIP-Lösung von Salesforce verwendet außerdem Amazon EMR Managed Scaling, das die Größe des Clusters automatisch anpasst, um die bestmögliche Leistung zu den geringstmöglichen Kosten zu erzielen. Um die Möglichkeit der Rückgewinnung einer Spot Instance auszugleichen, lässt Salesforce seinen Cluster etwa 5 Prozent über die Kapazität hinaus skalieren. Die zusätzliche Kapazität bedeutet eine schnellere Verarbeitung, um im Bedarfsfall mehr Verfügbarkeit und Stabilität im Cluster zu gewährleisten. „Ich denke, das ist der eigentliche Vorteil: Wir können die Kapazität je nach Bedarf in beide Richtungen skalieren“, sagt Legault. „Dieses Verfahren kümmert sich auch um alles, was in Bezug auf die Rückgewinnung ausgefallen ist.“ Darüber hinaus verhindert die Verwendung einer neuen Funktion innerhalb von Amazon EMR Managed Scaling, dass die UIP von Salesforce die Instances, die Daten für Apache Spark zwischenlagern, verkleinert, was zu einer besseren Leistung zu geringeren Kosten führt.

Die Einbindung von Spot Instances in Salesforce UIP ergänzt die Nutzung des Savings Plans und senkt die Rechenkosten um mehr als 60 Prozent, wodurch das Unternehmen über 1 Million USD pro Monat einspart. Zusätzlich zu den zwei Clustern, die rund um die Uhr laufen, kann das UIP-Team bei Bedarf kostengünstig einen dritten Cluster hochfahren, um einen plötzlichen Datenansturm zu bewältigen. Die Verwendung von Spot Instances durch das UIP-Team zur Durchführung der Skalierung trägt auch dazu bei, die Kosten in anderen Bereichen von Salesforce zu senken, indem Savings-Plan-Instances freigesetzt werden, die andere Teams zur Kostensenkung in Spitzenzeiten nutzen können.

Ergebnis | Intelligenz in das Flottenmanagement einbauen

Im Rahmen des Optimierungsprozesses verwendet das UIP-Team den Spot Instance Advisor, der Unternehmen dabei hilft, Pools zu ermitteln, bei denen die Wahrscheinlichkeit einer Unterbrechung am geringsten ist. Außerdem ermöglicht er Einsparungen gegenüber On-Demand-Tarifen. Das Team hofft, mithilfe des Amazon EC2 Spot Placement Score noch mehr Intelligenz in das dynamische Flottenmanagement einbauen zu können. Dieser kann nahezu in Echtzeit eine AWS-Region oder Availability Zone auf der Grundlage der Anforderungen von Salesforce empfehlen. Mithilfe des Amazon EC2 Spot Placement Score plant das UIP-Team, im Zuge der Ausweitung auf weitere AWS-Regionen noch mehr Kapazität und niedrigere Preise zu erzielen. „Wir nutzen die Kapazität der Cloud und die große Auswahl an Amazon-EC2-Instance-Typen, um Dinge zu tun, die wir vor Ort nicht tun könnten“, sagt Legault. „Amazon EMR Managed Scaling spielt eine große Rolle bei unserer Fähigkeit, die flexiblen Möglichkeiten der Cloud zu nutzen. Allein durch den innovativen Einsatz der Spot Instances reduzieren wir die Kosten erheblich.“

Über Salesforce

Als führende Plattform für Customer Relationship Management (CRM) und Customer Engagement bedient Salesforce mehr als 150.000 Unternehmen weltweit. Salesforce vereint Vertriebs-, Service-, Marketing-, Handels- und IT-Teams mit einer einzigen, gemeinsam genutzten Ansicht der Kundeninformationen und trägt so zum Ausbau der Beziehungen zu Kunden und Mitarbeitern gleichermaßen bei.

Genutzte AWS-Services

Amazon Elastic Compute Cloud (EC2)

Amazon EC2 bietet die weitreichendste und tiefgehendste Rechenplattform mit über 500 Instances und einer Auswahl der neuesten Prozessoren, Speicher, Netzwerke, Betriebssysteme und Kaufmodelle, damit Sie die Anforderungen Ihres Workloads optimal erfüllen können.

Mehr erfahren »

Amazon EC2-Spot-Instances

Mit Amazon-EC2-Spot-Instances können Sie die Vorteile nicht genutzter EC2-Kapazitäten in der AWS Cloud nutzen.

Mehr erfahren »

Savings Plans

Savings Plans ist ein flexibles Preismodell, das im Vergleich zu On-Demand niedrigere Preise bietet, im Austausch für eine bestimmte Nutzungsverpflichtung (gemessen in USD/Stunde) für einen Zeitraum von einem oder drei Jahren.

Mehr erfahren »

Amazon EMR Managed Scaling

Mit EMR Managed Scaling legen Sie die minimalen und maximalen Rechengrenzen für Ihre Cluster fest, und Amazon EMR ändert die Größe automatisch, um die beste Leistung und Ressourcennutzung zu erzielen.

Mehr erfahren »

Erste Schritte

Organisationen aller Größen aus verschiedenen Sektoren transformieren ihre Unternehmen und erfüllen ihre Missionen täglich mithilfe von AWS. Kontaktieren Sie unsere Experten und begeben Sie sich noch heute Ihren Weg zu AWS.