Amazon Bedrock – Preise

Preisübersicht

Amazon Bedrock ist ein vollständig verwalteter Service, der eine Auswahl an leistungsstarken Basismodellen (FMs) über eine einzige API sowie eine breite Palette von Funktionen bietet, die Sie für die Entwicklung generativer KI-Anwendungen mit Sicherheit, Datenschutz und verantwortungsvoller KI benötigen.

Bei Amazon Bedrock werden Ihnen Modellinferenzen und Anpassungen in Rechnung gestellt. Sie haben die Wahl zwischen zwei Preisplänen für Inferenzen: 1. On-Demand und Batch: In diesem Modus können Sie FMs auf Basis nutzungsabhängiger Preisberechnung verwenden, ohne zeitbasierte Laufzeitverpflichtungen eingehen zu müssen. 2. Bereitgestellter Durchsatz: In diesem Modus können Sie ausreichend Durchsatz bereitstellen, um die Leistungsanforderungen Ihrer Anwendung zu erfüllen, und zwar im Gegenzug für eine zeitbasierte Laufzeitverpflichtigung.

Preismodelle

On-Demand und Batch

Im On-Demand-Modus zahlen Sie nur für das, was Sie tatsächlich nutzen, ohne zeitliche Verpflichtungen. Bei Modellen zur Textgenerierung wird Ihnen jedes verarbeitete Eingabe-Token und jedes generierte Ausgabe-Token in Rechnung gestellt. Für eingebettete Modelle wird Ihnen jedes verarbeitete Eingabe-Token in Rechnung gestellt. Ein Token besteht aus wenigen Zeichen und bezieht sich auf die grundlegende Texteinheit, mit der ein Modell lernt, Benutzereingaben und Eingabeaufforderungen zu verstehen. Bei Modellen zur Image-Generierung wird für jedes generierte Image eine Gebühr erhoben.

Regionsübergreifende Inferenz: Der On-Demand-Modus unterstützt für einige Modelle auch regionsübergreifende Inferenz. Er ermöglicht Entwicklern, Datenverkehrssteigerungen nahtlos zu verwalten, indem sie Rechenleistung in verschiedenen AWS-Regionen nutzen und höhere Durchsatzlimits und eine verbesserte Ausfallsicherheit erzielen. Für die Verwendung regionsübergreifender Inferenz fallen keine zusätzlichen Gebühren an, und der Preis wird auf der Grundlage der Region berechnet, in der Sie die Anfrage gestellt haben (Quellregion).

Im Batch-Modus können Sie eine Reihe von Eingabeaufforderungen als einzelne Eingabedatei bereitstellen und Antworten als eine einzige Ausgabedatei erhalten, sodass Sie gleichzeitig umfangreiche Vorhersagen erhalten können. Die Antworten werden verarbeitet und in Ihrem Amazon-S3-Bucket gespeichert, sodass Sie zu einem späteren Zeitpunkt darauf zugreifen können. Amazon Bedrock bietet ausgewählte Basismodelle (FMs) von führenden KI-Anbietern wie Anthropic, Meta, Mistral AI und Amazon für Batch-Inferenz zu einem um 50 % niedrigeren Preis als bei On-Demand-Inferenzpreisen. Bitte beachten Sie die Liste der Modelle hier.

Latenzoptimiert (öffentliche Vorschau)

Latenzoptimierte Inferenz für Basismodelle in Amazon Bedrock sorgt für schnellere Reaktionszeiten für Modelle und trägt dazu bei, die Reaktionsfähigkeit Ihrer generativen KI-Anwendungen zu verbessern. Sie können die latenzoptimierte Inferenz für Amazon Nova Pro, Claude 3.5 Haiku-Modell von Anthropic und die Llama 3.1 405B- und 70B-Modelle von Meta verwenden. Wie von Anthropic bestätigt, läuft Claude 3.5 Haiku mit latenzoptimierter Inferenz auf Amazon Bedrock schneller auf AWS als irgendwo anders. Darüber hinaus laufen Llama 3.1 405B und 70B dank latenzoptimierter Inferenz in Bedrock schneller auf AWS als auf jedem anderen großen Cloud-Anbieter. Weitere Informationen finden Sie hier.

Bereitgestellter Durchsatz

Im Modus „Bereitgestellter Durchsatz“ können Sie Modelleinheiten für ein bestimmtes Basismodell oder ein benutzerdefiniertes Modell erwerben. Der Modus „Bereitgestellter Durchsatz“ ist in erster Linie für große konsistente Inferenz-Workloads konzipiert, die einen garantierten Durchsatz benötigen. Auf benutzerdefinierte Modelle kann nur über den Modus „Bereitgestellter Durchsatz“ zugegriffen werden. Eine Modelleinheit bietet einen bestimmten Durchsatz, der an der maximalen Anzahl von Eingabe- oder Ausgabe-Tokens gemessen wird, die pro Minute verarbeitet werden. Bei der Preisgestaltung des Modus „Bereitgestellter Durchsatz“ wird Ihnen stundenweise in Rechnung gestellt. Sie haben die Flexibilität, zwischen 1-monatigen oder 6-monatigen Verpflichtungsfristen zu wählen.

Benutzerdefinierter Modellimport

Mit dem benutzerdefinierten Modellimport können Sie Ihre früheren Investitionen in die Modellanpassung in Amazon Bedrock nutzen und sie auf dieselbe vollständig verwaltete Weise verwenden wie die vorhandenen gehosteten Basismodelle von Bedrock. Sie können benutzerdefinierte Gewichtungen für unterstützte Modellarchitekturen importieren und das benutzerdefinierte Modell im On-Demand-Modus bereitstellen. Der Import eines benutzerdefinierten Modells in Bedrock ist kostenlos. Sobald Sie ein Modell importiert haben, können Sie bei Bedarf darauf zugreifen, ohne eine Aktion auf der Steuerebene ausführen zu müssen. Ihnen werden nur Kosten für die Modellinferenz in Rechnung gestellt, und zwar auf Grundlage der Anzahl der Kopien Ihres benutzerdefinierten Modells, die zur Bewältigung Ihres Inferenzvolumens erforderlich sind, sowie der Dauer, in der jede Modellkopie aktiv ist. Die Abrechnung erfolgt in 5-Minuten-Fenstern. Eine Modellkopie ist eine einzelne Instance eines importierten Modells, das bereit ist, Inferenzanforderungen zu erfüllen. Der Preis pro Modellkopie pro Minute hängt von Faktoren wie Architektur, Kontextlänge, AWS-Region, Version der Recheneinheit (Hardware-Generierung) ab und ist nach der Größe der Modellkopie gestaffelt.

Marktplatzmodelle

Amazon Bedrock Marketplace ermöglicht es Ihnen, über 100 beliebte, aufstrebende und spezialisierte Basismodelle in Bedrock zu entdecken, zu testen und zu verwenden. Amazon Bedrock Marketplace-Modelle werden an Endpunkten bereitgestellt, an denen Sie die gewünschte Anzahl von Instances und Instance-Typen auswählen und Ihre Richtlinien für die automatische Skalierung so konfigurieren können, dass sie den Anforderungen Ihres Workloads entsprechen. Für proprietäre Modelle wird Ihnen der vom Modellanbieter festgelegte Softwarepreis (pro Stunde, sekundengenau oder pro Anfrage) und ein Infrastrukturpreis basierend auf der von Ihnen ausgewählten Instance berechnet. Diese Preise werden Ihnen vor dem Abonnieren des Anbietermodells sowie in der Modellauflistung im AWS Marketplace angezeigt. Bei öffentlich verfügbaren Modellen wird Ihnen nur der Infrastrukturpreis basierend auf der von Ihnen ausgewählten Instance in Rechnung gestellt. Weitere Informationen finden Sie hier.

Anpassung und Optimierung

Anpassung des Modells

Mit Amazon Bedrock können Sie Basismodelle mit Ihren Daten anpassen, um maßgeschneiderte Antworten für bestimmte Aufgaben und Ihren Geschäftskontext zu liefern. Sie können Modelle mit beschrifteten Daten verfeinern oder ein kontinuierliches Vortraining mit unbeschrifteten Daten durchführen. Für die Anpassung eines Textgenerierungsmodells wird Ihnen das Modelltraining basierend auf der Gesamtzahl der vom Modell verarbeiteten Token (Anzahl der Token im Trainingsdatenkorpus multipliziert mit der Anzahl der Epochen) und der Modellspeicher, der pro Monat pro Modell berechnet wird, in Rechnung gestellt. Eine Epoche bezieht sich auf einen vollständigen Durchlauf Ihres Trainingsdatensatzes während der Feinabstimmung oder der Fortsetzung des Vortrainings. Inferenzen, die benutzerdefinierte Modelle verwenden, werden im Rahmen des Plans des bereitgestellten Durchsatzes berechnet und erfordern den Kauf vom bereitgestellten Durchsatz. Eine Modelleinheit wird ohne verbindliche Frist für Inferenzen auf ein kundenspezifisches Modell zur Verfügung gestellt. Ihnen wird die Anzahl der Stunden in Rechnung gestellt, die die erste Modelleinheit für benutzerdefinierte Modellinferenzen verwendet hat. Wenn Sie Ihren Durchsatz über eine Modelleinheit hinaus steigern möchten, müssen Sie eine 1-monatige oder 6-monatige Verpflichtungsfrist erwerben.

Modell-Destillation

Mit Amazon Bedrock Modell-Destillation zahlen Sie nur für das, was Sie nutzen. Die Generierung synthetischer Daten wird nach dem On-Demand-Preis des ausgewählten Lehrermodells berechnet. Das Optimieren des Schülermodells wird nach den Modellanpassungspreisen berechnet. Da es sich bei einem destillierten Modell um ein angepasstes Modell handelt, werden Rückschlüsse, die mithilfe angepasster Modelle gezogen werden, im Rahmen des Plans „Bereitgestellter Durchsatz“ berechnet und erfordern, dass Kunden den bereitgestellten Durchsatz erwerben.

Prompt-Caching

Mit Prompt-Caching auf Amazon Bedrock können Sie wiederholten Kontext über API-Aufrufe hinweg zwischenspeichern, um Ihre Kosten und Antwortlatenzen zu reduzieren. Prompts enthalten häufig gemeinsamen Kontext oder Präfixe wie lange, mehrteilige Konversationen, Beispiele mit vielen Aufnahmen und detaillierte Anweisungen, die das Modellverhalten verfeinern. Mit den vorhandenen Amazon Bedrock-APIs können Sie die Prompt-Präfixe angeben, die Sie für fünf Minuten in einem AWS-kontospezifischen Cache zwischenspeichern möchten. Während dieser Zeit erhalten alle Anfragen mit übereinstimmenden Präfixen einen Rabatt von bis zu 90 % auf zwischengespeicherte Token und eine Latenzverbesserung von bis zu 85 %. Die Preise und Leistungsverbesserungen variieren je nach Modell und Länge des Prompts, aber Ihre Caches sind immer auf Ihr AWS-Konto beschränkt.

Tools

Integritätsschutz

Mit dem Integritätsschutz für Amazon Bedrock können Sie angepasste Sicherheitsvorkehrungen und verantwortungsvolle KI-Richtlinien für Ihre generativen KI-Anwendungen umsetzen. Er bietet zusätzlich zu den nativen Schutzfunktionen von FMs weitere anpassbare Sicherheitsfunktionen. Es handelt sich um die einzige verantwortungsvolle KI-Funktion, die von einem großen Cloud-Anbieter angeboten wird und es Kunden ermöglicht, Sicherheits-, Datenschutz- und Wahrheitsschutzfunktionen für ihre generativen KI-Anwendungen in einer einzigen Lösung zu erstellen und anzupassen. Bedrock Integritätsschutz funktioniert mit einer Reihe von Basismodellen (FMs), einschließlich FMs, die in Amazon Bedrock unterstützt werden, sowie mit optimierten und selbst gehosteten Modellen außerhalb von Amazon Bedrock. Bedrock Integritätsschutz kann auch in Amazon Bedrock Agenten und Amazon Bedrock Wissensdatenbanken integriert werden, um generative KI-Anwendungen zu erstellen, die mit Ihren Richtlinien für verantwortungsvolle KI übereinstimmen. Zusätzlich bietet Integritätsschutz eine eigenständige ApplyGuardrail-API, die zur Auswertung von Benutzereingaben und Modellantworten für jedes Modell außerhalb von Amazon Bedrock verwendet werden kann, einschließlich der von AWS-Konkurrenten angebotenen Modelle. Benutzereingaben können auch ohne Aufruf des Basismodells ausgewertet werden.

Wissensdatenbanken und Datenautomatisierung

Amazon Bedrock Knowledge Bases ist ein vollständig verwalteter Workflow für Retrieval Augmented Generation (RAG), der es Kunden ermöglicht, hochpräzise, sichere und benutzerdefinierte generative KI-Anwendungen mit geringer Latenz zu erstellen, indem Kontextinformationen aus ihren eigenen Datenquellen integriert werden. Es unterstützt verschiedene Datenquellen, darunter S3, und Confluence, Salesforce und SharePoint in der Vorschau. Es bietet auch die Möglichkeit der Datenerfassung für Streaming-Daten. Bedrock Wissensdatenbanken konvertieren unstrukturierte Daten in Einbettungen, speichern sie in Vektordatenbanken und ermöglichen den Abruf aus verschiedenen Datenspeichern. Sie lassen sich auch in Kendra für den verwalteten Abruf integrieren und unterstützen den strukturierten Datenabruf unter Verwendung von natürlicher Sprache zu SQL.

Amazon Bedrock Datenautomatisierung wandelt unstrukturierte, multimodale Inhalte in strukturierte Datenformate für Anwendungsfälle wie intelligente Dokumentenverarbeitung, Videoanalyse und RAG um. Bedrock Data Automation kann Standardausgabeinhalte unter Verwendung vordefinierter Standards generieren, die modalitätsspezifisch sind, wie etwa Szenenbeschreibungen von Videos, Audiotranskripte oder automatisierte Dokumentenanalysen. Kunden können zusätzlich benutzerdefinierte Ausgaben erstellen, indem sie ihre Ausgabeanforderungen in Vorlagen auf der Grundlage ihres eigenen Datenschemas angeben, die sie dann einfach in eine vorhandene Datenbank oder ein Data Warehouse laden können. Durch die Integration mit Wissensdatenbanken kann Bedrock Data Automation auch zum Parsen von Inhalten für RAG-Anwendungen verwendet werden, wodurch die Genauigkeit und Relevanz der Ergebnisse durch die Einbeziehung von Informationen, die sowohl in Bildern als auch in Text eingebettet sind, verbessert wird.

Agents

Amazon Bedrock Agents bieten Ihnen die Möglichkeit, autonome Agenten innerhalb Ihrer Anwendung zu erstellen und zu konfigurieren. Diese Agenten stellen eine sichere Verbindung zu den Datenquellen Ihres Unternehmens her und ergänzen die Anfragen der Benutzer mit den richtigen Informationen, um präzise Antworten zu generieren. Sie können eine Einzel- und Multi-Agenten-Anwendung mit nur wenigen schnellen Schritten erstellen und so die Zeit für die Erstellung von Anwendungen mit generativer KI verkürzen. Diese Agenten unterstützen die Code-Interpretation, um Code dynamisch zu generieren und auszuführen, sowie die Rückgabe der Kontrolle, wodurch Sie ein Aktionsschema definieren und die Kontrolle zurückerhalten können, wenn der Agent die Aktion aufruft. Darüber hinaus können Agenten von Amazon Bedrock die Erinnerung über Interaktionen hinweg speichern und so eine personalisiertere und nahtlosere Benutzererfahrung bieten.

Flüsse

Amazon Bedrock Flows ist eine Workflow-Erstellungs- und Ausführungsfunktion von Bedrock für generative KI-Anwendungen. Es beschleunigt die Erstellung, das Testen und die Bereitstellung benutzerdefinierter generativer KI-Workflows durch einen intuitiven visuellen Builder und eine Reihe von APIs. Es ermöglicht Ihnen, die neuesten Basismodelle, Prompts, Agents, Knowledge Base, Guardrails und AWS-Services (wie Amazon Lex, AWS Lambda, Amazon S3) nahtlos mit Geschäftslogik zu verknüpfen, um generative KI-Workflows zu erstellen. Sie können Ihre Workflows einfach testen und versionieren und sie in einer sicheren serverlosen Umgebung über eine visuelle Schnittstelle oder API ausführen, ohne Ihre eigene Infrastruktur einrichten zu müssen.

Auswertungen

Modellbewertung: Mit der Modellbewertung in Amazon Bedrock zahlen Sie für das, was Sie nutzen, ohne sich auf die Anzahl der Prompts oder Antworten festlegen zu müssen. Bei der automatischen (programmatischen) Bewertung zahlen Sie nur für die Inferenz, die sich aus dem von Ihnen gewählten Modell bei der Bewertung ergibt. Die automatisch generierten algorithmischen Ergebnisse werden ohne Aufpreis zur Verfügung gestellt. Für die automatische Bewertung (Modell/LLM-as-a-Judge) zahlen Sie nur für die Inferenz, die sich aus dem Generatormodell und dem Evaluatormodell Ihrer Wahl ergibt. Bei LLM-as-a-Judge-Modellbewertungen verwenden die integrierten Metriken Vorlagen für System-Judge-Prompts, die für jede Metrik und jedes verfügbare Judge-Modell spezifisch sind und als Teil Ihrer Token-Nutzung berechnet werden. Die Judge-Prompts sind aus Gründen der Transparenz in der öffentlichen AWS-Dokumentation verfügbar. Bei einer Bewertung durch Menschen, bei der Sie Ihr eigenes Arbeitsteam mitbringen, wird Ihnen die Modellinferenz in der Bewertung in Rechnung gestellt. Außerdem wird eine Gebühr von 0,21 USD pro abgeschlossener menschlicher Aufgabe berechnet. Eine menschliche Aufgabe ist definiert als das Vorkommen, dass ein menschlicher Mitarbeiter eine Bewertung einer einzelnen Aufforderung und der zugehörigen Inferenzantworten in der Benutzeroberfläche für die menschliche Bewertung abgibt. Der Preis pro Aufgabe ist derselbe, unabhängig davon, ob Sie ein oder zwei Modelle in Ihrem Bewertungsauftrag verwenden, und auch unabhängig davon, wie viele Bewertungsmetriken und Bewertungsmethoden Sie einbeziehen. Die Gebühren für menschliche Aufgaben werden in Ihrer AWS-Rechnung im Abschnitt Amazon SageMaker angezeigt und sind für alle AWS-Regionen gleich. Für die Belegschaft fallen keine gesonderten Kosten an, da die Belegschaft von Ihnen gestellt wird. Wenn Sie das Feature „Bringen Sie Ihre eigenen Inferenzantworten mit“ verwenden, anstatt während des Bewertungsauftrags ein Bedrock-Modell aufzurufen, werden Ihnen nur die Kosten für die Modellinferenz des Bewerters (LLM-as-a-judge-Aufträge) oder 0,21 $ pro abgeschlossener menschlicher Aufgabe (menschliche Bewertungsaufträge) berechnet. Für eine von AWS verwaltete Bewertung werden die Preise in einem privaten Gespräch und in Zusammenarbeit mit dem AWS-Expertenbewertungsteam an Ihre Bewertungsanforderungen angepasst.

RAG-Bewertung: Mit der RAG-Bewertung in Amazon Bedrock zahlen Sie für das, was Sie nutzen, ohne sich auf die Anzahl der Prompts oder Antworten festlegen zu müssen. Wenn Sie eine-Amazon Bedrock-Wissensdatenbank bewerten, zahlen Sie nur für die Inferenz aus Ihrer Wahl des Generatormodells und des Bewertungsmodells (die Bewertungsaufgabe verwendet einen LLM-as-a-judge) sowie für alle Gebühren, die durch die Nutzung der Wissensdatenbank in der Bewertungsaufgabe gemäß den Preisen für Amazon-Bedrock-Wissensdatenbanken anfallen. Wenn Sie das Feature zum Mitbringen eigener Inferenzantworten verwenden, werden Ihnen nur die Kosten für die Inferenz des Bewertungsmodells berechnet. Bei einem RAG-Bewertungsauftrag verwenden die integrierten Metriken Vorlagen für System-Judge-Prompts, die für jede Metrik und jedes verfügbare Judge-Modell spezifisch sind und als Teil Ihrer Token-Nutzung berechnet werden. Die Judge-Prompts sind aus Gründen der Transparenz in der öffentlichen AWS-Dokumentation verfügbar. Bei einigen Metriken ist zusätzlich zur Eingabeaufforderung die Durchführung von Judge-Modellinferenzen aus dem abgerufenen Kontext aus Ihrer Wissensdatenbank, Ihrem RAG-System oder Ihren Ground-Truth-Antworten erforderlich, was sich auf die mit den einzelnen Metriken verbundenen Kosten auswirkt. Weitere Informationen zu den einzelnen Metriken finden Sie in der öffentlichen AWS-Dokumentation für Bewertungen.

Preisdetails des Modells

Die Preisgestaltung hängt von der Modalität, dem Anbieter und dem Modell ab. Bitte wählen Sie den Modellanbieter aus, um die detaillierten Preise zu sehen.

Amazon Bedrock bietet ausgewählte Basismodelle (FMs) von führenden KI-Anbietern wie Anthropic, Meta, Mistral AI und Amazon für Batch-Inferenz zu einem um 50 % niedrigeren Preis als bei On-Demand-Inferenzpreisen. Bitte beachten Sie die Liste der Modelle hier.

AI21 Labs

AI21 Labs

On-Demand-Preise

AI21-Labs-Modelle	Preis pro 1 000 Eingabe-Token	Preis pro 1 000 Ausgabe-Token
Jamba 1.5 Large	0,002 USD	0,008 USD
Jamba 1.5 Mini	0,0002 USD	0,0004 USD
Jurassic-2 Mid	0,0125 USD	0,0125 USD
Jurassic-2 Ultra	0,0188 USD	0,0188 USD
Jamba-Instruct	0,0005 USD	0,0007 USD

Amazon

Amazon Nova
Amazon Titan
Anderes Amazon

Amazon Nova

Amazon Nova

Preisgestaltung für Understanding Models

Preise für Modelle zur kreativen Inhaltserstellung

Preisgestaltung für Sprachverständnis- und Sprachgenerierungsmodelle

Region:
USA Ost (Virginia)

On-Demand-Preise für Speech-to-Speech-Foundation-Modelle

Amazon-Nova-Modelle	Preis pro 1 000 Eingabe-Token		Preis pro 1 000 Ausgabe-Token
	Sprache	Text*	Sprache	Text*
Amazon Nova Sonic	0.0034 USD	0,00006 USD	0,0136 USD	0,00024 USD

Hinweis: *Die Preise für Eingabe und Ausgabe von Text-Tokens gelten für bestimmte Anwendungsfälle wie die Transkription von Sprache in Text, Tool-Aufrufe zur Erledigung von Aufgaben oder Wissensgrundlagen, Hinzufügen eines Gesprächsverlaufs zur Sitzung usw.

Amazon Titan
Amazon Titan
Anderes Amazon

Anthropic

Anthropic

On-Demand- und Batch-Preise

Region: US-Regionen

Anthropic-Modelle	Preis pro 1 000 Eingabe-Token	Preis pro 1 000 Ausgabe-Token	Preis pro 1 000 Eingabe-Token (Batch)	Preis pro 1.000 Ausgabe-Token (Batch)	Preis pro 1.000 Eingabe-Token (Cache-Schreibvorgang)	Preis pro 1.000 Eingabe-Token (Cache-Lesevorgang)
Claude 3.7 Sonnet***	0,003 USD	0,015 USD	–	–	0,00375 USD	0,0003 USD
Claude 3.5 Sonnet**	0,003 USD	0,015 USD	0,0015 USD	0,0075 USD	0,00375 USD	0,0003 USD
Claude 3.5 Haiku	0,0008 USD	0,004 USD	0,0005 USD	0,0025 USD	0,001 USD	0,00008 USD
Claude 3 Opus*	0,015 USD	0,075 USD	0,0075 USD	0,0375 USD	Entf.	Entf.
Claude 3 Haiku	0,00025 USD	0,00125 USD	0,000125 USD	0,000625 USD	Entf.	Entf.
Claude 3 Sonnet	0,003 USD	0,015 USD	0,0015 USD	0,0075 USD	Entf.	Entf.
Claude 2.1	0,008 USD	0,024 USD	Entf.	Nicht angegeben	Nicht angegeben	Entf.
Claude 2.0	0,008 USD	0,024 USD	Entf.	Nicht angegeben	Nicht angegeben	Entf.
Claude Instant	0,0008 USD	0,0024 USD	Entf.	Nicht angegeben	Nicht angegeben	Entf.
*Claude 3 Opus ist derzeit in der Region USA West (Oregon) verfügbar
**Die Preise für Claude 3.5 Sonnet gelten für jede Version von Claude 3.5 Sonnet (v1 und v2) – Claude 3.5 Sonnet v2 ist derzeit in der Region USA West (Oregon) verfügbar
***Claude 3.7 Sonnet ist auch in der Region USA Ost (Ohio) verfügbar

Anthropic-Modelle	Preis pro 1 000 Eingabe-Token	Preis pro 1 000 Ausgabe-Token	Preis pro 1 000 Eingabe-Token (Batch)	Preis pro 1.000 Ausgabe-Token (Batch)	Preis pro 1.000 Eingabe-Token (Cache-Schreibvorgang)	Preis pro 1.000 Eingabe-Token (Cache-Lesevorgang)
Claude 3.5 Sonnet**	0,003 USD	0,015 USD	0,0015 USD	0,0075 USD	0,00375 USD	0,0003 USD
Claude 3.5 Haiku	0,001 USD	0,005 USD	0,0005 USD	0,0025 USD	0,001 USD	0,00008 USD
Claude 3 Opus*	0,015 USD	0,075 USD	0,0075 USD	0,0375 USD
Claude 3 Haiku	0,00025 USD	0,00125 USD	0,000125 USD	0,000625 USD
Claude 3 Sonnet	0,003 USD	0,015 USD	0,0015 USD	0,0075 USD
Claude 2.1	0,008 USD	0,024 USD	–	–
Claude 2.0	0,008 USD	0,024 USD	–	–
Claude Instant	0,0008 USD	0,0024 USD	–	–
*Claude 3 Opus ist derzeit in der Region USA West (Oregon) verfügbar
**Die Preise für Claude 3.5 Sonnet gelten für jede Version von Claude 3.5 Sonnet (v1 und v2) – Claude 3.5 Sonnet v2 ist derzeit in der Region USA West (Oregon) verfügbar

Region: Europa (London)

Anthropic-Modelle	Preis pro 1 000 Eingabe-Token	Preis pro 1 000 Ausgabe-Token	Preis pro 1 000 Eingabe-Token (Batch)	Preis pro 1 000 Ausgabe-Token (Batch)
Claude 3 Sonnet	0,003 USD	0,015 USD	0,0015 USD	0,0075 USD
Claude 3 Haiku	0,00025 USD	0,00125 USD	0,000125 USD	0,000625 USD

Region: Europa (Zürich)

Anthropic-Modelle

Preis pro 1 000 Eingabe-Token

Preis pro 1 000 Ausgabe-Token

Preis pro 1 000 Eingabe-Token (Batch)

Preis pro 1 000 Ausgabe-Token (Batch)

Claude 3.5 Sonnet

0,003 USD

0,015 USD

0,0015 USD

0,0075 USD

Claude 3 Haiku

0,00025 USD

0,00125 USD

0,000125 USD

0,000625 USD

Region: Südamerika (Sao Paulo)

Anthropic-Modelle

Preis pro 1 000 Eingabe-Token

Preis pro 1 000 Ausgabe-Token

Preis pro 1 000 Eingabe-Token (Batch)

Preis pro 1 000 Ausgabe-Token (Batch)

Claude 3 Sonnet

0,003 USD

0,015 USD

0,0015 USD

0,0075 USD

Claude 3 Haiku

0,00025 USD

0,00125 USD

0,000125 USD

0,000625 USD

Region: Kanada (Zentral)

Anthropic-Modelle

Preis pro 1 000 Eingabe-Token

Preis pro 1 000 Ausgabe-Token

Preis pro 1 000 Eingabe-Token (Batch)

Preis pro 1 000 Ausgabe-Token (Batch)

Claude 3 Sonnet

0,003 USD

0,015 USD

0,0015 USD

0,0075 USD

Claude 3 Haiku

0,00025 USD

0,00125 USD

0,000125 USD

0,000625 USD

Region: Asien-Pazifik (Mumbai)

Anthropic-Modelle

Preis pro 1 000 Eingabe-Token

Preis pro 1 000 Ausgabe-Token

Preis pro 1 000 Eingabe-Token (Batch)

Preis pro 1 000 Ausgabe-Token (Batch)

Claude 3 Sonnet

0,003 USD

0,015 USD

0,0015 USD

0,0075 USD

Claude 3 Haiku

0,00025 USD

0,00125 USD

0,000125 USD

0,000625 USD

Region: Asien-Pazifik (Sydney)

Anthropic-Modelle	Preis pro 1 000 Eingabe-Token	Preis pro 1 000 Ausgabe-Token	Preis pro 1 000 Eingabe-Token (Batch)	Preis pro 1 000 Ausgabe-Token (Batch)
Claude 3.5 Sonnet v2	0,003 USD	0,015 USD	0,0015 USD	0,0075 USD
Claude 3 Sonnet	0,003 USD	0,015 USD	0,0015 USD	0,0075 USD
Claude 3 Haiku	0,00025 USD	0,00125 USD	0,000125 USD	0,000625 USD

Region: Asien-Pazifik (Tokio)

Anthropic-Modelle	Preis pro 1 000 Eingabe-Token	Preis pro 1 000 Ausgabe-Token	Preis pro 1 000 Eingabe-Token (Batch)	Preis pro 1 000 Ausgabe-Token (Batch)
Claude Instant	0,0008 USD	0,0024 USD	–	–
Claude 2.0/2.1	0,008 USD	0,024 USD	–	–
Claude 3 Haiku	0,00025 USD	0,00125 USD	0,000125 USD	0,000625 USD
Claude 3.5 Sonnet	0,003 USD	0,015 USD	0,0015 USD	0,0075 USD

Region: Asien-Pazifik (Singapur)

Anthropic-Modelle	Preis pro 1 000 Eingabe-Token	Preis pro 1 000 Ausgabe-Token	Preis pro 1 000 Eingabe-Token (Batch)	Preis pro 1 000 Ausgabe-Token (Batch)
Claude Instant	0,0008 USD	0,0024 USD	0,0004 USD	0,0012 USD
Claude 2.0/2.1	0,008 USD	0,024 USD	0,004 USD	0,012 USD
Claude 3 Haiku	0,00025 USD	0,00125 USD	0,000125 USD	0,000625 USD
Claude 3.5 Sonnet	0,003 USD	0,015 USD	–	–

Region: Europa (Paris)

Anthropic-Modelle

Preis pro 1 000 Eingabe-Token

Preis pro 1 000 Ausgabe-Token

Preis pro 1 000 Eingabe-Token (Batch)

Preis pro 1 000 Ausgabe-Token (Batch)

Claude 3 Haiku

0,00025 USD

0,00125 USD

0,000125 USD

0,000625 USD

Claude 3 Sonnet

0,003 USD

0,015 USD

0,0015 USD

0,0075 USD

Region: Europa (Frankfurt)

Anthropic-Modelle	Preis pro 1 000 Eingabe-Token	Preis pro 1 000 Ausgabe-Token	Preis pro 1 000 Eingabe-Token (Batch)	Preis pro 1 000 Ausgabe-Token (Batch)
Claude Instant	0,0008 USD	0,0024 USD	–	–
Claude 2.0/2.1	0,008 USD	0,024 USD	–	–
Claude 3 Sonnet	0,003 USD	0,015 USD	0,0015 USD	0,0075 USD
Claude 3.5 Sonnet	0,003 USD	0,015 USD	0,0015 USD	0,0075 USD
Claude 3 Haiku	0,00025 USD	0,00125 USD	0,000125 USD	0,000625 USD

Region: Asien-Pazifik (Seoul)

Anthropic-Modelle

Preis pro 1 000 Eingabe-Token

Preis pro 1 000 Ausgabe-Token

Preis pro 1 000 Eingabe-Token (Batch)

Preis pro 1 000 Ausgabe-Token (Batch)

Claude 3.5 Sonnet

0,003 USD

0,015 USD

–

Claude 3 Haiku

0,00025 USD

0,00125 USD

–

Region USA Ost (Ohio)

Anthropic-Modelle

Preis pro 1 000 Eingabe-Token

Preis pro 1 000 Ausgabe-Token

Preis pro 1 000 Eingabe-Token (Batch)

Preis pro 1 000 Ausgabe-Token (Batch)

Claude 3.5 Sonnet

0,003 USD

0,015 USD

–

Claude 3 Haiku

0,00025 USD

0,00125 USD

–

Region: AWS GovCloud (USA-West), AWS GovCloud (USA-Ost)

Anthropic-Modelle	Preis pro 1 000 Eingabe-Token	Preis pro 1 000 Ausgabe-Token
Claude 3.5 Sonnet	0,0036 USD	0,018 USD
Claude 3 Haiku	0,0003 USD	0,0015 USD

Latenzoptimierte Inferenz

Region USA Ost (Ohio)

	Preis pro 1.000 Eingabe-Token	Preis pro 1.000 Ausgabe-Token
Claude 3.5 Haiku	0,001 USD	0,005 USD

Region: USA Ost (Nord-Virginia)

	Preis pro 1 000 Eingabe-Token	Preis pro 1.000 Ausgabe-Token
Claude 3.5 Haiku	0,001 USD	0,005 USD

Region: USA West (Oregon)

	Preis pro 1 000 Eingabe-Token	Preis pro 1.000 Ausgabe-Token
Claude 3.5 Haiku	0,001 USD	0,005 USD

Preise für bereitgestellten Durchsatz

Region: USA Ost (Nord-Virginia) und USA West (Oregon)

Anthropic-Modelle	Preis pro Stunde pro Modell ohne Verpflichtung	Preis pro Stunde pro Modelleinheit bei einer Laufzeit von einem Monat	Preis pro Stunde pro Modelleinheit bei einer Laufzeit von 6 Monaten
Claude Instant	44,00 USD	39,60 USD	22,00 USD
Claude 2.0/2.1	70,00 USD	63,00 USD	35,00 USD

Anthropic-Modelle	Preis pro Stunde pro Modell ohne Verpflichtung	Preis pro Stunde pro Modelleinheit bei einer Laufzeit von einem Monat	Preis pro Stunde pro Modelleinheit bei einer Laufzeit von 6 Monaten
Claude Instant	44,00 USD	39,60 USD	22,00 USD
Claude 2.0/2.1	70,00 USD	63,00 USD	35,00 USD

Region: Asien-Pazifik (Tokio)

Anthropic-Modelle	Preis pro Stunde pro Modelleinheit bei einer Laufzeit von einem Monat	Preis pro Stunde pro Modelleinheit bei einer Laufzeit von 6 Monaten
Claude Instant	53,00 USD	29,00 USD
Claude 2.0/2.1	86,00 USD	48,00 USD

Region: Europa (Frankfurt)

Anthropic-Modelle	Preis pro Stunde pro Modelleinheit bei einer Laufzeit von einem Monat	Preis pro Stunde pro Modelleinheit bei einer Laufzeit von 6 Monaten
Claude Instant	49,00 USD	27,00 USD
Claude 2.0/2.1	79,00 USD	44,00 USD

Für weitere Informationen zu Modelleinheiten wenden Sie sich bitte an Ihr AWS-Kundenteam.

Cohere

Cohere

On-Demand-Preise

Cohere-Modelle	Preis pro 1 000 Eingabe-Token	Preis pro 1,000 Ausgabe-Tokens	Kosten pro Bild
Command	0,0015 USD	0,0020 USD	–
Command-Light	0,0003 USD	0,0006 USD	–
Command R+	0,0030 USD	0,0150 USD	–
Command R	0,0005 USD	0,0015 USD	–
3 Englisch einbetten	0,0001 USD	–	0,0001 USD
3 Mehrsprachig einbetten	0,0001 USD	–	0,0001 USD

Cohere-Modelle	Preis pro 1.000 Abfragen**
Rerank 3.5	2,00 USD
** Ihnen wird die Anzahl der Abfragen in Rechnung gestellt, wobei eine Abfrage bis zu 100 Dokumentblöcke enthalten kann. Wenn die Abfrage mehr als 100 Dokumentblöcke enthält, wird sie als mehrere Abfragen gezählt. Wenn eine Anfrage beispielsweise 350 Dokumente enthält, wird sie als 4 Abfragen behandelt. Bitte beachten Sie, dass jedes Dokument nur bis zu 500 Token enthalten kann (einschließlich der Abfrage und der gesamten Tokens des Dokuments). Wenn die Token-Länge höher als 512 Token ist, wird es in mehrere Dokumente aufgeteilt.

Preise für Anpassungen (Feinabstimmung)

Cohere-Modelle	Preis für das Training von 1 000 Token	Preis für die Lagerung jedes benutzerdefinierten Modells pro Monat	Preis, der von einem benutzerdefinierten Modell pro Modelleinheit pro Stunde abgeleitet werden kann (mit unverbindlichen Preisen für den bereitgestellten Durchsatz)
Cohere Command	0,004 USD	1,95 USD	49,50 USD
Cohere Command-Light	0,001 USD	1,95 USD	8,56 USD

*Gesamtzahl der trainierten Token = Anzahl der Token im Trainingsdatenkorpus x Anzahl der Epochen

Preise für bereitgestellten Durchsatz

Cohere-Modelle	Preis pro Stunde pro Modell ohne Verpflichtung	Preis pro Stunde pro Modelleinheit bei einer Laufzeit von einem Monat	Preis pro Stunde pro Modelleinheit bei einer Laufzeit von 6 Monaten
Cohere Command	49,50 USD	39,60 USD	23,77 USD
Cohere Command – Light	8,56 USD	6,85 USD	4,11 USD
3 Englisch einbetten	7,12 USD	6,76 USD	6,41 USD
3 Mehrsprachig einbetten	7,12 USD	6,76 USD	6,41 USD

Bitte wenden Sie sich an Ihr AWS-Konto- oder Vertriebsteam, um weitere Informationen zu Modelleinheiten zu erhalten.

DeepSeek

DeepSeek

On-Demand-Preise

Regionen: USA Ost (Nord-Virginia), USA Ost (Ohio) und USA West (Oregon)

DeepSeek-Modelle	Preis pro 1 000 Eingabe-Token	Preis pro 1 000 Ausgabe-Token
DeepSeek-R1	0,00135 USD	0,0054 USD

Luma KI

On-Demand-Preise

Luma AI-Modelle	Videoauflösung	Price per second of video generated
Luma Ray 2	720p, 24 Bilder pro Sekunde	1,50 USD
Luma Ray 2	540p, 24 Bilder pro Sekunde	0,75 USD

Meta

Stability AI

On-Demand-Preise

Stability-AI-Modell	Preis pro generiertem Bild
Stable Diffusion 3.5 Large	0,08 USD
Stable Image Core	0,04 USD
Stable Diffusion 3 Large	0,08 USD
Stable Image Ultra	0,14 USD

Bei früheren Generationen von Bildmodellen, die von Stability AI angeboten wurden, wird der Preis pro Bild berechnet, abhängig von der Anzahl der Schritte und der Bildauflösung.

Stability-AI-Modell	Auflösung des Bildes	Preis pro generiertem Bild in Standardqualität (<=50 Schritte)	Preis pro generiertem Bild in Premium-Qualität (>50 Schritte)
SDXL 1.0	Bis zu 1 024 x 1 024	0,04 USD	0,08 USD

Preise für bereitgestellten Durchsatz

Stability-AI-Modell	Preis pro Stunde pro Modelleinheit bei einer Laufzeit von einem Monat*	Preis pro Stunde pro Modelleinheit bei einer Laufzeit von 6 Monaten*
SDXL 1.0	49,86 USD	46,18 USD

*Beinhaltet Inferenzen für Basismodelle und benutzerdefinierte Modelle.

Bitte wenden Sie sich an Ihr AWS-Konto- oder Vertriebsteam, um weitere Informationen zu Modelleinheiten zu erhalten.

Derzeit wird die Modellanpassung (Feinabstimmung) für Stabilitäts-KI-Modelle in Amazon Bedrock nicht unterstützt.

Benutzerdefinierter Modellimport

Benutzerdefinierter Modellimport

Llama
Multimodales Llama
Mistral
Mixtral
Flan

Llama

Regionen: USA Ost (Nord-Virginia) und USA West (Oregon)

Version mit benutzerdefinierter Modelleinheit	v1.0
Preis pro benutzerdefinierter Modelleinheit pro Minute*	0,0785 USD
Monatliche Lagerkosten pro benutzerdefinierter Modelleinheit	1,95 USD

Region: Europa (Frankfurt)

Version mit benutzerdefinierter Modelleinheit	v1.0
Preis pro benutzerdefinierter Modelleinheit pro Minute*	0,0981 USD
Monatliche Lagerkosten pro benutzerdefinierter Modelleinheit	1,95 USD

Bitte beachten Sie: Die zum Hosten eines Modells benötigten benutzerdefinierten Modelleinheiten hängen von einer Vielzahl von Faktoren ab – insbesondere von der Modellarchitektur, der Anzahl der Modellparameter und der Kontextlänge. Die genaue Anzahl der benötigten benutzerdefinierten Modelleinheiten wird zum Zeitpunkt des Imports festgelegt. Als Referenz: Das Modell Llama 3.1 8B 128K erfordert 2 benutzerdefinierte Modelleinheiten, ein Modell Llama 3.1 70B 128k erfordert 8 benutzerdefinierte Modelleinheiten.

*Abrechnung innerhalb von 5 Minuten

Multimodales Llama

Regionen: USA Ost (Nord-Virginia) und USA West (Oregon)

Version mit benutzerdefinierter Modelleinheit	v1.0
Preis pro benutzerdefinierter Modelleinheit pro Minute*	0,0785 USD
Monatliche Lagerkosten pro benutzerdefinierter Modelleinheit	1,95 USD

Region: Europa (Frankfurt)

Version mit benutzerdefinierter Modelleinheit	v1.0
Preis pro benutzerdefinierter Modelleinheit pro Minute*	0,0981 USD
Monatliche Lagerkosten pro benutzerdefinierter Modelleinheit	1,95 USD

*Abrechnung innerhalb von 5 Minuten

Mistral

Regionen: USA Ost (Nord-Virginia) und USA West (Oregon)

Version mit benutzerdefinierter Modelleinheit	v1.0
Preis pro benutzerdefinierter Modelleinheit pro Minute*	0,0785 USD
Monatliche Lagerkosten pro benutzerdefinierter Modelleinheit	1,95 USD

Region: Europa (Frankfurt)

Version mit benutzerdefinierter Modelleinheit	v1.0
Preis pro benutzerdefinierter Modelleinheit pro Minute*	0,0981 USD
Monatliche Lagerkosten pro benutzerdefinierter Modelleinheit	1,95 USD

*Abrechnung innerhalb von 5 Minuten

Mixtral

Regionen: USA Ost (Nord-Virginia) und USA West (Oregon)

Version mit benutzerdefinierter Modelleinheit	v1.0
Preis pro benutzerdefinierter Modelleinheit pro Minute*	0,0785 USD
Monatliche Lagerkosten pro benutzerdefinierter Modelleinheit	1,95 USD

Region: Europa (Frankfurt)

Version mit benutzerdefinierter Modelleinheit	v1.0
Preis pro benutzerdefinierter Modelleinheit pro Minute*	0,0981 USD
Monatliche Lagerkosten pro benutzerdefinierter Modelleinheit	1,95 USD

*Abrechnung innerhalb von 5 Minuten

Flan

Regionen: USA Ost (Nord-Virginia) und USA West (Oregon)

Version mit benutzerdefinierter Modelleinheit	v1.0
Preis pro benutzerdefinierter Modelleinheit pro Minute*	0,0785 USD
Monatliche Lagerkosten pro benutzerdefinierter Modelleinheit	1,95 USD

Region: Europa (Frankfurt)

Version mit benutzerdefinierter Modelleinheit	v1.0
Preis pro benutzerdefinierter Modelleinheit pro Minute*	0,0981 USD
Monatliche Lagerkosten pro benutzerdefinierter Modelleinheit	1,95 USD

*Abrechnung innerhalb von 5 Minuten

On-Demand-Inferenzpreise:
Die Abrechnung erfolgt in 5-Minuten-Fenstern für die Dauer, in der Ihre Modellkopie aktiv ist, beginnend mit dem ersten erfolgreichen Aufruf. Der maximale Durchsatz und die maximale Parallelitätsgrenze pro Modellkopie hängen von Faktoren wie der Kombination von Eingabe-/Ausgabe-Tokens, Hardwaretyp, Modellgröße, Architektur und Inferenzoptimierungen ab und werden während des Modellimport-Workflows festgelegt.

Bedrock skaliert automatisch die Anzahl der Modellkopien je nach Ihren Nutzungsmustern. Wenn über einen Zeitraum von 5 Minuten keine Aufrufe erfolgen, wird Bedrock auf Null herunterskaliert und wieder hochskaliert, wenn Sie Ihr Modell aufrufen. Bei erneuter Skalierung kann es je nach Modellgröße zu einer Kaltstartdauer (in einigen zehn Sekunden) kommen. Bedrock skaliert auch die Anzahl der Modellkopien, wenn Ihr Inferenzvolumen die Parallelitätsgrenzen einer einzelnen Modellkopie durchweg überschreitet. Hinweis: Es gibt standardmäßig ein Maximum von 3 Modellkopien pro Konto und importiertem Modell, das durch Service Quotas erhöht werden kann.

Preisdetails zu Tools und Optimierungen

Flows
Wissensdatenbanken
Integritätsschutz
Modellbewertung
Datenautomatisierung

Flows
Amazon Bedrock Flows

Die Gebühren richten sich nach der Anzahl der Knotenübergänge, die zum Ausführen Ihrer Anwendung erforderlich sind. Bedrock Flows zählt jedes Mal, wenn ein Knoten in Ihrem Workflow ausgeführt wird, einen Knotenübergang. Sie werden für die Gesamtzahl der Knotenübergänge in all Ihren Flows berechnet.

Alle Gebühren werden täglich abgerechnet und ab dem 1. Februar 2025 monatlich in Rechnung gestellt.

Preis pro 1 000 Knotenübergänge

0,035 USD

Zusätzliche Gebühren

Es können zusätzliche Gebühren anfallen, wenn die Ausführung Ihres Anwendungsworkflows andere AWS-Services nutzt oder Daten überträgt. Wenn Ihr Workflow beispielsweise eine Richtlinie von Amazon Bedrock – Integritätsschutz aufruft, wird Ihnen die Anzahl der von der Richtlinie verarbeiteten Texteinheiten in Rechnung gestellt.
Wissensdatenbanken
Strukturierter Datenabruf (SQL-Generierung)

Der strukturierte Datenabruf wird für jede Anforderung zur Generierung einer SQL-Abfrage in Rechnung gestellt. Die generierte SQL-Abfrage wird verwendet, um die Daten aus strukturierten Datenspeichern abzurufen.

Rerank-Modelle

Rerank-Modelle wurden entwickelt, um die Relevanz und Genauigkeit von Antworten in RAG-Anwendungen (Retrieval Augmented Generation) zu verbessern. Sie werden pro Anfrage berechnet.

**Ihnen wird die Anzahl der Abfragen in Rechnung gestellt, wobei eine Abfrage bis zu 100 Dokumentblöcke enthalten kann. Wenn die Abfrage mehr als 100 Dokumentblöcke enthält, wird sie als mehrere Abfragen gezählt. Wenn eine Anfrage beispielsweise 350 Dokumente enthält, wird sie als 4 Abfragen behandelt. Bitte beachten Sie, dass jedes Dokument nur bis zu 512 Token enthalten kann (einschließlich der Abfrage und der gesamten Tokens des Dokuments). Wenn die Token-Länge höher als 512 Token ist, wird es in mehrere Dokumente aufgeteilt. Eine Abfrage entspricht einer Sucheinheit.
Integritätsschutz

Preis pro 1 000 Knotenübergänge
0,035 USD

Amazon-Bedrock-Integritätsschutz

Integritätsschutz-Richtlinie*	Preis
Inhaltsfilter (Textinhalt)	0,15 USD pro 1 000 Texteinheiten
Inhaltsfilter (Bildinhalt)	0,00075 USD pro verarbeitetem Bild
Abgelehnte Themen	0,15 USD pro 1 000 Texteinheiten
Filter für vertrauliche Informationen	0,10 USD pro 1 000 Texteinheiten
Filter für vertrauliche Informationen (regulärer Ausdruck)	Kostenfrei
Wortfilter	Kostenlos
Überprüfung der kontextuellen Begründung	0,10 USD pro 1 000 Texteinheiten

On-Demand-Preise

* Jede Integritätsschutz-Richtlinie ist optional und kann je nach Ihren Anwendungsanforderungen aktiviert werden. Die Gebühren richten sich nach dem Richtlinientyp, der für den Integritätsschutz verwendet wurde. Wenn beispielsweise einen Integritätsschutz mit Inhaltsfiltern und abgelehnten Themen konfiguriert ist, fallen für diese beiden Richtlinien Gebühren an, während für Filter für vertrauliche Informationen keine Gebühren anfallen.

Hinweis: Eine Texteinheit kann bis zu 1000 Zeichen enthalten. Wenn eine Texteingabe mehr als 1 000 Zeichen umfasst, wird sie als mehrere Texteinheiten verarbeitet, die jeweils 1 000 Zeichen oder weniger enthalten. Wenn eine Texteingabe beispielsweise 5600 Zeichen enthält, werden 6 Texteinheiten berechnet.

Die kontextuelle Begründungsprüfung verwendet eine Referenzquelle und eine Abfrage, um zu ermitteln, ob die Modellantwort auf der Quelle basiert und für die Abfrage relevant ist. Die Gesamtzahl der berechneten Texteinheiten wird durch die Kombination aller Zeichen in der Quelle, der Abfrage und der Modellantwort berechnet.

Modellbewertung

Modellbewertung

Die Modellbewertung wird für die Inferenz aus dem von Ihnen ausgewählten Modell in Rechnung gestellt. Die automatisch generierten algorithmischen Ergebnisse werden ohne Aufpreis zur Verfügung gestellt. Bei einer menschenbasierten Bewertung, bei der Sie Ihren eigenen Arbeitsablauf mitbringen, werden Ihnen die Modellinferenz in der Bewertung und eine Gebühr von 0,21 USD pro abgeschlossener menschlicher Aufgabe in Rechnung gestellt.

Modell

Preis pro 1 000 Eingabe-Token

Preis pro 1 000 Ausgabe-Token

Preis pro menschlicher Aufgabe

Zur Bewertung ausgewähltes Modell

Basierend auf dem ausgewählten Modell

0,21 USD

Datenautomatisierung
Datenautomatisierung

Amazon Bedrock Knowledge Bases bietet eine Integration mit Bedrock-Data-Automation, um relevantere und genauere Antworten für multimodale Daten bereitzustellen. Wenn Sie eine Wissensdatenbank einrichten, können Sie Bedrock Data Automation als Ihre Analysemethode auswählen, um aussagekräftige Erkenntnisse aus Bildern oder Dokumenten zu analysieren und zu extrahieren, die Zahlen, Diagramme und Diagramme enthalten können. Während der Verarbeitung extrahiert Bedrock Data Automation aussagekräftige Informationen aus aufgenommenen Dokumenten und Bildern, die dann in nachfolgenden Schritten der Knowledge Base zum Chunking, Einbetten und Speichern verwendet werden. Bei der Integration in Knowledge Bases liefert Bedrock Data Automation standardisierte Ergebnisse und berechnet diese.

Preisbeispiele

AI21 Labs

Ein Anwendungsentwickler sendet die folgenden API-Aufrufe an Amazon Bedrock: Eine Anfrage an das Jurrasic-2-Mid-Modell von AI21, eine Eingabe von 10 000 Token an Eingabetext zu einer Ausgabe von 2 000 Token zusammenzufassen.

Anfallende Gesamtkosten = 10 000 Token / 1 000 * 0,0125 USD + 2 000 Token / 1 000 * 0,0125 USD = 0,15 USD
Amazon

On-Demand-Preise

Ein Anwendungsentwickler sendet stündlich die folgenden API-Aufrufe an Amazon Bedrock: Eine Anfrage an das Lite-Modell von Amazon Titan Text, um eine Eingabe von 2 000 Token an Eingangstext zu einer Ausgabe von 1 000 Token zusammenzufassen.

Anfallende stündliche Gesamtkosten = 2 000 Token / 1 000 * 0,0003 USD + 1 000 Token / 1 000 * 0,0004 USD = 0,001 USD

Ein Anwendungsentwickler sendet die folgenden API-Aufrufe an Amazon Bedrock: Eine Anfrage an das Basismodell von Amazon Titan Image Generator, um 1 000 Bilder mit einer Größe von 1024 x 1024 in Standardqualität zu generieren.

Anfallende Gesamtkosten = 1 000 Bilder * 0,01 USD pro Bild = 10 USD

Preise für die Anpassung (Feinabstimmung und kontinuierliche Vorschulung)

Ein Anwendungsentwickler passt ein Amazon-Titan-Image-Generator-Modell mithilfe von 1 000 Bild-Text-Paaren an. Nach der Schulung verwendet der Entwickler eine Stunde lang den vom benutzerdefinierten Modell bereitgestellten Durchsatz, um die Leistung des Modells zu bewerten. Das fein abgestimmte Modell wird einen Monat lang gespeichert. Nach der Auswertung verwendet der Entwickler den bereitgestellten Durchsatz (1 Monat Vertragsbindung), um das benutzerdefinierte Modell zu hosten.

Für die Feinabstimmung fallen monatlich die folgenden Kosten an = Training der Feinabstimmung (0,005 USD * 500 * 64), wobei 0,005 USD der Preis pro betrachtetes Bild, 500 die Anzahl der Schritte und 64 die Batch-Größe + benutzerdefinierter Modellspeicher pro Monat (1,95 USD) + 1 Stunde benutzerdefinierte Modellinferenz (21 USD) = 160 USD + 1.95 USD + 21 = 182,95 USD

Preise für bereitgestellten Durchsatz

Ein Anwendungsentwickler kauft zwei Modelleinheiten von Amazon Titan Text Express mit 1 Monat Vertragsbindung für seinen Anwendungsfall zur Textzusammenfassung.

Anfallende monatliche Gesamtkosten = 2 Modelleinheiten * 18,40 USD / Stunde * 24 Stunden * 31 Tage = 27 379,20 USD

Ein Anwendungsentwickler kauft eine Modelleinheit des Basismodells von Amazon Titan Image Generator mit 1 Monat Vertragsbindung.

Anfallende Gesamtkosten = 1 Modelleinheit * 16,20 USD * 24 Stunden * 31 Tage = 12 052,80 USD
Amazon-Bedrock-Integritätsschutz

Beispiel 1: Chatbot für den Kundensupport
Ein Anwendungsentwickler erstellt einen Chatbot für den Kundensupport und verwendet Inhaltsfilter, um schädliche Inhalte zu blockieren, und abgelehnte Themen, um unerwünschte Anfragen und Antworten herauszufiltern.

Der Chatbot bedient 1 000 Benutzeranfragen pro Stunde. Jede Benutzerabfrage hat eine durchschnittliche Eingabelänge von 200 Zeichen und erhält eine FM-Antwort von 1 500 Zeichen.

Jede Benutzerabfrage von 200 Zeichen entspricht einer Texteinheit.

Jede FM-Antwort von 1 500 Zeichen entspricht 2 Texteinheiten.

Pro Stunde verarbeitete Texteinheiten = (1+2) * 1 000 Abfragen = 3 000 Texteinheiten

Anfallende Gesamtkosten pro Stunde für Inhaltsfilter und abgelehntes Thema = 3000 * (0,15 USD + 0,15 USD)/1000 = 0,90 USD

Beispiel 2: Zusammenfassung des Callcenter-Transkripts
Ein Anwendungsentwickler erstellt eine Anwendung, um Chat-Transkripte zwischen Benutzern und Support-Kundendienstmitarbeitern zusammenzufassen. Diese verwendet einen Filter für vertrauliche Informationen, um persönlich identifizierbare Informationen (PII) in den generierten Zusammenfassungen für 10 000 Konversationen zu redigieren.

Jede generierte Zusammenfassung hat durchschnittlich 3 500 Zeichen, was 4 Texteinheiten entspricht.

Anfallende Gesamtkosten für die Zusammenfassung von 10 000 Konversationen = 10 000 * 4 * (0,1 / 1 000 USD) = 4 USD
Amazon-Bedrock-Wissensdatenbanken

Preisbeispiel 1 (Reranking mit dem Modell Amazon Rerank 1.0)

In einem bestimmten Monat stellen Sie mithilfe des Modells Amazon Rerank 1.0 2 Millionen Anfragen an die Rerank API. 1 Million Anfragen enthalten jeweils weniger als 100 Dokumente und werden daher für jeweils eine Anfrage in Rechnung gestellt. Die verbleibenden 1 Million Anfragen enthalten 120 -150 Dokumente, weshalb für jede Anfrage 2 Anfragen berechnet werden.

Preis für eine Anfrage = 0,001 USD
Gesamtgebühr = 1.000.000 * 0,001 USD + 1.000.000 * 2 * 0,001 USD = 3000 USD

Preisbeispiel 2: (Abruf strukturierter Daten)

Ein Anwendungsentwickler erstellt einen Support-Chatbot, der in Amazon Redshift gespeicherte strukturierte Daten abfragt. Der Entwickler erstellt eine Bedrock Knowledge Base und stellt eine Verbindung zu Amazon Redshift her. Der Chatbot bedient 10000 Benutzeranfragen pro Stunde. Jede Benutzerabfrage kostet 0,002 USD pro GenerateQuery-API, um SQL aus einer Benutzerabfrage zu generieren.

Gesamtkosten für die Generierung von SQL pro Stunde = 0,002 USD * 10000 = 20 USD.
Im Monat angefallene Gesamtkosten = 20 USD * 24 * 30 = 1440 USD
Anthropic

On-Demand-Preise

Ein Anwendungsentwickler sendet die folgenden API-Aufrufe an Amazon Bedrock in der Region USA West (Oregon): Eine Anfrage an das Claude-Modell von Anthropic, eine Eingabe von 11 000 Token an Eingangstext zu einer Ausgabe von 4 000 Token zusammenzufassen.

Anfallende Gesamtkosten = 11 000 Token / 1 000 * 0,008 USD + 4 000 Token / 1 000 * 0,024 USD = 0,088 USD + 0,096 USD = 0,184 USD

Preise für bereitgestellten Durchsatz

Ein Anwendungsentwickler kauft eine Modelleinheit von Anthropic Claude Instant in der Region USA West (Oregon):

Anfallende monatliche Gesamtkosten = 1 Modelleinheit * 39,60 USD * 24 Stunden * 31 Tage = 29 462,40 USD
Cohere

On-Demand-Preise

Ein Anwendungsentwickler sendet die folgenden API-Aufrufe an Amazon Bedrock: Eine Anforderung an das Command-Modell von Cohere, eine Eingabe von 6 000 Token an Eingabetext zu einer Ausgabe von 2 000 Token zusammenzufassen.

Anfallende Gesamtkosten = 6 000 Token / 1 000 * 0,0015 USD + 2 000 Token / 1 000 * 0,0020 USD = 0,013 USD

Ein Anwendungsentwickler sendet die folgenden API-Aufrufe an Amazon Bedrock: Eine Anfrage an das Command-Light-Modell von Cohere, eine Eingabe von 6 000 Token an Eingabetext zu einer Ausgabe von 2 000 Token zusammenzufassen.

Anfallende Gesamtkosten = 6 000 Token / 1 000 * 0,0003 USD + 2 000 Token / 1 000 * 0,0006 USD = 0,003 USD

Ein Anwendungsentwickler sendet die folgenden API-Aufrufe an Amazon Bedrock: Eine Anfrage an das englische oder mehrsprachige Embed-Modell von Cohere, um Einbettungen für 10 000 Eingabe-Token zu generieren.

Anfallende Gesamtkosten = 10 000 Token / 1 000 * 0,0001 USD = 0,001 USD

Preise für die Anpassung (Feinabstimmung)

Ein Anwendungsentwickler passt ein Cohere-Command-Modell mithilfe von 1 000 Datentokens an. Nach der Schulung verwendet der Entwickler eine Stunde lang den vom benutzerdefinierten Modell bereitgestellten Durchsatz, um die Leistung des Modells zu bewerten. Das fein abgestimmte Modell wird einen Monat lang gespeichert. Nach der Auswertung verwendet der Entwickler den bereitgestellten Durchsatz (1 Monat Vertragsbindung), um das benutzerdefinierte Modell zu hosten.

Anfallende monatliche Kosten für die Feinabstimmung = Training zur Feinabstimmung (0,004 USD * 1 000) + Speicherplatz für benutzerdefinierte Modelle pro Monat (1,95 USD) + eine Stunde Inferenz für benutzerdefinierte Modelle (49,50 USD) = 55,45 USD

Monatliche Kosten für den bereitgestellten Durchsatz (1 Monat Vertragsbindung) des benutzerdefinierten Modells = 39,60 USD

Preise für bereitgestellten Durchsatz

Ein Anwendungsentwickler kauft eine Modelleinheit von Cohere Command mit 1 Monat Vertragsbindung für seinen Anwendungsfall zur Textzusammenfassung.

Anfallende monatliche Gesamtkosten = 1 Modelleinheit * 39,60 USD * 24 Stunden * 31 Tage = 29 462,40 USD
Benutzerdefinierter Modellimport

Preisbeispiel: Ein Anwendungsentwickler importiert ein angepasstes Modell vom Typ Llama 3.1 mit einer Größe von 8 B Parametern und einer Sequenzlänge von 128 K in der Region us-east-1 und löscht das Modell nach einem Monat. Dies erfordert 2 benutzerdefinierte Modelleinheiten. Der Preis pro Minute beträgt also 0,1570 USD, da 2 benutzerdefinierte Modelleinheiten erforderlich sind. Die Lagerkosten für 2 benutzerdefinierte Modelleinheiten würden sich für den Monat auf 3,90 USD belaufen.

Der Import des Modells ist kostenlos. Der erste erfolgreiche Aufruf erfolgt um 8:03 Uhr. Zu diesem Zeitpunkt beginnt die Messung. Die 5-Minuten-Messfenster sind von 8:03 Uhr bis 8:07 Uhr; 8:07 Uhr bis 8:11 Uhr usw. Wenn innerhalb eines Zeitraums von 5 Minuten mindestens ein Aufruf erfolgt, wird das Fenster für die Abrechnung als aktiv betrachtet. Wenn um 8:03 Uhr ein Aufruf erfolgt und nach 8:07 Uhr keine weiteren Aufrufe erfolgen, stoppt die Messung um 8:07 Uhr. In diesem Fall würde die Rechnung wie folgt berechnet werden: 0,1570 USD x 5 Minuten x 1 Fünf-Minuten-Fenster = 0,785 USD.
Datenautomatisierung

Preisbeispiel 1:
Nehmen wir an, Sie verarbeiten ein 1.000-seitiges Dokument mit BDA Custom Output. Alle 1.000 Seiten werden mit Vorlage 1 verarbeitet, die 15 Felder enthält. Der Preis pro Seite für jede Vorlage mit 30 Feldern oder weniger beträgt 0,040 USD. Die Gesamtkosten belaufen sich auf 40 USD.

Gesamtanzahl bearbeiteter Seiten = 1.000
Preis pro Seite für Vorlagen mit weniger als 30 Feldern = 0,040 USD
Gesamtgebühr = 1,000 USD * 0.040 USD = 40 USD

Preisbeispiel 2:
Nehmen wir an, Sie verarbeiten 2 Dokumente mit BDA Custom Output. Dokument 1 hat 40 Seiten und wird mit Vorlage 1 verarbeitet, die 20 Felder enthält. Dokument 2 hat 10 Seiten und wird mit Vorlage 2 verarbeitet, die 40 Felder enthällt. Der Preis pro Seite von Vorlage 1 beträgt 0,040 USD, da sie 30 Felder oder weniger enthält. Der Preis pro Seite von Vorlage 2 beträgt 0,045 USD. Die Verarbeitungskosten für Dokument 1 unter Verwendung von Vorlage 1 betragen 1,60 USD. Die Verarbeitungskosten für Dokument 2 unter Verwendung von Vorlage 2 betragen 0,45 USD. Die Gesamtkosten für die Bearbeitung beider Dokumente würden sich auf 2,05 USD belaufen.

Gesamtanzahl bearbeiteter Seiten = 50
Preis pro Seite für Vorlage 1 mit weniger als 30 Feldern = 0,040 USD
Preis pro Seite für Vorlage 2 mit 40 Feldern = 0,040 USD + (Anzahl zusätzlicher Felder über 30 * 0,0005 USD pro Feld)
Anzahl zusätzlicher Felder über 30 = 40 - 30 = 10
Preis pro Seite für Vorlage 2 mit 40 Feldern = 0,040 USD + (10 * 0,0005 USD pro Feld) = 0,045 USD
Gebühr für Dokument 1 mit Vorlage 1 = 40 Seiten x 0,040 USD pro Seite = 1,6 USD
Gebühr für Dokument 2 mit Vorlage 2 = 10 Seiten x 0,045 USD pro Seite = 0,45 USD
Gesamtgebühr = Gebühr für Dokument 1 + Gebühr für Dokument 2 = 1,6 USD + 0,45 USD = 2,05 USD

Preisbeispiel 3:
Nehmen wir an, Sie richten Bedrock-Wissensdatenbanken ein, um Bedrock Data Automation als Parser zu verwenden, und nehmen dann ein 1 000-seitiges Dokument auf. Beachten Sie, dass sich die Kostenstrukturen zwischen den Parsing-Optionen der Wissensdatenbanken unterscheiden. BDA verwendet Preise pro Seite, während Basismodell-Parser Gebühren auf der Grundlage von Eingabe- und Ausgabe-Token berechnen. Für den Kontext sind für die Verarbeitung von 1 000 Seiten, von denen 30 % Tabellen und 30 % Zahlen enthalten, in der Regel 2 900 Eingabe-Token und 750 Ausgabe-Token erforderlich. Der Token-Verbrauch variiert je nach Inhaltstyp.Es wird den Kunden daher ermpfohlen, anhand ihrer eigenen Daten zu testen, um genauere Schätzungen zu erhalten. Die Integration von Bedrock-Wissensdatenbanken und Bedrock Data Automation verwendet die Standardausgabe, wobei der Preis pro Seite 0,010 USD beträgt. Die Gesamtkosten würden sich auf 10 USD belaufen.

Gesamtanzahl bearbeiteter Seiten = 1.000
Preis pro Seite für Standardausgabe = 0,010 USD
Gesamtgebühr = 1 000 * 0,010 USD = 10 USD

Preisbeispiel 4:
Nehmen wir an, Sie verarbeiten ein 60-minütiges Video mit BDA-Standard-Ausgabe. Der Preis pro Minute für die Videostandardausgabe beträgt 0,050 USD. Die Gesamtkosten belaufen sich auf 3,00 USD.

Insgesamt verarbeitete Minuten = 60
Preis pro Minute für die Videostandardausgabe = 0,050 USD
Gesamtgebühr = 60 * 0,050 USD = 3,00 USD

Preisbeispiel 5:
Nehmen wir an, Sie verarbeiten 2 000 Bilder mit benutzerdefinierter BDA-Ausgabe. Die ersten 1.000 Bilder werden mit Vorlage 1 verarbeitet, die 10 Felder enthält. Die letzten 1.000 Seiten werden mit Vorlage 2 verarbeitet, die 40 Felder enthält. Der Preis pro Bild für Vorlage 1 beträgt 0,005 USD, da sie 30 Felder oder weniger enthält. Der Preis pro Bild von Vorlage 2 beträgt 0,01 USD. Die Verarbeitungskosten für die ersten 1.000 Bilder mit Vorlage 1 betragen 5,00 USD. Die Verarbeitungskosten für die zweiten 1.000 Bilder mit Vorlage 2 betragen 10,00 USD. Die Gesamtkosten für die Verarbeitung aller 2.000 Bilder würden 15,00 USD betragen

Kosten für die ersten 1000 Bilder = 1.000 Bilder * 0,005 USD pro Bild = 5,00 USD
Kosten für 1.000 Bilder pro Sekunde = 1.000 Bilder * (0,005 USD + (Anzahl zusätzlicher Felder über 30 * 0,0005 USD pro Feld))
'= 1.000 * (0,005 USD + ((40 - 30) * 0,0005 USD))
= 1,000 * (0,005 USD + (10 * 0,0005 USD)) = 10.00 USD
Gesamtkosten = 5,00 USD + 10,00 USD = 15,00 USD

Preisbeispiel 6:
Nehmen wir an, Sie möchten die Standard-Ausgabe von Bedrock Data Automation verwenden, um 15 000 Minuten an Meeting-Audioaufzeichnungen in Ihrem Unternehmen zu verarbeiten. Die Gesamtkosten für die Verarbeitung aller 15.000 Audiominuten würden sich auf 90 USD belaufen.

Insgesamt verarbeitete Minuten = 15.000 Minuten
Gesamtgebühr = 15 000 Min. * 0,006 USD = 90 USD
DeepSeek

On-Demand-Preise

Ein Anwendungsentwickler ruft stündlich die folgenden API-Aufrufe bei Amazon Bedrock auf: eine Anfrage an das DeepSeek-R1-Modell, eine Eingabe von 2 000 Token von Eingabetext in eine Ausgabe von 1 000 Token (einschließlich Argumentationstoken) zusammenzufassen:

Anfallende stündliche Gesamtkosten = 2 000 Token / 1000 * 0,00135 USD + 1000 Token / 1 000 * 0,0054 USD = 0,0081 USD
Flows

Beispiel: Zusammenfassung von Nachrichten
Ein Anwendungsentwickler erstellt einen Flow, um die Zusammenfassung von Nachrichten für Händler zu automatisieren. Der Flow umfasst einen Eingabeknoten, der einen S3-Speicherorte aufnimmt, und einen S3-Abrufknoten, der 10 Dateien abruft, die Artikel von 10 großen Nachrichtenagenturen in S3 enthalten (2 Knotenübergänge). Anschließend wird ein Iteratorknoten verwendet, um ein Modell mit einem Prompt-Knoten aufzurufen, damit jede Datei zusammengefasst wird (+ 10 Dateien x 2 Knotenübergänge). Anschließend werden alle Ergebnisse mithilfe eines Kollektorknotens gesammelt, die Ergebnisse mithilfe des S3-Speicherknotens in S3 geschrieben und in einem Ausgabeknoten abgeschlossen (+ 3 Knotenübergänge). Sie führen diesen Flow an jedem Wochentag jede halbe Stunde durch.

Die Anzahl der Knotenübergänge pro Flow-Ausführung ist: 2 + 1 + 10 * 2 + 3 = 25 Knotenübergänge/Flow-Ausführung

Die Anzahl der Flow-Ausführungen pro Monat ist: 24 Stunden *2* 5 Tage * 4 Wochen = 960 Flow-Ausführungen/Monat.

Die monatliche Gesamtrechnung beträgt: 25 * 960 * 0,035/1000 USD = 0,84 USD

Zusätzliche Gebühren
Die Rechnung enthält auch zusätzliche Gebühren für AWS-Services, die bei der Ausführung des Workflows verwendet werden, einschließlich der Nutzung von Amazon S3 in den Abruf- und Speicherknoten und der Nutzung des Amazon Bedrock Foundation Model im Prompt-Knoten.
Meta

On-Demand-Preise

Ein Anwendungsentwickler sendet die folgenden API-Aufrufe an Amazon Bedrock: Eine Anfrage an das Chat-Modell von Llama 2 (13B) von Meta, um eine Eingabe von 2 000 Token an Eingabetext zu einer Ausgabe von 500 Token zusammenzufassen.

Anfallende Gesamtkosten = 2 000 Token / 1 000 * 0,00075 USD + 500 Token / 1 000 * 0,001 USD = 0,002 USD

Preise für die Anpassung (Feinabstimmung)

Ein Anwendungsentwickler passt das vortrainierte Llama 2 (70B)-Modell mithilfe von 1 000 Datentokens an. Nach der Schulung verwendet der Entwickler eine Stunde lang den vom benutzerdefinierten Modell bereitgestellten Durchsatz, um die Leistung des Modells zu bewerten. Das fein abgestimmte Modell wird einen Monat lang gespeichert. Nach der Auswertung verwendet der Entwickler den bereitgestellten Durchsatz (1 Monat Vertragsbindung), um das benutzerdefinierte Modell zu hosten.

Anfallende monatliche Kosten für die Feinabstimmung = Training zur Feinabstimmung (0,00799 USD * 1 000) + Speicherplatz für benutzerdefinierte Modelle pro Monat (1,95 USD) + 1 Stunde Inferenz für benutzerdefinierte Modelle (23,50 USD) = 33,44 USD

Anfallende monatliche Kosten für den bereitgestellten Durchsatz (1 Monat Vertragsbindung) des benutzerdefinierten Modells = 21,18 USD

Preise für bereitgestellten Durchsatz

Ein Anwendungsentwickler kauft eine Modelleinheit von Meta Llama 2 mit einer Vertragsbindung von einem Monat für seinen Anwendungsfall zur Textzusammenfassung.

Anfallende monatliche Gesamtkosten = 1 Modelleinheit * 21,18 USD * 24 Stunden * 31 Tage = 15 757,92 USD
Mistral AI

On-Demand-Preise

Ein Anwendungsentwickler sendet stündlich die folgenden API-Aufrufe an Amazon Bedrock: Eine Anfrage an das Mistral-7B-Modell, um eine Eingabe von 2 000 Token an Eingangstext zu einer Ausgabe von 1 000 Token zusammenzufassen.

Anfallende stündliche Gesamtkosten = 2 000 Token / 1 000 * 0,00015 USD + 1000 Token / 1 000 * 0,0002 USD = 0,0005 USD

Ein Anwendungsentwickler sendet stündlich die folgenden API-Aufrufe an Amazon Bedrock: Eine Anfrage an das Mixtral-8x7B-Modell, um eine Eingabe von 2 000 Token an Eingangstext zu einer Ausgabe von 1 000 Token zusammenzufassen.

Anfallende stündliche Gesamtkosten = 2 000 Token / 1 000 * 0,00045 USD + 1 000 Token / 1 000 * 0,0007 USD = 0,0016 USD

Ein Anwendungsentwickler führt stündlich die folgenden API-Aufrufe an Amazon Bedrock durch: Eine Anfrage an das Mistral-Large-Modell, um eine Eingabe von 2 000 Token an Eingabetext zu einer Ausgabe von 1 000 Token zusammenzufassen.

Anfallende stündliche Gesamtkosten = 2 000 Token / 1 000 * 0,008 USD + 1 000 Token / 1 000 * 0,024 USD = 0,04 USD

Modellbewertung

Beispiel 1 zur Modellbewertung:

Der Datensatz enthält 50 Eingabeaufforderungen, und der Entwickler benötigt 1 Mitarbeiter, um jeden Eingabeaufforderungs-/Antwortsatz zu bewerten (konfigurierbar bei der Erstellung des Bewertungsauftrags als Parameter „Mitarbeiter pro Eingabeaufforderung“).

Dieser Evaluierungsauftrag umfasst 50 Aufgaben (1 Aufgabe für jedes Eingabeaufforderungs-/Antwortpaar pro Mitarbeiter). Die 50 Eingabeaufforderungen ergeben zusammen 5 000 Eingabe-Token und die zugehörigen Antworten ergeben zusammen 15 000 Token für Anthropic Claude Instant und 20 000 Token für Anthropic Claude 2.1.

Für diesen Modellevaluierungsauftrag fallen folgende Kosten an:

Element	Anzahl der Eingabe-Tokens	Preis pro 1 000 Eingabe-Token	Kosten der Eingabe	Anzahl der Ausgabe-Tokens	Preis pro 1 000 Ausgabe-Tokens	Kosten der Ausgabe	Anzahl menschlicher Aufgaben	Preis pro menschlicher Aufgabe	Kosten menschlicher Aufgaben	Gesamtsumme
Claude Instant Inference	5 000	0,0008 USD	0,004 USD	15 000	0,0024 USD	0,036 USD				0,04 USD
Claude 2.1 Inference	5 000	0,008 USD	0,04 USD	20 000	0,024 USD	0,48 USD				0,52 USD
Menschliche Aufgaben							50	0,21 USD	10,50 USD	10,50 USD
Gesamtsumme										11,06 USD

Beispiel 2 zur Modellevaluierung:

On-Demand-Preise
Ein Anwendungsentwickler übermittelt einen Datensatz zur menschenbasierten Modellevaluierung mit Anthropic Claude 2.1 und Anthropic Claude Instant in der AWS-Region USA Ost (Nord-Virginia).

Der Datensatz enthält 50 Eingabeaufforderungen, und der Entwickler benötigt 2 Mitarbeiter, um jeden Eingabeaufforderungs-/Antwortsatz zu bewerten (konfigurierbar bei der Erstellung des Bewertungsauftrags als Parameter „Mitarbeiter pro Eingabeaufforderung“). Dieser Evaluierungsauftrag umfasst 100 Aufgaben (1 Aufgabe für jeden Eingabeaufforderungs-/Antwortsatz pro Mitarbeiter: 2 Mitarbeiter x 50 Eingabeaufforderungs-/Antwortsätze = 100 menschliche Aufgaben).

Die 50 Eingabeaufforderungen ergeben zusammen 5 000 Eingabe-Token und die zugehörigen Antworten ergeben zusammen 15 000 Token für Anthropic Claude Instant und 20 000 Token für Anthropic Claude 2.1.

Für diesen Modellevaluierungsauftrag fallen folgende Kosten an:

Element	Anzahl der Eingabe-Tokens	Preis pro 1 000 Eingabe-Token	Kosten der Eingabe	Anzahl der Ausgabe-Tokens	Preis pro 1 000 Ausgabe-Tokens	Kosten der Ausgabe	Anzahl menschlicher Aufgaben	Preis pro menschlicher Aufgabe	Kosten menschlicher Aufgaben	Gesamtsumme
Claude Instant Inference	5 000	0,0008 USD	0,0040 USD	15 000	0,0024 USD	0,036 USD				0,04 USD
Claude 2.1 Inference	5 000	0,008 USD	0,0400 USD	20 000	0,024 USD	0,48 USD				0,52 USD
Menschliche Aufgaben							100	0,21 USD	21,00 USD	21,00 USD
Gesamtsumme										21,56 USD

Stability AI

On-Demand-Preise

Ein Anwendungsentwickler sendet die folgenden API-Aufrufe an Amazon Bedrock: Eine Anfrage an das SDXL-Modell, ein Bild mit einer Größe von 512 x 512 mit einer Schrittgröße von 70 zu generieren (Premium-Qualität).

Anfallende Gesamtkosten = 1 Bild * 0,036 USD pro Bild = 0,036 USD

Ein Anwendungsentwickler sendet die folgenden API-Aufrufe an Amazon Bedrock: Eine Anfrage an das SDXL-1.0-Modell, ein Bild mit einer Größe von 1024 x 1024 mit einer Schrittgröße von 70 zu generieren (Premium-Qualität).

Anfallende Gesamtkosten = 1 Bild * 0,08 USD pro Bild = 0,08 USD

Preise für bereitgestellten Durchsatz

Ein Anwendungsentwickler kauft eine Modelleinheit von SDXL 1.0 mit 1 Monat Vertragsbindung.

Anfallende Gesamtkosten = 1 * 49,86 USD * 24 Stunden * 31 Tage = 37 095,84 USD

Meta-Modelle	Preis pro 1 000 Eingabe-Token	Preis pro 1 000 Ausgabe-Token
Llama 2 Chat (13B)	0,00075 USD	0,001 USD
Llama 2 Chat (70B)	0,00195 USD	0,00256 USD

Meta-Modelle	Preis pro Stunde pro Modelleinheit bei einer Laufzeit von einem Monat	Preis pro Stunde pro Modelleinheit bei einer Laufzeit von 6 Monaten
Llama 2 Vortrainiert und Chat (13B)	21,18 USD	13,08 USD
Lama 2 Vortrainiert (70B)	21,18 USD	13,08 USD

Wählen Sie Ihre Cookie-Einstellungen aus

Amazon Bedrock – Preise

Preisübersicht

Preismodelle

On-Demand und Batch

Latenzoptimiert (öffentliche Vorschau)

Bereitgestellter Durchsatz

Benutzerdefinierter Modellimport

Marktplatzmodelle

Anpassung und Optimierung

Anpassung des Modells

Modell-Destillation

Prompt-Caching

Tools

Integritätsschutz

Wissensdatenbanken und Datenautomatisierung

Agents

Flüsse

Auswertungen

Preisdetails des Modells

AI21 Labs

Amazon Nova

Preisgestaltung für Understanding Models

Preise für Modelle zur kreativen Inhaltserstellung

Preisgestaltung für Sprachverständnis- und Sprachgenerierungsmodelle

On-Demand-Preise für Speech-to-Speech-Foundation-Modelle

Amazon Titan

Anthropic

Cohere

DeepSeek

On-Demand-Preise

Meta

Mistral AI

Stability AI

Benutzerdefinierter Modellimport

Preisdetails zu Tools und Optimierungen

Amazon Bedrock Flows

Amazon-Bedrock-Integritätsschutz

Modellbewertung

Datenautomatisierung

Preisbeispiele

AI21 Labs

Amazon

On-Demand-Preise

Preise für die Anpassung (Feinabstimmung und kontinuierliche Vorschulung)

Preise für bereitgestellten Durchsatz

Amazon-Bedrock-Integritätsschutz

Amazon-Bedrock-Wissensdatenbanken

Anthropic

On-Demand-Preise

Preise für bereitgestellten Durchsatz

Cohere

On-Demand-Preise

Preise für die Anpassung (Feinabstimmung)

Benutzerdefinierter Modellimport

Datenautomatisierung

DeepSeek

Flows

Meta

On-Demand-Preise

Preise für die Anpassung (Feinabstimmung)

Preise für bereitgestellten Durchsatz

Mistral AI

On-Demand-Preise

Modellbewertung

Beispiel 1 zur Modellbewertung:

Beispiel 2 zur Modellevaluierung:

Stability AI

On-Demand-Preise

Preise für bereitgestellten Durchsatz

Ende des Supports für Internet Explorer