Harga Amazon Bedrock
Ikhtisar harga
Amazon Bedrock adalah layanan terkelola penuh yang menawarkan pilihan model fondasi (FM) dengan performa tinggi melalui satu API, bersama dengan serangkaian kemampuan luas yang Anda butuhkan untuk membangun aplikasi AI generatif dengan keamanan, privasi, dan AI yang bertanggung jawab.
Dengan Amazon Bedrock, Anda akan dikenai biaya untuk inferensi dan kustomisasi model. Anda memiliki pilihan dua paket harga untuk inferensi: 1. Sesuai Permintaan dan Batch: Mode ini memungkinkan Anda menggunakan FM berdasarkan bayar sesuai pemakaian tanpa harus membuat komitmen jangka waktu berbasis waktu. 2. Throughput yang Disediakan: Mode ini memungkinkan Anda menyediakan throughput yang cukup untuk memenuhi persyaratan performa aplikasi Anda sebagai ganti komitmen jangka waktu berbasis waktu.
Model Harga
Alat Tingkat Lanjut
Detail Harga
Harga tergantung pada modalitas, penyedia, dan model. Pilih penyedia model untuk melihat harga terperinci.
Amazon Bedrock menawarkan model fondasi (FM) terpilih dari penyedia AI terkemuka, seperti Anthropic, Meta, Mistral AI, dan Amazon untuk inferensi batch dengan harga 50% lebih rendah dibandingkan dengan harga inferensi sesuai permintaan. Lihat daftar model di sini.
-
AI21 Labs
-
Amazon
-
Anthropic
-
Cohere
-
Meta Llama
-
Mistral AI
-
Stability AI
-
Impor Model Kustom
-
AI21 Labs
-
AI21 Labs
Harga Sesuai Permintaan
Model AI21 Labs Harga per 1.000 token input Harga per 1.000 token output Jamba 1.5 Large 0,002 USD 0,008 USD Jamba 1.5 Mini 0,0002 USD 0,0004 USD Jurassic-2 Mid 0,0125 USD 0,0125 USD Jurassic-2 Ultra 0,0188 USD 0,0188 USD Jamba-Instruct 0,0005 USD 0,0007 USD -
Amazon
-
Amazon
-
Anthropic
-
Anthropic
Harga Sesuai Permintaan dan Batch
Wilayah: AS Timur (Virginia Utara) dan AS Barat (Oregon)
Model Anthropic Harga per 1.000 token input Harga per 1.000 token output Harga per 1,000 token input (batch) Harga per 1.000 token output (batch) Claude 3.5 Sonnet**
0,003 USD
0,015 USD
0,0015 USD
0,0075 USD
Claude 3 Opus*
0,015 USD
0,075 USD
0,0075 USD
0,0375 USD
Claude 3 Haiku
0,00025 USD
0,00125 USD
0,000125 USD
0,000625 USD
Claude 3 Sonnet
0,003 USD
0,015 USD
0,0015 USD
0,0075 USD
Claude 2.1
0,008 USD
0,024 USD
N/A
N/A
Claude 2.0
0,008 USD
0,024 USD
N/A
N/A
Claude Instant
0,0008 USD
0,0024 USD
N/A
N/A
*Claude 3 Opus saat ini tersedia di Wilayah AS Barat (Oregon) **Harga untuk Claude 3.5 Sonnet berlaku untuk setiap versi Claude 3.5 Sonnet (v1 dan v2) - Claude 3.5 Sonnet v2 saat ini tersedia di Wilayah AS Barat (Oregon) Wilayah: Eropa (London)
Model Anthropic Harga per 1.000 token input Harga per 1.000 token output Harga per 1,000 token input (batch) Harga per 1.000 token output (batch) Claude 3 Sonnet
0,003 USD
0,015 USD
0,0015 USD 0,0075 USD Claude 3 Haiku
0,00025 USD
0,00125 USD
0,000125 USD 0,000625 USD
Wilayah: Amerika Selatan (Sao Paulo)
Model Anthropic Harga per 1.000 token input Harga per 1.000 token output Harga per 1,000 token input (batch) Harga per 1.000 token output (batch) Claude 3 Sonnet
0,003 USD
0,015 USD
0,0015 USD
0,0075 USD
Claude 3 Haiku
0,00025 USD
0,00125 USD
0,000125 USD
0,000625 USD
Wilayah: Kanada (Pusat)
Model Anthropic Harga per 1.000 token input Harga per 1.000 token output Harga per 1,000 token input (batch) Harga per 1.000 token output (batch) Claude 3 Sonnet
0,003 USD
0,015 USD
0,0015 USD
0,0075 USD
Claude 3 Haiku
0,00025 USD
0,00125 USD
0,000125 USD
0,000625 USD
Wilayah: Asia Pasifik (Mumbai)
Model Anthropic Harga per 1.000 token input Harga per 1.000 token output Harga per 1,000 token input (batch) Harga per 1.000 token output (batch) Claude 3 Sonnet
0,003 USD
0,015 USD
0,0015 USD
0,0075 USD
Claude 3 Haiku
0,00025 USD
0,00125 USD
0,000125 USD
0,000625 USD
Wilayah: Asia Pasifik (Sydney)
Model Anthropic Harga per 1.000 token input Harga per 1.000 token output Harga per 1,000 token input (batch) Harga per 1.000 token output (batch) Claude 3 Sonnet
0,003 USD
0,015 USD
0,0015 USD
0,0075 USD
Claude 3 Haiku
0,00025 USD
0,00125 USD
0,000125 USD
0,000625 USD
Wilayah: Asia Pasifik (Tokyo)
Model Anthropic Harga per 1.000 token input Harga per 1.000 token output Harga per 1,000 token input (batch) Harga per 1.000 token output (batch) Claude Instant
0,0008 USD
0,0024 USD
N/A
N/A
Claude 2.0/2.1
0,008 USD
0,024 USD
N/A
N/A
Claude 3 Haiku
0,00025 USD
0,00125 USD
0,000125 USD
0,000625 USD
Claude 3.5 Sonnet
0,003 USD
0,015 USD
0,0015 USD
0,0075 USD
Wilayah: Asia Pasifik (Singapura)
Model Anthropic Harga per 1.000 token input Harga per 1.000 token output Harga per 1,000 token input (batch) Harga per 1.000 token output (batch) Claude Instant
0,0008 USD
0,0024 USD
0,0004 USD
0,0012 USD
Claude 2.0/2.1
0,008 USD
0,024 USD
0,004 USD
0,012 USD
Claude 3 Haiku
0,00025 USD
0,00125 USD
0,000125 USD
0,000625 USD
Claude 3.5 Sonnet
0,003 USD
0,015 USD
N/A
N/A
Wilayah: Eropa (Paris)
Model Anthropic Harga per 1.000 token input Harga per 1.000 token output Harga per 1,000 token input (batch) Harga per 1.000 token output (batch) Claude 3 Haiku
0,00025 USD
0,00125 USD
0,000125 USD
0,000625 USD
Claude 3 Sonnet
0,003 USD
0,015 USD
0,0015 USD
0,0075 USD
Wilayah: Eropa (Frankfurt)
Model Anthropic Harga per 1.000 token input Harga per 1.000 token output Harga per 1,000 token input (batch) Harga per 1.000 token output (batch) Claude Instant
0,0008 USD
0,0024 USD
N/A
N/A
Claude 2.0/2.1
0,008 USD
0,024 USD
N/A
N/A
Claude 3 Sonnet
0,003 USD
0,015 USD
0,0015 USD
0,0075 USD
Claude 3.5 Sonnet
0,003 USD
0,015 USD
0,0015 USD
0,0075 USD
Claude 3 Haiku
0,00025 USD
0,00125 USD
0,000125 USD
0,000625 USD
Wilayah: Asia Pasifik (Seoul)
Model Anthropic Harga per 1.000 token input Harga per 1.000 token output Harga per 1,000 token input (batch) Harga per 1.000 token output (batch) Claude 3.5 Sonnet
0,003 USD
0,015 USD
N/A
N/A
Claude 3 Haiku
0,00025 USD
0,00125 USD
N/A
N/A
Wilayah: AS Timur (Ohio)
Model Anthropic Harga per 1.000 token input Harga per 1.000 token output Harga per 1,000 token input (batch) Harga per 1.000 token output (batch) Claude 3.5 Sonnet
0,003 USD
0,015 USD
N/A
N/A
Claude 3 Haiku
0,00025 USD
0,00125 USD
N/A
N/A
Harga Throughput yang Disediakan
Wilayah: AS Timur (Virginia Utara) dan AS Barat (Oregon)
Model Anthropic Harga per jam per model dengan
tidak ada komitmenHarga per jam per unit model untuk komitmen 1 bulan Harga per jam per unit model untuk komitmen 6 bulan Claude Instant
44,00 USD 39,60 USD
22,00 USD
Claude 2.0/2.1
70,00 USD 63,00 USD
35,00 USD
Model Anthropic Harga per jam per model dengan
tidak ada komitmenHarga per jam per unit model untuk komitmen 1 bulan Harga per jam per unit model untuk komitmen 6 bulan Claude Instant
44,00 USD 39,60 USD
22,00 USD
Claude 2.0/2.1
70,00 USD 63,00 USD
35,00 USD
Wilayah: Asia Pasifik (Tokyo)
Model Anthropic Harga per jam per unit model untuk komitmen 1 bulan Harga per jam per unit model untuk komitmen 6 bulan Claude Instant
53,00 USD
29,00 USD
Claude 2.0/2.1
86,00 USD
48,00 USD
Wilayah: Eropa (Frankfurt)
Model Anthropic Harga per jam per unit model untuk komitmen 1 bulan Harga per jam per unit model untuk komitmen 6 bulan Claude Instant
49,00 USD
27,00 USD
Claude 2.0/2.1
79,00 USD
44,00 USD
Silakan hubungi tim akun AWS Anda untuk detail selengkapnya tentang unit model.
-
Cohere
-
Cohere
Harga Sesuai Permintaan
Model Cohere Harga per 1.000 token input Harga per 1.000 token output Command 0,0015 USD 0,0020 USD Command-Light 0,0003 USD 0,0006 USD Command R+ 0,0030 USD 0,0150 USD Command R 0,0005 USD 0,0015 USD Sematkan - Bahasa Inggris 0,0001 USD N/A Embed - Multilingual 0,0001 USD N/A Harga untuk kustomisasi (penyempurnaan)
Model Cohere Harga untuk melatih 1.000 token Harga untuk menyimpan setiap model khusus per bulan Harga untuk inferensi model khusus per unit model per jam (dengan harga Provisioned Throughput tanpa komitmen) Cohere Command
0,004 USD
1,95 USD
49,50 USD
Cohere Command-Light 0,001 USD 1,95 USD
8,56 USD *Total token yang dilatih = jumlah token dalam korpus data pelatihan x jumlah epoch
Harga Provisioned Throughput
Model Cohere Harga per jam per model
tanpa komitmenHarga per jam per unit model untuk komitmen 1 bulan Harga per jam per unit model untuk komitmen 6 bulan
Cohere Command
49,50 USD 39,60 USD
23,77 USD
Cohere Command - Light 8,56 USD 6,85 USD
4,11 USD Sematkan - Bahasa Inggris 7,12 USD 6,76 USD
6,41 USD Embed - Multibahasa 7,12 USD 6,76 USD
6,41 USD Hubungi tim akun atau penjualan AWS Anda untuk detail selengkapnya tentang unit model.
-
Meta Llama
-
Meta Llama
Llama 3.2
Harga Sesuai Permintaan dan Batch
Llama 3.1
Harga Sesuai Permintaan dan Batch
Harga Throughput yang Disediakan
Llama 3
Harga Sesuai Permintaan
Llama 2
Harga Sesuai Permintaan
Wilayah: AS Timur (Virginia Utara) dan AS Barat (Oregon)
Model Meta Harga per 1.000 token input Harga per 1.000 token output Llama 2 Chat (13B)
0,00075 USD
0,001 USD
Llama 2 Chat (70B) 0.00195 USD
0,00256 USD Harga untuk kustomisasi model (penyempurnaan)
Model Meta Harga untuk melatih 1.000 token Harga untuk menyimpan setiap model khusus* per bulan Harga untuk inferensi model khusus untuk 1 unit model per jam (dengan harga Provisioned Throughput tanpa komitmen) Llama 2 Pretrained (13B)
0,00149 USD
1,95 USD
23,50 USD
Llama 2 Pretrained (70B) 0,00799 USD
1,95 USD 23,50 USD *Penyimpanan model khusus = 1,95 USD
Harga Provisioned Throughput
Model Meta Harga per jam per unit model untuk komitmen 1 bulan Harga per jam per unit model untuk komitmen 6 bulan Llama 2 Pretrained and Chat (13B)
21,18 USD
13,08 USD
Llama 2 Pretrained (70B) 21,18 USD
13,08 USD *Model Llama 2 Pre-trained hanya tersedia dalam provisioned throughput setelah penyesuaian.
Hubungi tim akun atau penjualan AWS Anda untuk detail selengkapnya tentang unit model.
-
Mistral AI
-
Mistral AI
-
Stability AI
-
Stability AI
Harga Sesuai Permintaan
Model Stabilty AI Harga per gambar yang dihasilkan Stable Image Core 0,04 USD SD3 Large 0,08 USD Stable Image Ultra 0,14 USD Generasi sebelumnya dari model gambar yang ditawarkan oleh Stability AI dihargai per gambar, tergantung pada jumlah langkah dan resolusi gambar.
Model Stabilty AI Resolusi gambar Harga per gambar yang dihasilkan untuk kualitas standar (<=50 langkah) Harga per gambar yang dihasilkan untuk kualitas premium (>50 langkah) SDXL 1.0 Hingga 1024 x 1024 0,04 USD 0,08 USD Harga Provisioned Throughput
Model Stabilty AI Harga per jam per unit model untuk komitmen 1 bulan* Harga per jam per unit model untuk komitmen 6 bulan* SDXL 1.0
49,86 USD
46,18 USD
*Termasuk inferensi untuk model dasar dan khusus
Hubungi tim akun atau penjualan AWS Anda untuk detail selengkapnya tentang unit model.
Saat ini, kustomisasi model (penyempurnaan) tidak didukung untuk model Stability AI di Amazon Bedrock.
-
Impor Model Kustom
-
Impor Model Kustom
-
Llama
-
Llama Multimodal
-
Mistral
-
Mixtral
-
Flan
-
Llama
-
Wilayah: AS Timur (Virginia Utara) dan AS Barat (Oregon)
Versi Unit Model Kustom v1.0 Harga per Unit Model Kustom per menit* 0,0785 USD Biaya penyimpanan bulanan per Unit Model Kustom 1,95 USD Unit Model Kustom yang diperlukan untuk melakukan host model bergantung pada berbagai faktor - terutama arsitektur model, jumlah parameter model, dan panjang konteks. Jumlah pasti Unit Model Kustom yang dibutuhkan akan ditentukan saat melakukan impor. Sebagai referensi, model Llama 3.1 8B 128K membutuhkan 2 Unit Model Kustom, model Llama 3.1 70B 128k membutuhkan 8 Unit Model Kustom. *Ditagih dalam periode 5 menit -
Llama Multimodal
-
Wilayah: AS Timur (Virginia Utara) dan AS Barat (Oregon)
Versi Unit Model Kustom v1.0 Harga per Unit Model Kustom per menit* 0,0785 USD Biaya penyimpanan bulanan per Unit Model Kustom 1,95 USD Unit Model Kustom yang diperlukan untuk melakukan host model bergantung pada berbagai faktor - terutama arsitektur model, jumlah parameter model, dan panjang konteks. Jumlah pasti Unit Model Kustom yang dibutuhkan akan ditentukan saat melakukan impor. Untuk referensi, model Llama 3.2 11B 128K membutuhkan 4 Unit Model Kustom. *Ditagih dalam periode 5 menit -
Mistral
-
Wilayah: AS Timur (Virginia Utara) dan AS Barat (Oregon)
Versi Unit Model Kustom v1.0 Harga per Unit Model Kustom per menit* 0,0785 USD Biaya penyimpanan bulanan per Unit Model Kustom 1,95 USD Unit Model Kustom yang diperlukan untuk melakukan host model bergantung pada berbagai faktor - terutama arsitektur model, jumlah parameter model, dan panjang konteks. Jumlah pasti Unit Model Kustom yang dibutuhkan akan ditentukan saat melakukan impor. Untuk referensi, model Mistral 7B 32K membutuhkan 1 Unit Model Kustom. *Ditagih dalam periode 5 menit -
Mixtral
-
Wilayah: AS Timur (Virginia Utara) dan AS Barat (Oregon)
Versi Unit Model Kustom v1.0 Harga per Unit Model Kustom per menit* 0,0785 USD Biaya penyimpanan bulanan per Unit Model Kustom 1,95 USD Unit Model Kustom yang diperlukan untuk melakukan host model bergantung pada berbagai faktor - terutama arsitektur model, jumlah parameter model, dan panjang konteks. Jumlah pasti Unit Model Kustom yang dibutuhkan akan ditentukan saat melakukan impor. Untuk referensi, model Mixtral 8x7B 32K membutuhkan 4 Unit Model Kustom. *Ditagih dalam periode 5 menit -
Flan
-
Wilayah: AS Timur (Virginia Utara) dan AS Barat (Oregon)
Versi Unit Model Kustom v1.0 Harga per Unit Model Kustom per menit* 0,0785 USD Biaya penyimpanan bulanan per Unit Model Kustom 1,95 USD Unit Model Kustom yang diperlukan untuk melakukan host model bergantung pada berbagai faktor - terutama arsitektur model, jumlah parameter model, dan panjang konteks. Jumlah pasti Unit Model Kustom yang dibutuhkan akan ditentukan saat melakukan impor. Untuk referensi, model Flan-T5 XL 512 membutuhkan 1 Unit Model Kustom. *Ditagih dalam periode 5 menit
Harga Inferensi Sesuai Permintaan:
Anda ditagih dalam periode 5 menit selama salinan model Anda aktif, dimulai dari invokasi pertama yang berhasil. Batas throughput dan konkurensi maksimum per salinan model bergantung pada faktor-faktor seperti, campuran token input/output, tipe perangkat keras, ukuran model, arsitektur, optimisasi inferensi, dan ditentukan selama alur kerja impor model.Bedrock menskalakan jumlah salinan model secara otomatis tergantung pada pola penggunaan Anda. Jika tidak ada invokasi selama periode 5 menit, Bedrock akan menurunkan skala menjadi nol dan menaikkan kembali skala saat Anda menginvokasi model. Saat menaikkan kembali skala, Anda mungkin mengalami durasi pemulaian dingin (dalam puluhan detik) tergantung pada ukuran model. Bedrock juga menaikkan skala jumlah salinan model jika volume inferensi Anda secara konsisten melebihi batas konkurensi dari satu salinan model. Catatan: Jumlah maksimum default adalah 3 salinan model per akun per model yang diimpor, yang dapat ditingkatkan melalui Service Quotas.
-
Harga Alat Tingkat Lanjut (Detail)
-
Pagar Pembatas Amazon Bedrock
-
Evaluasi Model
-
Pagar Pembatas Amazon Bedrock
-
Pagar Pembatas Amazon Bedrock
Kebijakan pagar pembatas*
Harga per 1.000 unit teks**
Filter konten
0,75 USD
Topik yang ditolak
1 USD
Pemeriksaan landasan kontekstual***
0,1 USD
Filter informasi sensitif (PII)
0,1 USD
Filter informasi sensitif (ekspresi reguler)
Gratis
Filter kata
Gratis
Harga Sesuai Permintaan
* Setiap kebijakan pagar pembatas bersifat opsional dan dapat diaktifkan berdasarkan persyaratan aplikasi Anda. Biaya akan dikenakan berdasarkan jenis polis yang digunakan dalam pagar pembatas. Misalnya, jika pagar pembatas dikonfigurasi dengan filter konten dan topik yang ditolak, biaya akan dikenakan untuk kedua kebijakan ini, sementara tidak akan ada biaya yang terkait dengan filter informasi sensitif.
**Unit teks dapat berisi hingga 1000 karakter. Jika input teks lebih dari 1000 karakter, itu diproses sebagai beberapa unit teks, masing-masing berisi 1000 karakter atau kurang. Misalnya, jika input teks berisi 5600 karakter, akan dikenakan biaya untuk 6 unit teks.*** Pemeriksaan landasan kontekstual menggunakan sumber referensi dan kueri untuk menentukan apakah respons model didasarkan pada sumber dan relevan dengan kueri. Jumlah total unit teks yang dikenai biaya dihitung dengan menggabungkan semua karakter dalam sumber, kueri, dan respons model.
Pagar pembatas tidak didukung untuk gambar dan sematan.
-
Evaluasi Model
-
Evaluasi Model
Evaluasi model dikenai biaya untuk inferensi dari model pilihan Anda. Skor algoritmik yang dihasilkan secara otomatis disediakan tanpa biaya tambahan. Untuk evaluasi berbasis manusia, saat membawa tim kerja Anda sendiri, Anda dikenai biaya untuk inferensi model dalam evaluasi, dan biaya sebesar 0,21 USD per tugas manusia yang diselesaikan.
Model
Harga per 1.000 token input
Harga per 1.000 token output
Harga per tugas manusia
Model yang dipilih untuk evaluasi
Berdasarkan model yang dipilih
Berdasarkan model yang dipilih
0,21 USD
Contoh harga
-
AI21 labs
Developer aplikasi melakukan panggilan API berikut ke Amazon Bedrock: Permintaan ke model Jurassic-2 Mid AI21 untuk meringkas input sebesar 10 ribu token teks input menjadi output sebesar 2 ribu token.
Total biaya yang dikeluarkan = 10 ribu token/1000 * 0,0125 USD + 2 ribu token/1000 * 0,0125 USD = 0,15 USD
-
Amazon
Harga On-Demand
Developer aplikasi melakukan panggilan API berikut ke Amazon Bedrock setiap jam: Permintaan ke model Amazon Titan Text – Lite untuk meringkas input sebesar 2 ribu token teks input menjadi output sebesar 1 ribu token.
Total biaya per jam yang dikeluarkan adalah = 2 ribu token/1.000 * 0,0003 USD + 1 ribu token/1.000 * 0,0004 USD = 0,001 USD.
Developer aplikasi melakukan panggilan API berikut ke Amazon Bedrock: Permintaan ke model dasar Amazon Titan Image Generator untuk menghasilkan 1000 gambar berukuran 1024 x 1024 dengan kualitas standar.
Total biaya yang dikeluarkan = 1.000 gambar * 0,01 USD per gambar = 10 USD
Harga kustomisasi (penyempurnaan dan prapelatihan lanjutan)
Developer aplikasi menyesuaikan model Amazon Titan Image Generator menggunakan 1000 pasangan gambar-teks. Setelah pelatihan, developer menggunakan provisioned throughput model khusus selama 1 jam untuk mengevaluasi performa model. Model yang disempurnakan disimpan selama 1 bulan. Setelah evaluasi, developer menggunakan provisioned throughput (masa komitmen 1 bulan) untuk meng-hosting model yang disesuaikan.
Biaya bulanan yang dikeluarkan untuk Penyempurnaan adalah: Pelatihan penyempurnaan (0,005 USD * 500 * 64). Pada kalkulasi tersebut, 0,005 USD adalah harga per gambar yang dilihat, 500 adalah jumlah langkah, dan 64 adalah ukuran batch + penyimpanan model khusus per bulan (1,95 USD) + 1 jam inferensi model khusus (21 USD) = 160 USD + 1,95 USD + 21 = 182,95 USD
Harga Provisioned Throughput
Developer aplikasi membeli dua unit model Amazon Titan Text Express dengan komitmen 1 bulan untuk kasus penggunaan peringkasan teks mereka.
Total biaya bulanan yang dikeluarkan = 2 unit model * 18,40 USD/jam * 24 jam * 31 hari = 27.379,20 USD
Developer aplikasi membeli satu unit model dari model dasar Amazon Titan Image Generator dengan komitmen 1 bulan.
Total biaya yang dikeluarkan = 1 unit model * 16,20 USD * 24 jam * 31 hari = 12.052,80 USD
-
Anthropic
Harga On-Demand
Developer aplikasi melakukan panggilan API berikut ke Amazon Bedrock di Wilayah AS Barat (Oregon): Permintaan ke model Claude Anthropic untuk meringkas input sebesar 11 ribu token teks input menjadi output sebesar 4 ribu token.
Total biaya yang dikeluarkan = 11 ribu token/1000 * 0,008 USD + 4 ribu token/1000 * 0,024 USD = 0,088 USD + 0,096 USD = 0,184 USD
Harga Provisioned Throughput
Developer aplikasi membeli satu unit model Anthropic Claude Instant di Wilayah AS Barat (Oregon):
Total biaya bulanan yang dikeluarkan adalah 1 unit model * 39,60 USD * 24 jam * 31 hari = 29.462,40 USD
-
Cohere
Harga On-Demand
Developer aplikasi melakukan panggilan API berikut ke Amazon Bedrock: permintaan ke model Command Cohere untuk meringkas input sebesar 6 ribu token teks input menjadi output sebesar 2 ribu token.
Total biaya yang dikeluarkan = 6 ribu token/1.000 * 0,0015 USD + 2 ribu token/1.000 * 0,0020 USD = 0,013 USD
Developer aplikasi melakukan panggilan API berikut ke Amazon Bedrock: Permintaan ke model Command-Light Cohere untuk meringkas input sebesar 6 ribu token teks input menjadi output sebesar 2 ribu token.
Total biaya yang dikeluarkan = 6 ribu token/1000 * 0,0003 USD + 2 ribu token/1000 * 0,0006 USD = 0,003 USD
Developer aplikasi melakukan panggilan API berikut ke Amazon Bedrock: Permintaan ke model Embed English atau Embed Multilingual Cohere untuk menghasilkan penyematan untuk 10 ribu token input.
Total biaya yang dikeluarkan = 10 ribu token/1000 * 0,0001 USD = 0,001 USD
Harga kustomisasi (penyempurnaan)
Developer aplikasi menyesuaikan model Cohere Command menggunakan 1.000 token data. Setelah pelatihan, menggunakan provisioned throughput model khusus selama 1 jam untuk mengevaluasi performa model. Model yang disempurnakan disimpan selama 1 bulan. Setelah evaluasi, developer menggunakan provisioned throughput (komitmen 1 bulan) untuk meng-hosting model yang disesuaikan.
Biaya bulanan yang dikeluarkan untuk penyempurnaan adalah: Pelatihan penyempurnaan (0,004 USD * 1000) + penyimpanan model khusus per bulan (1,95 USD) + 1 jam inferensi model khusus (49,50 USD) = 55,45 USD
Biaya bulanan yang dikeluarkan untuk provisioned throughput (komitmen 1 bulan) dari model khusus = 39,60 USD
Harga Provisioned Throughput
Developer aplikasi membeli satu unit model Cohere Command dengan komitmen 1 bulan untuk kasus penggunaan peringkasan teks mereka.
Total biaya bulanan yang dikeluarkan adalah 1 unit model * 39,60 USD * 24 jam * 31 hari = 29.462,40 USD
-
Meta Llama
Harga On-Demand
Developer aplikasi melakukan panggilan API berikut ke Amazon Bedrock: permintaan ke model Llama 2 Chat (13B) Meta untuk meringkas input sebesar 2 ribu token teks input menjadi output sebesar 500 token.
Total biaya yang dikeluarkan = 2 ribu token/1000 * 0,00075 USD + 500 token/1000 * 0,001 USD = 0,002 USD
Harga kustomisasi (penyempurnaan)
Developer aplikasi menyesuaikan model Llama 2 Pretrained (70B) menggunakan 1000 token data. Setelah pelatihan, menggunakan provisioned throughput model khusus selama 1 jam untuk mengevaluasi performa model. Model yang disempurnakan disimpan selama 1 bulan. Setelah evaluasi, developer menggunakan provisioned throughput (komitmen 1 bulan) untuk meng-hosting model yang disesuaikan.
Biaya bulanan yang dikeluarkan untuk penyempurnaan adalah: Pelatihan penyempurnaan (0,00799 USD * 1000) + penyimpanan model khusus per bulan (1,95 USD) + 1 jam inferensi model khusus (23,50 USD) = 33,44 USD
Biaya bulanan yang dikeluarkan untuk provisioned throughput (komitmen 1 bulan) dari model khusus = 21,18 USD
Harga Provisioned Throughput
Developer aplikasi membeli satu unit model Meta Llama 2 dengan komitmen 1 bulan untuk kasus penggunaan peringkasan teks mereka.
Total biaya bulanan yang dikeluarkan adalah 1 unit model * 21,18 USD * 24 jam * 31 hari = 15.757,92 USD
-
Mistral AI
Harga On-Demand
Developer aplikasi melakukan panggilan API berikut ke Amazon Bedrock pada setiap jam: Permintaan ke model Mistral 7B untuk meringkas input sebesar 2 ribu token teks input menjadi output sebesar 1 ribu token.
Total biaya per jam yang dikeluarkan = 2 ribu token/1000 * 0,00015 USD + 1 ribu token/1000 * 0,0002 USD = 0,0005 USD
Developer aplikasi melakukan panggilan API berikut ke Amazon Bedrock pada setiap jam: permintaan ke model Mixtral 8x7B untuk meringkas input sebesar 2 ribu token teks input menjadi output sebesar 1 ribu token.
Total biaya per jam yang dikeluarkan = 2 ribu token/1000 * 0,00045 USD + seribu token/1000 * 0,0007 USD = 0,0016 USD
Developer aplikasi melakukan panggilan API berikut ke Amazon Bedrock pada setiap jam: permintaan ke model Mistral Large untuk meringkas input sebesar 2 ribu token teks input menjadi output sebesar 1 ribu token.
Total biaya per jam yang dikeluarkan = 2 ribu token/1000 * 0,008 USD + seribu token/1000 * 0,024 USD = 0,04 USD
-
Stability AI
Harga On-Demand
Developer aplikasi melakukan panggilan API berikut ke Amazon Bedrock: permintaan ke model SDXL untuk menghasilkan gambar 512 x 512 dengan ukuran langkah sebesar 70 (kualitas premium).
Total biaya yang dikeluarkan = 1 gambar * 0,036 USD per gambar = 0,036 USD
Developer aplikasi melakukan panggilan API berikut ke Amazon Bedrock: Permintaan ke model SDXL 1.0 untuk menghasilkan gambar berukuran 1024 x 1024 dengan ukuran langkah sebesar 70 (kualitas premium).
Total biaya yang dikeluarkan = 1 gambar * 0,08 USD per gambar = 0,08 USD
Harga Provisioned Throughput
Developer aplikasi membeli satu unit model SDXL1.0 dengan komitmen 1 bulan.
Total biaya yang dikeluarkan = 1 * 49,86 USD * 24 jam * 31 hari = 37.095,84 USD
-
Evaluasi model
Contoh evaluasi model 1:
Harga on-demand
Developer aplikasi mengirimkan set data untuk evaluasi model berbasis manusia menggunakan Anthropic Claude 2.1 dan Anthropic Claude Instant di Wilayah AWS AS Timur (Virginia Utara).Set data berisi 50 perintah, dan developer memerlukan satu pekerja untuk menilai setiap rangkaian respons perintah (dapat dikonfigurasi dalam pembuatan tugas evaluasi sebagai parameter “pekerja per perintah”).
Akan ada 50 tugas dalam pekerjaan evaluasi ini (satu tugas untuk setiap set respons cepat per setiap pekerja). Sebanyak 50 perintah digabungkan menjadi 5000 token input, dan respons terkait digabungkan menjadi 15,000 token untuk Anthropic Claude Instant dan 20,000 token untuk Anthropic Claude 2.1.
Biaya berikut dikeluarkan untuk tugas evaluasi model ini:Item Jumlah token input Harga per 1.000 token input Biaya input Jumlah token output Harga per 1.000 token output Biaya output Jumlah tugas manusia Biaya per tugas manusia Biaya tugas manusia Total Claude Instant Inference 5.000 0,0008 USD 0,004 USD 15.000 0,0024 USD 0,036 USD 0,04 USD Claude 2.1 Inference 5.000 0,008 USD 0,04 USD 20.000 0,024 USD 0,48 USD 0,52 USD Tugas Manusia 50 0,21 USD 10,50 USD 10,50 USD Total 11,06 USD Contoh evaluasi model 2:
Harga on-demand
Developer aplikasi mengirimkan set data untuk evaluasi model berbasis manusia menggunakan Anthropic Claude 2.1 dan Anthropic Claude Instant di Wilayah AWS AS Timur (Virginia Utara).
Set data berisi 50 perintah, dan developer memerlukan dua pekerja untuk menilai setiap rangkaian respons perintah (dapat dikonfigurasi dalam pembuatan tugas evaluasi sebagai parameter “pekerja per perintah”). Akan ada 100 tugas dalam tugas evaluasi ini (1 tugas untuk setiap set respons-perintah per setiap pekerja: 2 pekerja x 50 rangkaian respons-perintah = 100 tugas manusia).
Sebanyak 50 perintah digabungkan menjadi 5.000 token input, dan respons terkait digabungkan menjadi 15.000 token untuk Anthropic Claude Instant dan 20.000 token untuk Anthropic Claude 2.1.
Biaya berikut dikeluarkan untuk tugas evaluasi model ini:
Item Jumlah token input Harga per 1.000 token input Biaya input Jumlah token output Harga per 1.000 token output Biaya output Jumlah tugas manusia Biaya per tugas manusia Biaya tugas manusia Total Claude Instant Inference 5.000 0,0008 USD 0,0040 USD 15.000 0,0024 USD 0,036 USD 0,04 USD Claude 2.1 Inference 5.000 0,008 USD 0,0400 USD 20.000 0,024 USD 0,48 USD 0,52 USD Tugas Manusia 100 0,21 USD 21,00 USD 21,00 USD Total 21,56 USD -
Pagar Pembatas Amazon Bedrock
Contoh 1: Chatbot dukungan pelanggan
Pengembang aplikasi membuat chatbot dukungan pelanggan dan menggunakan filter konten untuk memblokir konten berbahaya dan topik yang ditolak untuk menyaring pertanyaan dan tanggapan yang tidak diinginkan.
Chatbot melayani 1000 permintaan pengguna per jam. Setiap permintaan pengguna memiliki panjang input rata-rata 200 karakter dan menerima respons FM 1500 karakter.
Setiap permintaan pengguna 200 karakter sesuai dengan 1 unit teks.
Setiap respons FM 1.500 karakter sesuai dengan 2 unit teks.
Unit teks diproses setiap jam = (1 + 2) * 1000 kueri = 3000 unit teks
Total biaya yang dikeluarkan per jam untuk filter konten dan topik yang ditolak = 3000 * (0,75 USD + 1,00 USD)/1000 = 5,25 USDContoh 2: Ringkasan transkrip pusat panggilan
Pengembang aplikasi membuat aplikasi untuk meringkas transkrip obrolan antara pengguna dan agen dukungan. Ini menggunakan filter informasi sensitif untuk menyunting informasi pengenal pribadi (PII) dalam ringkasan yang dihasilkan untuk 10.000 percakapan.
Setiap ringkasan yang dihasilkan memiliki rata-rata 3.500 karakter yang sesuai dengan 4 unit teks.
Total biaya yang dikeluarkan untuk meringkas 10.000 percakapan = 10000 * 4 * (0,1 USD/1000) = 4 USDItem Jumlah token input Harga per 1.000 token input Biaya input Jumlah token output Harga per 1.000 token output Biaya output Jumlah tugas manusia Biaya per tugas manusia Biaya tugas manusia Total Claude Instant Inference 5.000 0,0008 USD 0,004 USD 15.000 0,0024 USD 0,036 USD 0,04 USD Claude 2.1 Inference 5.000 0,008 USD 0,04 USD 20.000 0,024 USD 0,48 USD 0,52 USD Tugas Manusia 100 0,21 USD 21,00 USD 21,00 USD Total 21,56 USD -
Impor Model Kustom
Contoh Harga: Developer aplikasi mengimpor model tipe Llama 3.1 yang disesuaikan dengan ukuran parameter 8B dengan panjang urutan 128K di wilayah us-east-1 dan menghapus model setelah 1 bulan. Hal ini membutuhkan 2 Unit Model Kustom. Jadi, harga per menit akan menjadi 0,1570 USD karena diperlukan 2 Unit Model Kustom. Biaya penyimpanan model untuk 2 Unit Model Kustom adalah 3,90 USD untuk bulan tersebut.
Tidak ada biaya untuk mengimpor model. Invokasi pertama yang berhasil adalah pukul 8.03, saat pengukuran dimulai. Periode pengukuran 5 menit dimulai pukul 8.03 – 8.07; 8.07 –8.11, dan seterusnya. Jika ada setidaknya satu invokasi selama periode 5 menit, periode tersebut akan dianggap aktif untuk penagihan. Jika tidak ada invokasi dari pukul 8.07 – 8.11, pengukuran akan berhenti pada pukul 8.11. Dalam hal ini, tagihan akan dihitung sebagai berikut: 0,1570 USD * 5 menit * 3 periode lima menit = 2,355 USD.