Цена на Amazon Bedrock

Обзор цен

Amazon Bedrock – это полностью управляемый сервис, который предоставляет большой набор высокопроизводительных базовых моделей (FM) через единый API и широкий набор полезных возможностей для создания приложений на основе генеративного искусственного интеллекта, поддерживая безопасность, конфиденциальность и ответственный подход к ИИ.

За вывод и настройку модели с использованием Amazon Bedrock с вас будет взиматься плата. Вы можете выбрать один из двух тарифных планов за вывод модели: 1. По запросу и в пакетном режиме. Вы платите только по мере использования модели и не берете на себя каких-либо обязательств по сроку использования. 2. За выделенную пропускную способность. В этом режиме обеспечивается достаточная пропускная способность для удовлетворения требований приложения к производительности в обмен на обязательства по сроку использования.

Модели формирования цен

По требованию и в пакетном режиме

В режиме «По требованию» вы платите только за то, чем реально пользуетесь, без подписки на определенный срок. Для моделей генерации текста плата взимается за каждый обработанный входной токен и каждый сгенерированный выходной токен. Для моделей встраивания плата взимается за каждый обработанный входной токен. Каждый токен состоит из нескольких символов и определяет базовую единицу текста, которую изучает модель для понимания входных данных и подсказок пользователя. Для моделей генерации изображений плата взимается за каждое созданное изображение.

Межрегиональный вывод: режим предоставления ресурсов по требованию также поддерживает межрегиональный вывод для некоторых моделей. Таким образом, разработчики могут беспрепятственно управлять увеличением трафика, используя вычислительные ресурсы в разных Регионах AWS, а также получать более высокие лимиты пропускной способности и повышенную устойчивость. Дополнительная плата за применение межрегионального вывода не взимается, а цена рассчитывается с учетом региона, в котором вы сделали запрос (в исходном регионе).

В пакетном режиме вы можете предоставлять набор запросов в одном входном файле и получать ответы в одном выходном файле, что позволяет получать прогнозы в больших масштабах. Ответы обрабатываются и хранятся в корзине Amazon S3, и вы можете обращаться к ним в любое время после обработки. Amazon Bedrock представляет избранные базовые модели (FM) от ведущих поставщиков решений на базе искусственного интеллекта, таких как Anthropic, Meta, Mistral AI и Amazon, для пакетного анализа по цене на 50 % ниже по сравнению с ценами на выводы по запросу. См. список моделей здесь.

Оптимизация задержки (общедоступная ознакомительная версия)

Оптимизированный по задержкам вывод для базовых моделей в Amazon Bedrock обеспечивает более быстрое время отклика моделей и помогает повысить скорость реагирования приложений на базе генеративного искусственного интеллекта. Оптимизированный по задержкам вывод можно использовать для модели Anthropic Claude 3.5 Haiku и моделей Meta Llama 3.1 405B и 70B. По данным Anthropic, благодаря использованию в Amazon Bedrock оптимизированных по задержкам выводов Claude 3.5 Haiku работает на AWS быстрее, чем где-либо еще. Кроме того, благодаря оптимизированному по задержкам выводу в Bedrock, Llama 3.1 405B и 70B работает на AWS быстрее, чем любой другой крупный поставщик облачных услуг. Подробнее см. здесь.

Provisioned Throughput

В режиме «За выделенную пропускную способность» вы можете приобрести элементы модели для определенной базовой или пользовательской модели. Режим «За выделенную пропускную способность» в первую очередь предназначен для больших рабочих нагрузок постоянного вывода, которым требуется гарантированная пропускная способность. Доступ к пользовательским моделям возможен только в режиме «За выделенную пропускную способность». Элемент модели предоставляет определенную пропускную способность, которая измеряется максимальным количеством входных и выходных токенов, обрабатываемых в минуту. При использовании режима «За выделенную пропускную способность» оплата начисляется за каждый час использования, и вы можете выбрать срок действия подписки: на 1 или 6 месяцев.

Импорт пользовательских моделей

Custom Model Import позволяет использовать предыдущие инвестиции в настройку моделей в Amazon Bedrock и применять их таким же полностью управляемым образом, как и существующие модели хостинговых платформ Bedrock. Можно импортировать пользовательские весы для поддерживаемых архитектур моделей и обслуживать соответствующую модель в режиме по требованию. Плата за импорт собственной модели в Bedrock не взимается. После импорта модели вы сможете получить к ней доступ по запросу без необходимости выполнять какие-либо действия на плоскости управления. Плата взимается только за вывод модели в зависимости от количества копий пользовательской модели, необходимого для обработки объема логических выводов, а также продолжительности активности каждой копии модели (оплата производится за 5 минут). Копия модели – это единственный инстанс импортированной модели, готовый к обслуживанию запросов для вывода. Цена за минуту копии модели зависит от таких факторов, как архитектура, длина контекста, Регион AWS, версия вычислительного блока (поколение оборудования) и размер копии модели.

Модели Marketplace

В Amazon Bedrock Marketplace можно найти, протестировать и использовать более 100 популярных, новых и специализированных базовых моделей в Bedrock. Модели Amazon Bedrock Marketplace развертываются на адресах, где можно выбрать желаемое количество и типы инстансов, а также настроить политики автомасштабирования в соответствии с требованиями рабочей нагрузки. В случае с частными моделями взимается плата за программное обеспечение, установленная поставщиком модели (за час, с шагом в секунду или за запрос), а также стоимость инфраструктуры в зависимости от выбранного инстанса. Эти цены можно посмотреть до оформления подписки на модель поставщика. Они также указаны в списке моделей на AWS Marketplace. Для общедоступных моделей взимается только стоимость инфраструктуры в зависимости от выбранного инстанса. Подробности см. здесь.

Настройка и оптимизация

Настройка модели

При работе с Amazon Bedrock вы можете настроить для базовых моделей собственные данные, чтобы предоставлять персонализированные ответы с учетом конкретных задач и бизнес-контекста. Вы можете доработать модели, используя данные с метками или непрерывное предварительное обучение с данными без меток. При настройке модели генерации текста взимается плата за обучение модели на основе общего количества обработанных моделью токенов (количество токенов в корпусе обучающих данных, умноженное на количество эпох), а также за ежемесячное хранение модели. Эпохой называется полный цикл обработки набора данных для обучения на этапах настройки или непрерывного предварительного обучения. Вывод по моделям оплачивается в соответствии с планом «За выделенную пропускную способность», который является обязательным для их использования. Один элемент модели для вывода по пользовательской модели предоставляется без подписки. Плата будет взиматься за количество часов, в течение которых вы используете первый элемент модели для вывода по пользовательской модели. Если вы хотите получить пропускную способность выше одного элемента модели, необходимо оформить подписку на 1 или 6 месяцев.

Дистилляция моделей

Благодаря Дистилляции моделей Amazon Bedrock, вы платите за то, что используете. За генерацию синтетических данных взимается плата по запросу для выбранной модели-учителя. За доработку модели-ученика взимается плата по тарифам для настройки модели. Поскольку дистиллированная модель является настраиваемой моделью, вывод по моделям оплачивается в соответствии с планом «За выделенную пропускную способность», который является обязательным для их использования.

Кэширование текстовых запросов

Благодаря кэшированию текстовых запросов в Amazon Bedrock можно кэшировать повторяющийся контекст в рамках вызовов API, чтобы сократить расходы и задержки ответа. Текстовые запросы часто содержат общий контекст или префиксы, такие как длительные диалоги из нескольких реплик, многочисленные примеры и подробные инструкции, уточняющие поведение модели. Используя существующие API Amazon Bedrock, можно указать префиксы текстовых запросов, которые необходимо кэшировать в течение пяти минут в кэше конкретного аккаунта AWS. В течение этого времени любые запросы с совпадающими префиксами получают скидку до 90 % на кэшированные токены и снижение задержки до 85 %. Цены и улучшения производительности зависят от модели и длины текстового запроса, но кэши всегда изолированы от аккаунта AWS.

Инструменты

Ограничения

Ограничения Amazon Bedrock дают возможность внедрять настраиваемые средства защиты и политики ответственного использования ИИ для приложений генеративного искусственного интеллекта. Они позволяют усилить безопасность в дополнение к нативным средствам защиты базовых моделей. Это единственная функция ответственного использования ИИ, предлагаемая крупным поставщиком облачных услуг, которая позволяет клиентам создавать и настраивать механизмы для защиты безопасности, конфиденциальности и достоверности своих приложений на основе генеративного искусственного интеллекта в рамках единого решения. Этот сервис поддерживает все базовые модели из Amazon Bedrock, а также любые модели с дополнительной настройкой. Ограничения Bedrock также можно интегрировать с агентами Amazon Bedrock и базами знаний Amazon Bedrock, чтобы создавать приложения на основе генеративного искусственного интеллекта с соблюдением политик ответственного использования ИИ. Кроме того, этот сервис предлагает API ApplyGuardrail для оценки вводимых пользователем данных и моделирования ответов, генерируемых любой специализированной или сторонней базовой моделью, не входящей в состав Bedrock.

Базы знаний и автоматизация обработки данных

Базы знаний Amazon Bedrock – это полностью управляемый рабочий процесс генерации, дополненной извлеченными данными (RAG), с помощью которого клиенты могут создавать высокоточные и безопасные настраиваемые приложения генеративного искусственного интеллекта с низкой задержкой и с использованием контекстной информации из собственных источников данных. Этот инструмент поддерживает различные источники данных, включая S3, Confluence, Salesforce и SharePoint, в ознакомительной версии. Он также предлагает получение документов для потоковой передачи данных. Базы знаний Bedrock преобразуют неструктурированные данные во встраивания, сохраняют их в векторных базах данных и позволяют извлекать данные из различных хранилищ данных. Они также интегрируются с Kendra для управляемого извлечения данных и поддерживают извлечение структурированных данных с использованием естественного языка в SQL.

Автоматизация обработки данных Amazon Bedrock преобразует неструктурированный мультимодальный контент в структурированные форматы данных для таких случаев использования, как интеллектуальная обработка документов, анализ видео и RAG. Автоматизация обработки данных Bedrock может генерировать стандартный выходной контент, используя предварительно заданные значения по умолчанию, зависящие от модальности, такие как поэтапное описание видео, расшифровки аудиозаписей или автоматический анализ документов. Кроме того, заказчики могут создавать собственные выходные данные, указав свои требования к выходным данным в схемах на основе собственной схемы данных, которую затем можно легко загрузить в существующую базу или хранилище данных. Благодаря интеграции с базами знаний автоматизацию обработки данных Bedrock также можно использовать для анализа контента приложений RAG, повышая точность и релевантность результатов за счет включения информации, встроенной в изображения и текст.

Агенты

Агенты Amazon Bedrock предоставляют возможность создавать и настраивать автономные агенты в приложении. Эти агенты безопасно подключаются к корпоративным источникам данных и дополняют запросы пользователя нужной информацией для создания точного ответа. Всего за несколько простых шагов можно создать приложение, предусматривающее один или несколько агентов. Это значительно ускоряет разработку приложений на базе генеративного искусственного интеллекта. Эти агенты поддерживают интерпретацию кода для динамической генерации и выполнения кода, а также возврата управления, что позволяет определить схему действий и возвращать контроль при каждом вызове действия агентом. Кроме того, агенты Amazon Bedrock могут сохранять память между последовательными взаимодействиями, обеспечивая более персонализированный и удобный пользовательский интерфейс.

Потоки

Потоки в Amazon Bedrock – это функция Bedrock для создания и выполнения рабочих процессов для приложений генеративного искусственного интеллекта. Она ускоряет создание, тестирование и развертывание определяемых пользователем потоков генеративного искусственного интеллекта с помощью интуитивно понятного визуального конструктора и набора API. Эта функция позволяет легко связывать новейшие базовые модели, текстовые запросы, агенты, базу знаний, ограничения и сервисы AWS (такие как Amazon Lex, AWS Lambda, Amazon S3) с бизнес-логикой для создания рабочих процессов генеративного искусственного интеллекта. Можно легко тестировать и версировать рабочие процессы, а также запускать их в безопасной бессерверной среде с помощью визуального интерфейса или API без необходимости создавать собственную инфраструктуру.

Оценки

Оценка модели. При оценке модели в Amazon Bedrock вы платите только за то, чем пользуетесь, без обязательств по объему текстовых запросов или ответов. При автоматической (программной) оценке вы платите только за вывод по выбранной модели. Автоматически сгенерированные алгоритмические оценки предоставляются без дополнительной оплаты. В период действия общедоступной предварительной версии по автоматической оценке (модель/LLM-as-a-Judge) вы платите только за вывод по выбранной генерирующей и оценивающей модели. В задании по оценке модели по методу LLM-as-a-Judge встроенные метрики используют системные оценочные шаблоны текстовых запросов, уникальные для каждой метрики, а также имеющуюся оценочную модель, плата за которую будет взиматься в рамках платежей за используемые вами токены. Для обеспечения прозрачности оценочные текстовые запросы включены в общедоступную документацию по AWS. В случае оценки с участием человека (собственной рабочей команды) с вас взимается плата за вывод модели и плата в размере 0,21 USD за каждую выполненную человеком задачу. Задачей для человека считается каждое событие, в котором сотрудник оценивает один запрос и связанные с ним ответы системы вывода, используя пользовательский интерфейс оценки с участием человека. Цена будет одинаковой независимо от того, используете ли вы в задаче одну или две модели. Также она не зависит от количества выбранных параметров и методов оценки. Плата за выполнение задач для человека будет указана в разделе Amazon SageMaker вашего счета AWS и одинакова для всех регионов AWS. Отдельная плата за работу сотрудников не взимается, так как персонал вы предоставляете самостоятельно. Цены на оценку под управлением AWS назначаются в частном порядке в соответствии с вашими потребностями по оценке, с привлечением группы экспертов AWS по оценке.

Оценка по базам знаний Amazon Bedrock (оценка RAG). При оценке по базам знаний Amazon Bedrock (оценке RAG) вы платите за то, чем пользуетесь, без обязательств по минимальному количеству текстовых запросов или ответов. В период действия общедоступной предварительной версии вы платите только за вывод по выбранной генерирующей и оценивающей модели (в задании по оценке используется метод LLM-as-a-judge), а также оплачиваете расходы, связанные с использованием базы знаний в рамках задания по оценке в соответствии с ценами на базы данных Amazon Bedrock. В задании по оценке по базам знаний (оценке RAG) встроенные метрики используют системные оценочные шаблоны текстовых запросов, уникальные для каждой метрики, а также имеющуюся оценочную модель, плата за которую будет взиматься в рамках платежей за используемые вами токены. Для обеспечения прозрачности оценочные текстовые запросы включены в общедоступную документацию по AWS. Некоторые метрики предусматривают вывод по модели оценки на основе контекста, полученного из вашей базы знаний либо исходных ответов в дополнение к текстовому запросу. Это отражается на расходах, связанных с каждой метрикой. Дополнительная информация о каждой метрике приведена в общедоступной документации AWS по оценке.

Сведения о ценах

Цены зависят от формы предоставления, поставщика и модели. Выберите поставщика модели, чтобы увидеть подробные цены.

Amazon Bedrock представляет избранные базовые модели (FM) от ведущих поставщиков решений на базе искусственного интеллекта, таких как Anthropic, Meta, Mistral AI и Amazon, для пакетного анализа по цене на 50 % ниже по сравнению с ценами на выводы по запросу. См. список моделей здесь.

AI21 Labs

AI21 Labs

Цены по требованию

Модели AI21 Labs	Цена за 1000 входящих токенов	Цена за 1000 исходящих токенов
Jamba 1.5 Large	0,002 USD	0,008 USD
Jamba 1.5 Mini	0,0002 USD	0,0004 USD
Jurassic-2 Mid	0,0125 USD	0,0125 USD
Jurassic-2 Ultra	0,0188 USD	0,0188 USD
Jamba-Instruct	0,0005 USD	0,0007 USD

Amazon
- Amazon Nova
- Amazon Titan
- Другие модели Amazon
- Amazon Nova
- Amazon Nova
  
  Цены на модели понимания
  
  Цены на модели генерации креативного контента
- Amazon Titan
- Amazon Titan
- Другие модели Amazon
Anthropic

Anthropic

Цены по требованию и для пакетного режима

Регион: Восток США (Северная Вирджиния) и Запад США (Орегон)

Модели Anthropic	Цена за 1000 входящих токенов	Цена за 1000 исходящих токенов	Цена за 1000 входящих токенов (пакет)	Цена за 1000 исходящих токенов (пакет)	Цена за 1000 входящих токенов (запись кэша)	Цена за 1000 входящих токенов (чтение кэша)
Claude 3.5 Sonnet**	0,003 USD	0,015 USD	0,0015 USD	0,0075 USD	0,00375 USD	0,0003 USD
Claude 3.5 Haiku	0,0008 USD	0,004 USD	0,0005 USD	0,0025 USD	0,001 USD	0,00008 USD
Claude 3 Opus*	0,015 USD	0,075 USD	0,0075 USD	0,0375 USD	н/п	н/п
Claude 3 Haiku	0,00025 USD	0,00125 USD	0,000125 USD	0,000625 USD	н/п	н/п
Claude 3 Sonnet	0,003 USD	0,015 USD	0,0015 USD	0,0075 USD	н/п	н/п
Claude 2.1	0,008 USD	0,024 USD	н/п	Н/П	Н/П	н/п
Claude 2.0	0,008 USD	0,024 USD	н/п	Н/П	Н/П	н/п
Claude Instant	0,0008 USD	0,0024 USD	н/п	Н/П	Н/П	н/п
* Сервис Claude 3 Opus доступен в регионе «Запад США (Орегон)».
** Цены на Claude 3.5 Sonnet применимы к каждой версии Claude 3.5 Sonnet (версий 1 и 2) – модель Claude 3.5 Sonnet версии 2 в настоящее время доступна в регионе «Запад США (Орегон)».

Модели Anthropic	Цена за 1000 входящих токенов	Цена за 1000 исходящих токенов	Цена за 1000 входящих токенов (пакет)	Цена за 1000 исходящих токенов (пакет)	Цена за 1000 входящих токенов (запись кэша)	Цена за 1000 входящих токенов (чтение кэша)
Claude 3.5 Sonnet**	0,003 USD	0,015 USD	0,0015 USD	0,0075 USD	0,00375 USD	0,0003 USD
Claude 3.5 Haiku	0,001 USD	0,005 USD	0,0005 USD	0,0025 USD	0,001 USD	0,00008 USD
Claude 3 Opus*	0,015 USD	0,075 USD	0,0075 USD	0,0375 USD
Claude 3 Haiku	0,00025 USD	0,00125 USD	0,000125 USD	0,000625 USD
Claude 3 Sonnet	0,003 USD	0,015 USD	0,0015 USD	0,0075 USD
Claude 2.1	0,008 USD	0,024 USD	Н/П	Н/П
Claude 2.0	0,008 USD	0,024 USD	Н/П	Н/П
Claude Instant	0,0008 USD	0,0024 USD	Н/П	Н/П
* Сервис Claude 3 Opus доступен в регионе «Запад США (Орегон)».
** Цены на Claude 3.5 Sonnet применимы к каждой версии Claude 3.5 Sonnet (версий 1 и 2) – Claude 3.5 Sonnet версии 2 в настоящее время доступна в регионе «Запад США (Орегон)».

Регион: Европа (Лондон)

Модели Anthropic	Цена за 1000 входящих токенов	Цена за 1000 исходящих токенов	Цена за 1000 входящих токенов (пакет)	Цена за 1000 исходящих токенов (пакет)
Claude 3 Sonnet	0,003 USD	0,015 USD	0,0015 USD	0,0075 USD
Claude 3 Haiku	0,00025 USD	0,00125 USD	0,000125 USD	0,000625 USD

Регион: Европа (Цюрих)

Модели Anthropic

Цена за 1000 входящих токенов

Цена за 1000 исходящих токенов

Цена за 1000 входящих токенов (пакет)

Цена за 1000 исходящих токенов (пакет)

Claude 3.5 Sonnet

0,003 USD

0,015 USD

0,0015 USD

0,0075 USD

Claude 3 Haiku

0,00025 USD

0,00125 USD

0,000125 USD

0,000625 USD

Регион: Южная Америка (Сан-Паулу)

Модели Anthropic

Цена за 1000 входящих токенов

Цена за 1000 исходящих токенов

Цена за 1000 входящих токенов (пакет)

Цена за 1000 исходящих токенов (пакет)

Claude 3 Sonnet

0,003 USD

0,015 USD

0,0015 USD

0,0075 USD

Claude 3 Haiku

0,00025 USD

0,00125 USD

0,000125 USD

0,000625 USD

Регион: Канада (Центральная)

Модели Anthropic

Цена за 1000 входящих токенов

Цена за 1000 исходящих токенов

Цена за 1000 входящих токенов (пакет)

Цена за 1000 исходящих токенов (пакет)

Claude 3 Sonnet

0,003 USD

0,015 USD

0,0015 USD

0,0075 USD

Claude 3 Haiku

0,00025 USD

0,00125 USD

0,000125 USD

0,000625 USD

Регион: Азиатско-Тихоокеанский (Мумбаи)

Модели Anthropic

Цена за 1000 входящих токенов

Цена за 1000 исходящих токенов

Цена за 1000 входящих токенов (пакет)

Цена за 1000 исходящих токенов (пакет)

Claude 3 Sonnet

0,003 USD

0,015 USD

0,0015 USD

0,0075 USD

Claude 3 Haiku

0,00025 USD

0,00125 USD

0,000125 USD

0,000625 USD

Регион: Азиатско-Тихоокеанский (Сидней)

Модели Anthropic

Цена за 1000 входящих токенов

Цена за 1000 исходящих токенов

Цена за 1000 входящих токенов (пакет)

Цена за 1000 исходящих токенов (пакет)

Claude 3 Sonnet

0,003 USD

0,015 USD

0,0015 USD

0,0075 USD

Claude 3 Haiku

0,00025 USD

0,00125 USD

0,000125 USD

0,000625 USD

Регион: Азиатско-Тихоокеанский (Токио)

Модели Anthropic	Цена за 1000 входящих токенов	Цена за 1000 исходящих токенов	Цена за 1000 входящих токенов (пакет)	Цена за 1000 исходящих токенов (пакет)
Claude Instant	0,0008 USD	0,0024 USD	Н/П	Н/П
Claude 2.0/2.1	0,008 USD	0,024 USD	Н/П	Н/П
Claude 3 Haiku	0,00025 USD	0,00125 USD	0,000125 USD	0,000625 USD
Claude 3.5 Sonnet	0,003 USD	0,015 USD	0,0015 USD	0,0075 USD

Регион: Азиатско-Тихоокеанский (Сингапур)

Модели Anthropic	Цена за 1000 входящих токенов	Цена за 1000 исходящих токенов	Цена за 1000 входящих токенов (пакет)	Цена за 1000 исходящих токенов (пакет)
Claude Instant	0,0008 USD	0,0024 USD	0,0004 USD	0,0012 USD
Claude 2.0/2.1	0,008 USD	0,024 USD	0,004 USD	0,012 USD
Claude 3 Haiku	0,00025 USD	0,00125 USD	0,000125 USD	0,000625 USD
Claude 3.5 Sonnet	0,003 USD	0,015 USD	Н/П	Н/П

Регион: Европа (Париж)

Модели Anthropic

Цена за 1000 входящих токенов

Цена за 1000 исходящих токенов

Цена за 1000 входящих токенов (пакет)

Цена за 1000 исходящих токенов (пакет)

Claude 3 Haiku

0,00025 USD

0,00125 USD

0,000125 USD

0,000625 USD

Claude 3 Sonnet

0,003 USD

0,015 USD

0,0015 USD

0,0075 USD

Регион: Европа (Франкфурт)

Модели Anthropic	Цена за 1000 входящих токенов	Цена за 1000 исходящих токенов	Цена за 1000 входящих токенов (пакет)	Цена за 1000 исходящих токенов (пакет)
Claude Instant	0,0008 USD	0,0024 USD	Н/П	Н/П
Claude 2.0/2.1	0,008 USD	0,024 USD	Н/П	Н/П
Claude 3 Sonnet	0,003 USD	0,015 USD	0,0015 USD	0,0075 USD
Claude 3.5 Sonnet	0,003 USD	0,015 USD	0,0015 USD	0,0075 USD
Claude 3 Haiku	0,00025 USD	0,00125 USD	0,000125 USD	0,000625 USD

Регион: Азиатско-Тихоокеанский (Сеул)

Модели Anthropic

Цена за 1000 входящих токенов

Цена за 1000 исходящих токенов

Цена за 1000 входящих токенов (пакет)

Цена за 1000 исходящих токенов (пакет)

Claude 3.5 Sonnet

0,003 USD

0,015 USD

Н/П

Claude 3 Haiku

0,00025 USD

0,00125 USD

Н/П

Регион: Восток США (Огайо)

Модели Anthropic

Цена за 1000 входящих токенов

Цена за 1000 исходящих токенов

Цена за 1000 входящих токенов (пакет)

Цена за 1000 исходящих токенов (пакет)

Claude 3.5 Sonnet

0,003 USD

0,015 USD

Н/П

Claude 3 Haiku

0,00025 USD

0,00125 USD

Н/П

н/п

Регион: AWS GovCloud (США – запад) и AWS GovCloud (США – восток)

Модели Anthropic	Цена за 1000 входящих токенов	Цена за 1000 исходящих токенов
Claude 3.5 Sonnet	0,0036 USD	0,018 USD
Claude 3 Haiku	0,0003 USD	0,0015 USD

Вывод с оптимизированными показателями задержки

Регион: Восток США (Огайо)

	Цена за 1000 входящих токенов	Цена за 1000 исходящих токенов
Claude 3.5 Haiku	0,001 USD	0,005 USD

Цены на выделенную пропускную способность

Регион: Восток США (Северная Вирджиния) и Запад США (Орегон)

Модели Anthropic	Цена за час работы за модель без подписки	Цена за час за элемент модели по подписке на 1 месяц	Цена за час за элемент модели по подписке на 6 месяцев
Claude Instant	44,00 USD	39,60 USD	22,00 USD
Claude 2.0/2.1	70,00 USD	63,00 USD	35,00 USD

Модели Anthropic	Цена за час работы за модель без подписки	Цена за час за элемент модели по подписке на 1 месяц	Цена за час за элемент модели по подписке на 6 месяцев
Claude Instant	44,00 USD	39,60 USD	22,00 USD
Claude 2.0/2.1	70,00 USD	63,00 USD	35,00 USD

Регион: Азиатско-Тихоокеанский регион (Токио)

Модели Anthropic	Цена за час за элемент модели по подписке на 1 месяц	Цена за час за элемент модели по подписке на 6 месяцев
Claude Instant	53,00 USD	29,00 USD
Claude 2.0/2.1	86,00 USD	48,00 USD

Регион: Европа (Франкфурт)

Модели Anthropic	Цена за час за элемент модели по подписке на 1 месяц	Цена за час за элемент модели по подписке на 6 месяцев
Claude Instant	49,00 USD	27,00 USD
Claude 2.0/2.1	79,00 USD	44,00 USD

Обратитесь к команде по работе с клиентами AWS для получения более подробной информации об элементах модели.

Cohere

Cohere

Цены по требованию

Модели Cohere	Цена за 1000 входящих токенов	Цена за 1000 исходящих токенов
Command	0,0015 USD	0,0020 USD
Command-Light	0,0003 USD	0,0006 USD
Command R+	0,0030 USD	0,0150 USD
Command R	0,0005 USD	0,0015 USD
Embed – английский язык	0,0001 USD	Н/П
Embed – многоязычная	0,0001 USD	н/п

Модели Cohere	Цена за 1000 запросов**
Rerank 3.5	2,00 USD
** С вас взимается плата за количество запросов, в каждом из которых может содержаться до 100 фрагментов документа. Если запрос содержит более 100 фрагментов документа, он засчитывается как несколько запросов. Например, если запрос содержит 350 документов, он будет обработан как 4 запроса. Обратите внимание, что каждый документ может содержать не более 500 токенов (включая запрос и общее количество токенов документа), а если длина токена превышает 512 токенов, он разбивается на несколько документов.

Цены на настройку (точную)

Модели Cohere	Стоимость обучения 1000 токенов	Цена хранения каждой индивидуальной модели в месяц	Цена вывода для пользовательской модели за каждый элемент модели в час (при условии оплаты за выделенную пропускную способность без подписки)
Cohere Command	0,004 USD	1,95 USD	49,50 USD
Cohere Command-Light	0,001 USD	1,95 USD	8,56 USD

* Общее количество обученных токенов = количество токенов в корпусе обучающих данных Х количество эпох

Оплата за выделенную пропускную способность

Модели Cohere	Цена за час работы за модель без подписки	Цена за час за элемент модели по подписке на 1 месяц	Цена за час за элемент модели по подписке на 6 месяцев
Cohere Command	49,50 USD	39,60 USD	23,77 USD
Cohere Command – Light	8,56 USD	6,85 USD	4,11 USD
Embed – английский язык	7,12 USD	6,76 USD	6,41 USD
Embed – многоязычная	7,12 USD	6,76 USD	6,41 USD

Обратитесь к команде по работе с клиентами AWS или в отдел продаж для получения более подробной информации об элементах модели.

Meta Llama

Meta Llama

Llama 3.3

Цены по требованию и для пакетного режима

Llama 3.2

Цены по требованию и для пакетного режима

Llama 3.1

Цены по требованию и для пакетного режима

Цены на настройку модели (точная настройка)

Оплата за выделенную пропускную способность

Llama 3

Цены по требованию

Llama 2

Цены по требованию

Регионы: Восток США (Северная Вирджиния) и Запад США (Орегон)

Модели Meta	Цена за 1000 входящих токенов	Цена за 1000 исходящих токенов
Llama 2 Chat (13 млрд)	0,00075 USD	0,001 USD
Llama 2 Chat (70 млрд)	0,00195 USD	0,00256 USD

Цены на настройку модели (тонкая настройка)

Модели Meta	Стоимость обучения 1000 токенов	*Цена хранения каждой пользовательской модели в месяц**	Цена вывода для пользовательской модели за 1 элемент модели в час (без учета стоимости выделенной пропускной способности)
Llama 2, предварительно обученная (13 млрд)	0,00149 USD	1,95 USD	23,50 USD
Llama 2, предварительно обученная (70 млрд)	0,00799 USD	1,95 USD	23,50 USD

* Хранение пользовательских моделей = 1,95 USD

Оплата за выделенную пропускную способность

Модели Meta	Цена за час за элемент модели по подписке на 1 месяц	Цена за час за элемент модели по подписке на 6 месяцев
Llama 2, предварительно обученная и Chat (13 млрд)	21,18 USD	13,08 USD
Llama 2, предварительно обученная (70 млрд)	21,18 USD	13,08 USD

*Предварительно обученные модели Llama 2 доступны только с выделенной пропускной способностью после настройки.

Mistral AI
Mistral AI
Stability AI

Stability AI

Цены по требованию

Модель Stability AI	Цена за сгенерированное изображение
Stable Diffusion 3.5 Large	0,08 USD
Stable Image Core	0,04 USD
Stable Diffusion 3 Large	0,08 USD
Stable Image Ultra	0,14 USD

Ранее сгенерированные модели изображений, предлагаемые Stability AI, оплачиваются за количество изображений с учетом количества шагов и разрешения изображения.

Модель Stability AI	Разрешение изображения	Цена за созданное изображение в стандартном качестве (не более 50 шагов)	Цена за созданное изображение в превосходном качестве (более 50 шагов)
SDXL 1.0	Не более 1024×1024	0,04 USD	0,08 USD

Оплата за выделенную пропускную способность

Модель Stability AI	Цена за час за элемент модели по подписке на 1 месяц*	Цена за час за элемент модели по подписке на 6 месяцев*
SDXL 1.0	49,86 USD	46,18 USD

* Включает вывод по базовым и пользовательским моделям

В настоящее время настройка моделей Stability AI (тонкая настройка) в Amazon Bedrock не поддерживается.

Импорт пользовательских моделей

Импорт пользовательских моделей

Llama
Llama мультимодальная
Mistral
Mixtral
Flan

Llama

Регионы: Восток США (Северная Вирджиния) и Запад США (Орегон)

Версия пользовательского модельного блока	версия 1.0
Цена за элемент нестандартной модели в минуту*	0,0785 USD
Ежемесячная стоимость хранения за элемент нестандартной модели	1,95 USD

Настраиваемые модули модели, необходимые для ее размещения, зависят от множества факторов, в частности от архитектуры модели, количества ее параметров и длины контекста. Точное количество необходимых элементов пользовательской модели будет определено во время импорта. Примечание. Для модели Llama 3.1 8B 128 КБ требуются 2 пользовательских модельных блока, а для модели Llama 3.1 70B 128k – 8 специальных моделей.
* Оплата выставляется в течение 5 минут.

Llama мультимодальная

Регионы: Восток США (Северная Вирджиния) и Запад США (Орегон)

Версия пользовательского модельного блока	версия 1.0
Цена за элемент нестандартной модели в минуту*	0,0785 USD
Ежемесячная стоимость хранения за элемент нестандартной модели	1,95 USD

Настраиваемые модули модели, необходимые для ее размещения, зависят от множества факторов, в частности от архитектуры модели, количества ее параметров и длины контекста. Точное количество необходимых элементов пользовательской модели будет определено во время импорта. Примечание. Для модели Llama 3.2 11B 128 КБ требуются 4 специализированных модельных устройства.
* Оплата выставляется в течение 5 минут.

Mistral

Регионы: Восток США (Северная Вирджиния) и Запад США (Орегон)

Версия пользовательского модельного блока	версия 1.0
Цена за элемент нестандартной модели в минуту*	0,0785 USD
Ежемесячная стоимость хранения за элемент нестандартной модели	1,95 USD

Настраиваемые модули модели, необходимые для ее размещения, зависят от множества факторов, в частности от архитектуры модели, количества ее параметров и длины контекста. Точное количество необходимых элементов пользовательской модели будет определено во время импорта. Примечание. Для модели Mistral 7B 32K требуется 1 специализированная модель.
* Оплата выставляется в течение 5 минут.

Mixtral

Регионы: Восток США (Северная Вирджиния) и Запад США (Орегон)

Версия пользовательского модельного блока	версия 1.0
Цена за элемент нестандартной модели в минуту*	0,0785 USD
Ежемесячная стоимость хранения за элемент нестандартной модели	1,95 USD

Настраиваемые модули модели, необходимые для ее размещения, зависят от множества факторов, в частности от архитектуры модели, количества ее параметров и длины контекста. Точное количество необходимых элементов пользовательской модели будет определено во время импорта. Примечание. Для модели Mixtral 8x7B 32K требуются 4 специализированных модельных устройства.
* Оплата выставляется в течение 5 минут.

Flan

Регионы: Восток США (Северная Вирджиния) и Запад США (Орегон)

Версия пользовательского модельного блока	версия 1.0
Цена за элемент нестандартной модели в минуту*	0,0785 USD
Ежемесячная стоимость хранения за элемент нестандартной модели	1,95 USD

Настраиваемые модули модели, необходимые для ее размещения, зависят от множества факторов, в частности от архитектуры модели, количества ее параметров и длины контекста. Точное количество необходимых элементов пользовательской модели будет определено во время импорта. Примечание. Для модели Flan-T5 XL 512 требуется 1 специализированная модель.
* Оплата выставляется в течение 5 минут.

Цены на инференсы по запросу
Счет выставляется в течение 5 минут, пока копия модели активна, начиная с первого успешного вызова. Максимальный предел пропускной способности и параллелизма для каждой копии модели определяется в процессе ее импорта и зависит от таких факторов, как сочетание токенов ввода/вывода, тип оборудования, размер модели, архитектура, оптимизация логических выводов.

Bedrock автоматически масштабирует количество копий модели в зависимости от особенностей использования. Если в течение 5 минут вызова не будет, Bedrock уменьшит масштаб до нуля и снова увеличит его при вызове модели. Во время повторного масштабирования может возникнуть продолжительность холодного запуска (в десятках секунд) в зависимости от размера модели. Bedrock также увеличивает количество копий модели, если объем вывода постоянно превышает пределы параллелизма одной копии модели. Примечание. По умолчанию на каждую импортированную модель приходится не более 3 копий модели на один аккаунт, которые можно увеличить с помощью Квоты на обслуживание.

Инструменты ценообразования (подробные сведения)

Рабочие процессы
Базы знаний
Ограничения
Оценка модели
Автоматизация обработки данных

Рабочие процессы
Потоки Amazon Bedrock

Плата зависит от количества переходов между узлами, необходимых для выполнения приложения. Bedrock Flows учитывает переход узла при каждом его выполнении в вашем рабочем процессе. Стоимость зависит от суммарного количества переходов между узлами во всех ваших потоках.

Все расходы оцениваются ежедневно, и плата за них взимается ежемесячно начиная с 1 февраля 2025 года.

Цена за 1000 переходов узлов

0,035 USD

Дополнительная плата

Если в рабочем процессе приложения используются другие сервисы AWS или осуществляется передача данных, может начисляться дополнительная плата. Например, если ваш рабочий процесс использует политику «Ограничения» для Amazon Bedrock, вам будет выставлен счет за количество текстовых единиц, обработанных политикой.
Базы знаний
Извлечение структурированных данных (посредством генерации SQL-запросов)

Оплата за извлечение структурированных данных производится на основании каждого запроса на генерацию SQL-запроса. Сгенерированный SQL-запрос используется для извлечения структурированных данных из хранилищ.

Модели Rerank

Модели Rerank предназначены для повышения релевантности и точности ответов в приложениях дополненной извлеченными данными генерации (RAG). Они оплачиваются за каждый запрос.

** С вас взимается плата за количество запросов, в каждом из которых может содержаться до 100 фрагментов документа. Если запрос содержит более 100 фрагментов документа, он засчитывается как несколько запросов. Например, если запрос содержит 350 документов, он будет обработан как 4 запроса. Обратите внимание, что каждый документ может содержать не более 512 токенов (включая запрос и общее количество токенов документа), а если длина токена превышает 512 токенов, он разбивается на несколько документов. Запрос эквивалентен единице поиска.
Ограничения

Цена за 1000 переходов узлов
0,035 USD

Ограничения для Amazon Bedrock

Политика ограничений*	Цена за 1000 текстовых единиц**
Фильтры контента (текстового)****	0,15 USD
Запрещенные темы	0,15 USD
Контекстная проверка обоснования***	0,1 USD
Фильтры конфиденциальной информации (персональных данных)	0,1 USD
Фильтры конфиденциальной информации (регулярное выражение)	Бесплатно
Фильтры слов	Бесплатно

Цены по требованию

* Каждая политика ограничения опциональна и может быть активирована в зависимости от требований вашего приложения. Плата будет взиматься в зависимости от типа политики, используемой в ограничении. Например, если ограничение настроено с использованием фильтров контента и запрещенных тем, плата за эти две политики будет взиматься, а за фильтры конфиденциальной информации – нет.

** Текстовая единица может содержать до 1000 символов. Если текстовый ввод превышает 1000 символов, он обрабатывается как несколько текстовых единиц, каждая из которых содержит 1000 символов или меньше. Например, если введенный текст содержит 5600 символов, плата будет взиматься за 6 текстовых единиц.

*** Контекстная проверка обоснования использует источник данных и запрос, чтобы определить степень соответствия ответа модели источнику данных и запросу. Общее количество текстовых единиц, за которые взимается плата, рассчитывается путем объединения всех символов в источнике, запросе и ответе модели.

**** Цены на фильтры контента для обнаружения и фильтрации вредоносного графического контента будут объявлены, когда эта функция станет общедоступной.

Оценка модели

Оценка модели

За оценку модели взимается плата за вывод, сделанный на основе выбранной модели. Автоматически сгенерированные алгоритмические оценки предоставляются без дополнительной оплаты. В случае оценки с участием человека (собственной рабочей команды) с вас взимается плата за вывод модели и плата в размере 0,21 USD за каждую выполненную человеком задачу.

Модель

Цена за 1000 входящих токенов

Цена за 1000 исходящих токенов

Стоимость выполнения каждой задачи для человека

Модель, выбранная для оценки

На основе выбранной модели

0,21 USD

Автоматизация обработки данных
Автоматизация обработки данных
- Базы знаний Amazon Bedrock обеспечивают интеграцию автоматизации обработки данных Bedrock для получения более релевантных и точных ответов на мультимодальные данные. При настройке базы знаний можно выбрать в качестве метода синтаксического анализа автоматизацию обработки данных Bedrock для анализа и извлечения значимой информации из изображений или документов, включая рисунки, схемы и диаграммы. Во время обработки эта функция извлекает значимую информацию из полученных документов и изображений, которая затем используется на последующих этапах базы знаний для группировки, встраивания и хранения. При интеграции с базами знаний она обеспечивает стандартизированный выход и взимает соответствующую плату.

Примеры расчета стоимости

AI21 Labs

Разработчик приложения выполняет следующие вызовы API к Amazon Bedrock: запрос к модели Jurassic-2 Mid от AI21 Labs для суммирования вводного потока из 10 000 токенов входного текста в итоговый поток из 2000 токенов.

Общая стоимость = 10 000 токенов / 1000 * 0,0125 USD + 2000 токенов / 1000 * 0,0125 USD = 0,15 USD
Amazon

Цены по требованию

Разработчик приложения каждый час выполняет следующие вызовы API к Amazon Bedrock: запрос к модели Amazon Titan Text Lite для суммирования входящего потока из 2000 токенов входящего текста в исходящий поток из 1000 токенов.

Общая стоимость в час = 2000 токенов / 1000 * 0,0003 USD + 1000 токенов / 1000 * 0,0004 USD = 0,001 USD.

Разработчик приложения выполняет следующие вызовы API к Amazon Bedrock: запрос к базовой модели генератора изображений Amazon Titan для создания 1000 изображений размером 1024 × 1024 в стандартном качестве.

Общая стоимость = 1000 изображений * 0,01 USD за изображение = 10 USD

Оплата за настройку (тонкую настройку и непрерывное предварительное обучение)

Разработчик приложения настраивает модель генератора изображений Amazon Titan, используя 1000 пар «изображение – текст». После обучения разработчик использует выделенную для пользовательской модели пропускную способность в течение 1 часа, чтобы оценить производительность модели. Тонко настроенная модель хранится в течение 1 месяца. После оценки разработчик использует выделенную пропускную способность (с подпиской на один месяц) для размещения настраиваемой модели.

Ежемесячные затраты на тонкую настройку вычисляются так: обучение для тонкой настройки (0,005 USD * 500 * 64), где 0,005 USD – цена за просмотренное изображение, 500 – количество шагов, 64 – размер партии плюс хранение пользовательской модели в месяц (1,95 USD) + 1 час анализа пользовательской модели (21 USD) = 160 USD + 1,95 USD + 21 = 182,95 USD

Оплата за выделенную пропускную способность

Разработчик приложения покупает два элемента модели Amazon Titan Text Express с подпиской на один месяц, чтобы использовать ее для обобщения текста.

Общая стоимость в месяц: 2 элемента модели * 18,40 USD/час * 24 часа * 31 день = 27 379,20 USD

Разработчик приложения покупает один элемент модели базовой модели генератора изображений Amazon Titan с подпиской на один месяц.

Общая стоимость = 1 элемент модели * 16,20 USD * 24 часа * 31 день = 12 052,80 USD
Anthropic

Цены по требованию

Разработчик приложения выполняет следующие вызовы API к Amazon Bedrock в регионе Запад США (Орегон): запрос к модели Claude от Anthropic для суммирования входящего потока из 11 000 токенов входящего текста в исходящий поток размером 4000 токенов.

Общая стоимость = 11 000 токенов / 1000 * 0,008 USD + 4000 токенов / 1000 * 0,024 USD = 0,088 USD + 0,096 USD = 0,184 USD

Оплата за выделенную пропускную способность

Разработчик приложения покупает один элемент модели Anthropic Claude Instant в регионе Запад США (Орегон).

Общая стоимость в месяц: 1 элемент модели * 39,60 USD * 24 часа * 31 день = 29 462,40 USD
Cohere

Цены по требованию

Разработчик приложения выполняет следующие вызовы API к Amazon Bedrock: запрос к модели Command от Cohere для суммирования входящего потока из 6000 токенов входящего текста в исходящий поток размером 2000 токенов.

Общая стоимость = 6000 токенов / 1000 * 0,0015 USD + 2000 токенов / 1000 * 0,0020 USD = 0,013 USD

Разработчик приложения выполняет следующие вызовы API к Amazon Bedrock: запрос к модели Command – Light от Cohere для суммирования входящего потока из 6000 токенов входящего текста в исходящий поток размером 2000 токенов.

Общая стоимость = 6000 токенов / 1000 * 0,0003 USD + 2000 токенов / 1000 * 0,0006 USD = 0,003 USD

Разработчик приложения выполняет следующие вызовы API к Amazon Bedrock: запрос к модели Embed English или Embed Multilingual от Cohere, чтобы создавать вложения для 10 000 токенов входящего потока.

Общая стоимость = 10 000 токенов / 1000 * 0,0001 USD = 0,001 USD

Оплата за настройку (тонкую настройку)

Разработчик приложения настраивает командную модель Cohere, используя 1000 токенов данных. После обучения он использует выделенную для пользовательской модели пропускную способность в течение 1 часа, чтобы оценить производительность модели. Тонко настроенная модель хранится в течение 1 месяца. После оценки разработчик использует выделенную пропускную способность (с подпиской на один месяц) для размещения настраиваемой модели.

В ежемесячную стоимость тонкой настройки входит обучение для тонкой настройки (0,004 USD * 1000), хранение пользовательских моделей в месяц (1,95 USD), один час вывода по пользовательской модели (49,50 USD). Итого: 55,45 USD.

Ежемесячная стоимость выделенной пропускной способности (с подпиской на один месяц) пользовательской модели составляет 39,60 USD

Оплата за выделенную пропускную способность

Разработчик приложения покупает один элемент модели Cohere Command с подпиской на один месяц, чтобы использовать ее для обобщения текста.

Общая стоимость в месяц: 1 элемент модели * 39,60 USD * 24 часа * 31 день = 29 462,40 USD
Meta Llama

Цены по требованию

Разработчик приложения выполняет следующие вызовы API к Amazon Bedrock: запрос к модели Llama 2 Chat (13 млрд) от Meta для суммирования входящего потока из 2000 токенов входящего текста в исходящий поток размером 500 токенов.

Общая стоимость = 2000 токенов / 1000 * 0,00075 USD + 500 токенов / 1000 USD * 0,001 USD = 0,002 USD

Оплата за настройку (тонкую настройку)

Разработчик приложения настраивает предварительно обученную модель Llama 2 (70 млрд), используя 1000 токенов данных. После обучения он использует выделенную для пользовательской модели пропускную способность в течение 1 часа, чтобы оценить производительность модели. Тонко настроенная модель хранится в течение 1 месяца. После оценки разработчик использует выделенную пропускную способность (с подпиской на один месяц) для размещения настраиваемой модели.

В ежемесячную стоимость тонкой настройки входит обучение для тонкой настройки (0,00799 USD * 1000), хранение пользовательских моделей в месяц (1,95 USD), один час вывода по пользовательской модели (23,50 USD). Итого: 33,44 USD.

Ежемесячная стоимость выделенной пропускной способности (с подпиской на один месяц) пользовательской модели составляет 21,18 USD

Оплата за выделенную пропускную способность

Разработчик приложения покупает один элемент модели Meta Llama 2 с подпиской на один месяц, чтобы использовать ее для обобщения текста.

Общая стоимость в месяц: 1 элемент модели * 21,18 USD * 24 часа * 31 день = 15 757,92 USD
Mistral AI

Цены по требованию

Разработчик приложения каждый час выполняет следующие вызовы API к Amazon Bedrock: запрос к модели Mistral 7B для суммирования входящего потока из 2000 токенов входящего текста в исходящий поток из 1000 токенов.

Общая стоимость в час = 2000 токенов / 1000 * 0,00015 USD + 1000 токенов / 1000 * 0,0002 USD = 0,0005 USD

Разработчик приложения каждый час выполняет следующие вызовы API к Amazon Bedrock: запрос к модели Mixtral 8x7B для суммирования входящего потока из 2000 токенов входящего текста в исходящий поток из 1000 токенов.

Общая стоимость в час = 2000 токенов / 1000 * 0,00045 USD + 1000 токенов / 1000 * 0,0007 USD = 0,0016 USD

Разработчик приложения каждый час выполняет следующие вызовы API к Amazon Bedrock: запрос к модели Mistral Large для суммирования входящего потока размером 2000 токенов входящего текста в исходящий поток размером 1000 токенов.

Общая стоимость в час = 2000 токенов / 1000 * 0,008 USD + 1000 токенов / 1000 * 0,024 USD = 0,04 USD
Stability AI

Цены по требованию

Разработчик приложения выполняет следующие вызовы API к Amazon Bedrock: запрос к модели SDXL для создания изображения размером 512 × 512 с величиной шага 70 (премиальное качество).

Общая стоимость = 1 изображение * 0,036 USD за изображение = 0,036 USD

Разработчик приложения выполняет следующие вызовы API к Amazon Bedrock: запрос к модели SDXL 1.0 для создания изображения размером 1024 × 1024 с величиной шага 70 (премиальное качество).

Общая стоимость = 1 изображение * 0,08 USD за изображение = 0,08 USD

Оплата за выделенную пропускную способность

Разработчик приложения покупает один элемент модели SDXL 1.0 с подпиской на один месяц.

Общая стоимость = 1 * 49,86 USD * 24 часа * 31 день = 37 095,84 USD

Оценка модели

Оценка модели, пример 1.

Этот набор данных содержит 50 запросов, а для оценки каждого сочетания запроса и ответа разработчик требует использовать 1-го сотрудника (это значение указывается в параметре «количество сотрудников на запрос» при создании задания по оценке).

В этом оценочном задании будет 50 задач (по 1 заданию на каждый набор подсказок и ответов на каждого работника). 50 запросов в сумме содержат 5000 входящих токенов, а ответы – 15 тысяч токенов для Anthropic Claude Instant и 20 тысяч токенов для Anthropic Claude 2.1.

Плата за эту работу по оценке модели вычисляется следующим образом:

Элемент	Количество входящих токенов	Цена за 1000 входящих токенов	Стоимость входящих потоков	Количество исходящих токенов	Цена за 1000 исходящих токенов	Стоимость исходящих потоков	Количество задач для человека	Стоимость выполнения каждой задачи для человека	Стоимость всех задач для человека	Итого
Логический вывод Claude Instant	5000	0,0008 USD	0,004 USD	15 000	0,0024 USD	0,036 USD				0,04 USD
Логический вывод Claude 2.1	5000	0,008 USD	0,04 USD	20 000	0,024 USD	0,48 USD				0,52 USD
Задачи для человека							50	0,21 USD	10,50 USD	10,50 USD
Итого										11,06 USD

Оценка модели, пример 2.

Цены на ресурсы по требованию
Разработчик приложения представляет набор данных для оценки модели с участием человека на основе Anthropic Claude 2.1 и Anthropic Claude Instant в регионе AWS «Восток США (Северная Вирджиния)».

Этот набор данных содержит 50 запросов, а для оценки каждого сочетания запроса и ответа разработчик требует использовать 2-х сотрудников (это значение указывается в параметре «количество сотрудников на запрос» при создании задания по оценке). Это означает, что задание по оценке будет состоять из 100 задач (по 1 задаче на каждый набор «запрос – ответ» на каждого сотрудника: 2 сотрудника × 50 наборов «запрос – ответ» = 100 задач для человека).

50 запросов в сумме содержат 5000 входящих токенов, а ответы – 15 тысяч токенов для Anthropic Claude Instant и 20 тысяч токенов для Anthropic Claude 2.1.

Плата за эту работу по оценке модели вычисляется следующим образом:

Элемент	Количество входящих токенов	Цена за 1000 входящих токенов	Стоимость входящих потоков	Количество исходящих токенов	Цена за 1000 исходящих токенов	Стоимость исходящих потоков	Количество задач для человека	Стоимость выполнения каждой задачи для человека	Стоимость всех задач для человека	Итого
Логический вывод Claude Instant	5000	0,0008 USD	0,0040 USD	15 000	0,0024 USD	0,036 USD				0,04 USD
Логический вывод Claude 2.1	5000	0,008 USD	0,0400 USD	20 000	0,024 USD	0,48 USD				0,52 USD
Задачи для человека							100	0,21 USD	21,00 USD	21,00 USD
Итого										21,56 USD

Ограничения для Amazon Bedrock

Пример 1. Чат-бот службы поддержки
Разработчик приложения создает чат-бота службы поддержки клиентов и использует фильтры контента для блокировки вредоносного контента и запрещенных тем, чтобы отфильтровывать нежелательные запросы и ответы.

Чат-бот обрабатывает 1000 запросов пользователей в час. Каждый пользовательский запрос имеет среднюю длину ввода 200 символов и получает ответ базовой модели размером в 1500 символов.

Каждый пользовательский запрос длиной 200 символов соответствует одной текстовой единице.

Каждый ответ базовой модели длиной 1500 символов соответствует двум текстовым единицам.

Текстовые единицы, обрабатываемые каждый час = (1 + 2) * 1000 запросов = 3000 текстовых единиц

Общая стоимость часов фильтрации контента и запрещенных тем = 3000 * (0,15 USD + 0,15 USD) / 1000 = 0,90 USD

Пример 2. Обобщение стенограмм колл-центра
Разработчик создает приложение для обобщения стенограмм чатов между пользователями и агентами поддержки. Он использует фильтр конфиденциальной информации для редактирования информации, позволяющей установить личность (PII), в сгенерированных сводках по 10 000 разговоров.

Каждая сгенерированная сводка содержит в среднем 3500 символов, что соответствует 4 текстовым единицам.

Общая стоимость суммирования: 10 000 разговоров = 10 000 * 4 * (0,1 USD/1000) = 4 USD

Элемент	Количество входящих токенов	Цена за 1000 входящих токенов	Стоимость входящих потоков	Количество исходящих токенов	Цена за 1000 исходящих токенов	Стоимость исходящих потоков	Количество задач для человека	Стоимость выполнения каждой задачи для человека	Стоимость всех задач для человека	Итого
Логический вывод Claude Instant	5000	0,0008 USD	0,004 USD	15 000	0,0024 USD	0,036 USD				0,04 USD
Логический вывод Claude 2.1	5000	0,008 USD	0,04 USD	20 000	0,024 USD	0,48 USD				0,52 USD
Задачи для человека							100	0,21 USD	21,00 USD	21,00 USD
Итого										21,56 USD

Импорт пользовательских моделей

Пример ценообразования. Разработчик приложения импортирует персонализированную модель типа Llama 3.1 с параметром 8B и длиной последовательности 128 КБ в регионе us-east-1 и удаляет модель через 1 месяц. Для этого необходимы 2 элемента нестандартной модели. Таким образом, цена за минуту составит 0,1570 USD, поскольку требуются 2 элемента пользовательской модели. Стоимость хранения двух моделей на заказ составит 3,90 USD в месяц.

Плата за импорт модели не взимается. Первый успешный вызов осуществлен в 08:03. В это время начинается замер. Окна измерений длительностью 5 минут работают с 08:03 до 08:07, с 08:07 до 08:11 и т. д. Если за любой 5-минутный период был выполнен хотя бы один вызов, окно оплаты будет считаться активным. Если с 08:07 до 08:11 вызова не будет, замер остановится в 08:11. В этом случае счет будет рассчитан следующим образом: 0,1570 USD * 5 минут * 3 окна по пять минут = 2,355 USD.
Базы знаний Amazon Bedrock

Пример расчета стоимости 1 (изменение ранжирования с использованием модели Amazon Rerank 1.0)

Предположим, что в течение месяца вы отправляете 2 миллиона запросов в API Rerank с использованием модели Amazon Rerank 1.0. В каждом из первого миллиона запросов содержится менее 100 документов, поэтому плата за них взимается как за один запрос. Оставшийся 1 миллион запросов содержит 120–150 документов, поэтому за каждый запрос будет взиматься плата как за 2 запроса.

Цена за один запрос = 0,001 USD
Общая стоимость = 1 000 000 * 0,001 USD + 1 000 000 * 2 * 0,001 USD = 3000 USD

Пример расчета стоимости 2 (получение структурированных данных)

Разработчик приложения создает чат-бота поддержки, который запрашивает структурированные данные, хранящиеся в Amazon Redshift. Затем он создает базу знаний Bedrock и подключается к Amazon Redshift. Чат-бот за час обрабатывает 10 000 пользовательских запросов. Каждый пользовательский запрос будет стоить 0,002 USD за API GenerateQuery для генерации SQL на основе пользовательского запроса.

Общая стоимость генерации SQL в час = 0,002 USD * 10 000 = 20 USD
Общая стоимость за месяц = 20 USD * 24 * 30 = 1440 USD
Рабочие процессы

Пример. Сводка новостей
Разработчик приложения создает поток с целью автоматизации суммирования новостей для трейдеров. Поток начинается с узла ввода, определяющего местоположение S3, далее узел загрузки S3 извлекает 10 файлов со статьями от 10 ведущих информационных агентств (2 перехода). Затем узел-итератор вызывает модель суммирования файлов с помощью узла текстового запроса (+ 10 файлов x 2 перехода). Полученные результаты собираются узлом-коллектором, затем сохраняются обратно в S3 через узел S3-хранилища и передаются в узел Output для завершения процесса (+ 3 перехода). Поток запускается каждые полчаса в рабочие дни.

Количество переходов между узлами для выполнения одного потока: 2+1+10 * 2 + 3 = 25 переходов.

Количество запусков потока в месяц: 24 часа * 2 запуска в час * 5 дней * 4 недели = 960 запусков.

Общая ежемесячная стоимость: 25 * 960 * 0,035 USD / 1000 = 0,84 USD

Дополнительные расходы
Дополнительно в счет будут включены расходы на сервисы AWS, используемые в процессе выполнения потока, включая хранение и извлечение данных через Amazon S3 (узлы загрузки и хранения) и применение модели Amazon Bedrock Foundation (узел текстового запроса).
Автоматизация обработки данных

Пример расчета стоимости 1.
Допустим, вы обрабатываете документ на 1000 страниц с помощью BDA Custom Output. Все 1000 страниц обрабатываются с использованием чертежа 1, состоящего из 15 полей. Цена за обработку одной страницы с использованием любого чертежа с 30 полями или меньше составляет 0,040 USD. Общая стоимость составит 40 USD.

Общее количество обработанных страниц: 1000
Цена за обработку одной страницы с использованием чертежей, содержащих менее 30 полей = 0,040 USD
Общая стоимость = 1000 страниц * 0,040 USD = 40 USD

Пример расчета стоимости 2.
Допустим, вы обрабатываете 2 документа с помощью BDA Custom Output. Документ 1 содержит 40 страниц и обрабатывается с использованием чертежа 1, состоящего из 20 полей. Документ 2 содержит 10 страниц и обрабатывается с использованием чертежа 2, состоящего из 40 полей. Цена за обработку одной страницы с использованием чертежа 1 составляет 0,040 USD, поскольку он содержит 30 полей или меньше. Цена за обработку одной страницы с использованием чертежа 2 составляет 0,045 USD. Стоимость обработки документа 1 с использованием чертежа 1 составляет 1,60 USD. Стоимость обработки документа 2 с использованием чертежа 2 составляет 0,45 USD. Общая стоимость обработки обоих документов составит 2,05 USD.

Общее количество обработанных страниц = 50
Цена за обработку одной страницы с использованием чертежа 1, содержащего меньше 30 полей = 0,040 USD
Цена за обработку одной страницы с использованием чертежа 2, содержащего 40 полей = 0,040 USD + (количество дополнительных полей свыше 30 * 0,0005 USD за поле)
Количество дополнительных полей свыше 30 = 40 - 30 = 10
Цена за обработку одной страницы с использованием чертежа 2, содержащего 40 полей = 0,040 USD + (10 * 0,0005 USD за поле) = 0,045 USD
Стоимость обработки документа 1 с использованием чертежа 1 = 40 страниц x 0,040 USD за страницу = 1,6 USD
Стоимость обработки документа 2 с использованием чертежа 2 = 10 страниц x 0,045 USD за страницу = 0,45 USD
Общая стоимость = плата за документ 1 + плата за документ 2 = 1,6 USD + 0,45 USD = 2,05 USD

Пример расчета стоимости 3.
Допустим, вы обрабатываете 60-минутное видео с помощью BDA Standard Output. Стоимость минуты стандартного видеовыхода составляет 0,050 USD. Общая стоимость составит 3,00 USD.

Общее количество обработанных минут = 60
Стоимость минуты стандартного видеовыхода = 0,050 USD
Общая стоимость = 60 * 0,050 USD = 3,00 USD

Пример расчета стоимости 4.
Допустим, вы обрабатываете 2000 изображений с помощью BDA Custom Output. Первая 1000 изображений обрабатывается с использованием чертежа 1, состоящего из 10 полей. Вторая 1000 страниц обрабатывается с использованием чертежа 2, состоящего из 40 полей. Цена за обработку одного изображения с использованием чертежа 1 составляет 0,005 USD, поскольку он содержит 30 полей или меньше. Цена за обработку одного изображения с использованием чертежа 2 составляет 0,01 USD. Стоимость обработки первой 1000 изображений с использованием чертежа 1 составляет 5,00 USD. Стоимость обработки второй 1000 изображений с использованием чертежа 2 составляет 10,00 USD. Общая стоимость обработки 2000 изображений составит 15,00 USD

Стоимость первой 1000 изображений = 1000 изображений * 0,005 USD за изображение = 5,00 USD
Стоимость второй 1000 изображений = 1000 изображений * (0,005 USD + (количество дополнительных полей свыше 30 * 0,0005 USD за поле))
= 1000 * (0,005 USD + ((40-30) * 0,0005 USD))
= 1000 * (0,005 USD + (10 * 0,0005 USD)) = 10,00 USD
Общая стоимость = 5,00 USD + 10,00 USD = 15,00 USD

Пример расчета стоимости 5.
Предположим, вы хотите использовать Bedrock Data Automation Standard Output для обработки аудиозаписей совещаний вашей организации продолжительностью 15 000 минут. Общая стоимость обработки всех 15 000 минут аудиозаписей составит 90 USD.

Общее количество обработанных минут = 15 000 минут
Общая стоимость = 15 000 минут × 0,006 USD = 90 USD

Пример расчета стоимости 6.
Допустим, вы настроили базы знаний Bedrock для использования Bedrock Data Automation в качестве синтаксического анализатора, а затем загрузили документ объемом 1000 страниц. Обратите внимание, что в интеграции баз знаний Bedrock и Bedrock Data Automation используется стандартный выход. Цена за страницу для стандартного выхода составляет 0,010 USD. Общая стоимость составит 10 USD.

Общее количество обработанных страниц: 1000
Цена за страницу для стандартного выхода = 0,010 USD
Общая стоимость = 1000 * 0,010 USD = 10 USD

Цена на Amazon Bedrock

Обзор цен

Модели формирования цен

По требованию и в пакетном режиме

Оптимизация задержки (общедоступная ознакомительная версия)

Provisioned Throughput

Импорт пользовательских моделей

Модели Marketplace

Настройка и оптимизация

Настройка модели

Дистилляция моделей

Кэширование текстовых запросов

Инструменты

Ограничения

Базы знаний и автоматизация обработки данных

Агенты

Потоки

Оценки

Сведения о ценах

AI21 Labs

Amazon Nova

Цены на модели понимания

Цены на модели генерации креативного контента

Amazon Titan

Anthropic

Cohere

Meta Llama

Mistral AI

Stability AI

Импорт пользовательских моделей

Инструменты ценообразования (подробные сведения)

Потоки Amazon Bedrock

Ограничения для Amazon Bedrock

Оценка модели

Автоматизация обработки данных

Примеры расчета стоимости

AI21 Labs

Amazon

Цены по требованию

Оплата за настройку (тонкую настройку и непрерывное предварительное обучение)

Оплата за выделенную пропускную способность

Anthropic

Цены по требованию

Оплата за выделенную пропускную способность

Cohere

Цены по требованию

Оплата за настройку (тонкую настройку)

Meta Llama

Цены по требованию

Оплата за настройку (тонкую настройку)

Оплата за выделенную пропускную способность

Mistral AI

Цены по требованию

Stability AI

Цены по требованию

Оплата за выделенную пропускную способность

Оценка модели

Оценка модели, пример 1.

Оценка модели, пример 2.

Ограничения для Amazon Bedrock

Импорт пользовательских моделей

Базы знаний Amazon Bedrock

Рабочие процессы

Автоматизация обработки данных

Прекращение поддержки Internet Explorer