Amazon Bedrock での Amazon Titan

Amazon が提供する高性能基盤モデル

利点

高性能の画像モデル、マルチモーダルモデル、テキストモデルにより、コンテンツ作成、画像生成、検索エクスペリエンス、レコメンデーションエクスペリエンスなど、幅広い生成 AI アプリケーションを強化します。
検索精度の向上とパーソナライズされたレコメンデーションの改善をします。
すべての Amazon Titan 基盤モデル (FM) は、データから有害なコンテンツを検出して除去し、不適切なユーザー入力を拒否して、モデル出力をフィルタリングすることで、AI の責任ある使用をビルトインでサポートしています。Amazon Titan Image Generator モデルによって生成されたすべての画像には、有害なコンテンツ生成や誤った情報の拡散を減らすのに役立つよう、デフォルトで目に見えないウォーターマークが含まれています。ウォーターマーク検出は革新的なテクノロジーであり、AWS は AI 画像出力用の組み込みウォーターマークを広範にリリースした最初の大手クラウドプロバイダーの 1 つです。
Amazon Titan モデルを独自のデータで微調整して、モデルをカスタマイズしたり、組織固有のタスクを実行したりできます。検索拡張生成 (RAG) を使用して FM をデータソースに接続することで、モデル応答を簡単にカスタマイズして、正確なドメイン固有の応答を提供できます。

Amazon Titan とは

Amazon Bedrock 限定の Amazon Titan ファミリーモデルには、ビジネス全体で AI と機械学習の革新に取り組んできた Amazon の 25 年の経験が組み込まれています。Amazon Titan 基盤モデル (FM) は、フルマネージド API を通じて、高性能な画像、マルチモーダル、テキストモデルの選択肢を幅広くお客様に提供します。Amazon Titan モデルは AWS によって作成され、大規模なデータセットで事前にトレーニングされているため、さまざまなユースケースをサポートすると同時に、AI の責任ある使用をサポートするように構築された強力な汎用モデルとなっています。そのまま使用することも、独自のデータを使用して個人的にカスタマイズすることもできます。

ユースケース

Amazon Titan Text モデルを使用すると、ブログ記事やウェブページのコピーの作成、記事の分類、自由形式の質疑応答、会話型チャット、情報抽出など、さまざまなテキスト関連タスクの生産性と効率性を高めることができます。

Amazon Titan Text モデルを使用すると、記事、レポート、研究論文、技術文書など、長い文書の簡潔な要約を取得し、重要な情報を迅速かつ効果的に抽出できます。

Amazon Titan Multimodal Embeddings と Amazon Titan Text Embeddings を使用すると、エンドユーザーにより正確で文脈に関連したマルチモーダル検索、レコメンデーション、パーソナライゼーションエクスペリエンスを提供できます。

コンテンツクリエイターが迅速にアイディエーション、カスタマイズ、イテレーションできるようにして、画像生成と画像編集の効率を高めましょう。広告、e コマース、メディア、エンターテイメントなどの業界のお客様は、自然言語のプロンプトを使用して、リアルなスタジオ品質の画像を大量かつ低コストで生成できます。

モデルバージョン

Amazon Titan Text Premier

Amazon Titan Text Premier は Amazon Titan Text ファミリーに含まれる強力で高度な大規模言語モデル (LLM) であり、幅広いエンタープライズアプリケーションで優れたパフォーマンスを提供するように設計されています。このモデルは Amazon Bedrock のエージェントやナレッジベースとの統合に最適化されているため、API を使用してデータを操作できるインタラクティブな生成 AI アプリケーションを構築するのに理想的なオプションです。 

最大トークン: 32,000

言語: 英語

微調整対応: はい (プレビュー)

サポートされているユースケース: チャット、思考連鎖推論、自由形式のテキスト生成、ブレインストーミング、要約、コード生成、表作成、データフォーマット、言い換え、書き換え、抽出、Q&A

ブログを読む

タイタンテキストプレミアのデモを見る

Amazon Titan Text Express

LLM は価格と性能のバランスを提供します。

最大トークン: 8,000

言語:英語 (GA)、100 以上の言語が利用可能 (プレビュー)

微調整対応: はい

サポートされているユースケース: 自由形式のテキスト生成、ブレーンストーミング、要約、コード生成、表作成、データフォーマット、パラフレーズ、思考連鎖、リライト、抽出、Q&A、チャット。

Watch Amazon Titan テキストデモ

re:Invent セッションの視聴

Amazon Titan Text デモ

費用対効果が高く、高度にカスタマイズ可能な LLM。特定のユースケースに適したサイズで、テキスト生成タスクや微調整に最適です。

最大トークン: 4,000

言語: 英語

微調整対応: はい

サポートされているユースケース: 要約とコピーライティング。

Watch Amazon Titan テキストデモ

re:Invent セッションの視聴

Amazon Titan Text Embeddings

テキストをベクトル表現 (埋め込み) に変換するモデル。

最大トークン: 8,000

言語: 25 以上の言語

微調整対応: いいえ

埋め込み: 1,536

サポートされているユースケース: テキスト検索、セマンティック類似性、クラスタリング。

ブログを読む

Amazon Titan Text Embeddings V2

埋め込みモデルは、小さいサイズでも高い精度と検索パフォーマンスを実現するように最適化されており、ストレージとレイテンシーを削減できます。

最大トークン: 8,000

言語:事前トレーニングで100語以上

微調整対応: いいえ

正規化対応:はい

埋め込み:256、512、1024

サポートされているユースケース: セマンティック類似性検索による文書検索 (盗作の検出など)、ラベルをデータに基づいて学習した表現への分類(映画をジャンルに分類するなど)、取得または生成された検索結果の品質と関連性の向上。

ブログを読む

ブログを読む

Amazon Titan マルチモーダル埋め込み

正確なマルチモーダル検索とレコメンデーションエクスペリエンスを実現します。

最大トークン数: 128

最大画像サイズ: 25 MB

言語: 英語

微調整対応: はい

埋め込み:1,024 (デフォルト)、384、256

サポートされているユースケース:検索、レコメンデーション、パーソナライズ

Amazon Titan Image Generator

テキストプロンプトを使用して、リアルでスタジオ品質の画像を生成します。

最大文字数: 512

言語: 英語

微調整対応: はい

サポートされているユースケース: テキストから画像への生成、画像編集、画像バリエーション。

ブログを読む

Amazon Titan イメージジェネレーターのデモを見る

ウォーターマーク検出デモの視聴

re:Invent セッションの視聴

Amazon Titan Image Generator v2

画像調整、被写体の一貫性、即時のカスタマイズ、背景の削除をサポートし、フォトリアリスティックな画像を生成します

最大文字数: 512

サポート対象の入出力画像フォーマット: PNG、JPEG

言語: 英語

微調整対応: はい

サポート対象のユースケース: テキストから画像への生成、画像編集、画像バリエーション、参照画像を使用した画像調整、チューニングによる被写体の一貫性 (生成された画像内の特定の被写体を保持)、自動背景削除。

お知らせを読む 

 

動画

Amazon Titan テキストプレミアデモ (1:30)
Amazon Titan イメージジェネレータのデモ-イメージプレイグラウンド (5:53)
Amazon Titan イメージジェネレーターのウォーターマーク検出 (6:11)
AWS re:Invent 2023-Amazon Bedrock での FM によるイメージ生成と検索をご覧ください (59:23)
Amazon Titan テキストデモ (8:34)
AWS re:Invent 2023-言語タスクについては Amazon Titan をご覧ください (39:00)

動画

Amazon Titan テキストデモ (8:34)
Amazon Titan イメージジェネレータのデモ-イメージプレイグラウンド (5:53)
AWS re:Invent 2023-言語タスクについては Amazon Titan をご覧ください (39:00)
AWS re:Invent 2023-Amazon Bedrock での FM によるイメージ生成と検索をご覧ください (59:23)

Amazon Titan Image Generator の機能

Amazon Titan Image Generator を使用すると、コンテンツ作成者は迅速にアイデアを考案して反復できるため、画像を効率よく生成できます。ユーザーは、ブランドスタイルと被写体の一貫性を維持するためにモデルを安全にカスタマイズしながら、参照画像を使用して画像を作成したり、既存のビジュアルの編集、背景の削除、画像のバリエーションを生成したりできます。この強力なツールは、ワークフローを合理化し、生産性を高め、創造的なビジョンを実現します。

Amazon Titan イメージジェネレーターの機能

参照画像で ControlNet を使用して、主要なエッジと領域を保持する、まとまりのある魅力的な画像を生成します。


入力テキストプロンプト: a deer in a fairy world, tiny huts on sides, snowy winter season, sun rising, cartoon style (妖精の世界にいる鹿、両側には小さな小屋、雪の降る冬の季節、昇る太陽、漫画風)

 

参照画像:

参照画像

 

 

出力画像:

出力画像

ユーザー入力なしで、複数のオブジェクトを含む画像から背景を自動的に削除します。


入力画像:

入力画像

 

出力画像:

出力画像

モデルをファインチューニングすることで、生成されたビジュアルに被写体を簡単に統合できます


入力テキストプロンプト: Ron the dog on the moon (月にいる Ron the dog)

 

モデルのファインチューニングのための参照画像:

Ron the dog
Ron the dog

 

出力画像:

月にいる Ron the dog

新しいシーンでお気に入りの被写体を生成したり、参照画像を使用してスタイルを転送したり、ファインチューニングせずに複数の参照画像を使用してスタイルをミックスしたりできます  

入力テキストプロンプト: a dog wearing a baseball cap (野球帽をかぶった犬)


参照画像:

参照画像

 

出力画像:

出力画像

生成された画像のカラーパレットを正確に制御することで、ブランドのビジュアルアイデンティティを維持します。ファインチューニングは必要ありません。

 

入力テキストプロンプト: a jar of salad dressing in a rustic kitchen surrounded by fresh vegetables with studio lighting (スタジオ照明に照らされた中で、新鮮な野菜に囲まれ、素朴なキッチンに置かれたサラダドレッシングの瓶)

 

入力 16 進コード: ['#ff8080', '#ffb280', '#ffe680', '#e5ff80']

 

カラーコントロールされた出力画像: