什么是 Amazon Polly?
Amazon Polly 是一项完全托管的服务,可按需生成语音,将任何文本转换为音频流。使用深度学习技术转换文章、网页、PDF 文档和其他文本转语音 (TTS)。Polly 以多种语言提供数十种逼真的语音,供您构建可进行互动和转换的语音激活应用程序。满足不同地域和市场用户的语言多样化、无障碍和学习的需求。强大的神经网络和生成式语音引擎在后台为您合成语音。将 Amazon Polly API 集成到您的现有应用程序中,快速实现语音功能。
功能
Amazon Polly 具有多种功能,包括下列的一些功能
逼真的声音
以一贯的快速响应速度提供对话式用户体验。
在请求 Amazon Polly 输出时,您可以从数十种逼真的声音和各种语言中进行选择。每种语音都是由母语者创建,即使在同一语言中也有不同的声音。大多数语言都包含一种或多种男声和女声,因此您可以选择最适合您用例的声音。
可自定义的输出
根据需要自定义和控制语音输出
Amazon Polly 允许您创建自定义的文本转语音输出,以吸引和留住受众的注意力。使用自定义词典修改首字母缩略词、公司名称、内部术语或您选择的任何其他词语的发音。Amazon Polly 的语音合成标记语言 (SSML) 标签还允许您调整重音、语调、措辞和风格。生成最适合您业务的语音 AI 输出。
生成式人工智能力量
以低廉的成本访问内置的生成式人工智能功能
Amazon Polly 支持多种语音引擎,您可以选择将文本转换为语音。该引擎部署了一个十亿参数的转换器,以增量、可流式传输的方式生成语音。这款 AI 语音生成器创建的合成语音自信、情感丰富且非常口语化,类似于真人语音。
控制与安全
以标准格式安全存储和重新分发语音
将您的文本转语音输出存储在 MP3 和 OGG 等标准音频文件中,用于重新分发、分析、存档或任何其他用例,且无需额外付费。缓存文件以便在需要时更快地检索。保障您内容的安全、信任和隐私是 AWS 的重中之重。Amazon Polly 不会保留您提交的文本内容。