日前,ElevenLabs 推出了一项激动人心的新功能 —— 语音设计,用户可以通过简单的文字提示来创建完全独特的声音。

官网入口:https://elevenlabs.io/voice-design

​ElevenLabs推声音设计功能,文字提示就能创建独特的声音

虽然ElevenLabs 的语音库有3,000个高质量的语音,而且还在不断增加,但当用户仍找不到满意的声音效果时,语音设计可以帮助填补空白。

 

之前,虽然市面上已经有一些文本到语音的选择,但大多听起来相对机械,而 ElevenLabs 的技术可以让你在几秒钟内设计出一种全新的声音。比如你要创建《龙与地下城》这样的游戏角色声音时,就能够根据角色的背景和特征提示词,用ElevenLabs 迅速创造出一个合适的声音,那将是多么酷的体验!

这种新工具不仅能够帮助玩家丰富他们的游戏故事,还能让独立开发者在制作游戏时,拥有更大的灵活性。

ElevenLabs 展示的功能表明,越详细的提示,生成的声音就会越贴近你的需求,比如描述年龄、口音、性别、语调和音调,或者尝试使用食人魔、精灵和外星人等虚构人物。

如果你想要一个 “有点沙哑、深沉的英国男性声音,既专业又放松、带点权威感”,只需简单描述,系统就能快速生成一个满足这些特质的声音。

 

声音设计功能对需要特定角色声音的创作者来说,无疑是个巨大的福音。通过将这个语音设计功能与 AI 视频生成工具结合使用,像电影专业的学生这样的创作者,可以在同一个项目中构建角色、设置场景、制作对话,实现更多的创作自由。官方表示,该声音设计功能 API 将在1周内推出。

以下是官方给出的语音设计提示指南

语音设计类型

类型 描述 示例提示
逼真的声音设计 通过指定年龄、口音/国籍、性别、声调、音高、语调、速度和情感来创建原始、逼真的声音。 – “一位年轻的印度女性,声音柔和高亢。谈话时,语速缓慢而平静。”- “一位年长的英国男性,声音沙哑低沉。专业、放松而自信。”

– “一位中年澳大利亚女性,声音温暖低沉。工作时,语速很快,心情愉快。”

角色配音设计 使用更简单的提示为创意角色生成独特的声音。 – “一个巨大的邪恶食人魔,巨魔”- “一只活泼的小吱吱叫的老鼠”

– “一个愤怒的老海盗,大喊大叫”

我们成功制作的其他角色包括妖精、吸血鬼、精灵、巨魔、狼人、幽灵、外星人、巨人、女巫、巫师、僵尸、恶魔、魔鬼、海盗、精灵、食人魔、兽人、骑士、武士、女妖、雪人、德鲁伊、机器人、精灵、猴子、怪物、德古拉

语音属性

属性 重要性 选项
年龄 高度重要 年轻人、青少年、成年人、中年人、老年人等等……
口音/国籍 高度重要 英国、印度、波兰、美国等等……
性别 高度重要 男性、女性、中性
语气 不需要 粗哑的、柔软的、温暖的、刺耳的等等……
沥青 不需要 深沉、低沉、高沉、吱吱作响等等……
语调 不需要 对话式、专业式、企业式、都市式、时尚式等等……
速度 不需要 快、敏捷、慢、放松等等……
情感/传递 不需要 愤怒、平静、害怕、快乐、自信、窃窃私语、大喊大叫等……