免费文字转语音 - 浮云梦配音

浮云梦配音使用教程

本教程将详细介绍如何使用浮云梦配音的各项功能,包括文字转语音、多人对话和生成字幕。

界面功能:点击页面右上角的 🌞/🌙 按钮可切换日/夜间模式,主题设置会保存到本地,下次访问时自动应用。

一、文字转语音

文字转语音是最基础的功能,您可以将输入的文字转换为自然流畅的语音。

步骤1:输入文本

在文本输入框中输入您想要转换为语音的文字,或点击"上传文件"按钮上传txt或docx文件。

自动保存:您的输入内容会自动保存到本地,刷新页面或重新打开时会自动恢复。上传文件后也会自动保存。

插入停顿:点击"插入停顿"按钮,可在文本光标位置插入2秒停顿。如需自定义停顿时间,可手动编辑 <break time="2000ms" />(时间参数可自定义,如1000ms、3000ms等)。

步骤2:选择语言和语音

在语音设置区域,首先选择语言,然后选择您喜欢的语音。

步骤3:调整参数

您可以调整以下参数:

  • 音量:调整语音的音量大小
  • 语速:调整语音的播放速度
  • 音调:调整语音的音调高低
  • 模仿:选择语音的角色扮演效果(注意:仅部分语音支持)
  • 风格:选择语音的情感风格(注意:仅部分语音支持)

重要提示:模仿和风格是部分语音才有的功能,如果选择的语音不支持这些功能,对应的选项会显示"无可用模仿"或"无可用风格",这是正常现象。

生成速度说明:带HD的语音为自动识别感情的高级语音模型,生成速度较慢。如果想添加停顿可以手动在需要停顿的位置增加 <break time="5000ms" />,时间参数可以自定义。

HD 语音介绍:HD 语音是一种高级语音模型,具有情感识别能力。它可以理解输入文本的内容,自动检测文本中的情绪,并实时调整说话语调,使之与文本情绪相匹配。这种技术能够让生成的语音更加自然、富有感情,适合需要表达情感的内容,如故事讲述、情感表达等场景。

注意事项:除了SSML标签,内容中不可以出现<>,否则会生成失败。

步骤4:生成语音

点击"生成语音"按钮,系统会开始处理您的请求。生成完成后,您可以在音频播放区域听到生成的语音。

文本字数限制:单次生成最多支持5000字,超过会自动截断。如需转换更长文本,请使用批量生成功能

历史记录:生成语音后,系统会自动保存记录到历史记录中。点击"历史记录"按钮可查看所有历史,点击"重新生成"可一键填充所有参数到表单,方便修改后重新生成。

步骤5:下载语音

点击"下载语音"按钮,将生成的语音文件保存到本地。

历史下载:在历史记录中也可以下载之前的音频。如音频已失效(后台已清理),会提示您重新生成。

二、批量生成

当文本超过5000字时,可使用批量生成功能。

步骤1:进入批量生成页面

点击导航栏中的"批量生成"进入专门的长文本处理页面。

步骤2:输入或上传长文本

在文本输入框中输入长文本,或点击"上传文件"按钮上传txt或docx文件。

自动保存:输入内容会自动保存到本地,刷新页面会自动恢复。

步骤3:设置参数

选择语言、语音,设置音量、语速、音调等参数。

步骤4:生成语音

点击"生成语音"按钮,系统会自动将长文本分段,为每段生成语音,最后合并成一个完整的音频文件。

说明:如果文本中包含换行符,系统会保留段落结构,按照换行分段处理。

步骤5:下载语音

生成完成后,点击"下载语音"按钮将合并后的完整音频保存到本地。

三、多人对话

多人对话功能允许您创建多角色对话,每个角色可以选择不同的语音风格。

步骤1:添加角色

在使用多人对话功能之前,您需要先在文字转语音页面添加角色:

  1. 进入文字转语音页面
  2. 选择语言和语音
  3. 调整音量、语速、音调等参数
  4. 点击"角色配置"按钮
  5. 在弹出的角色配置窗口中,输入角色名称
  6. 点击"保存当前配置为角色"按钮

步骤2:创建对话段落

进入多人对话页面后,您可以:

  • 点击"添加段落"按钮添加新的对话段落
  • 为每个段落选择一个已保存的角色
  • 在文本框中输入对话内容

步骤3:生成对话

点击"生成对话"按钮,系统会为每个段落生成语音,然后将它们拼接成一个完整的对话音频。

步骤4:下载对话

点击"下载语音"按钮,将生成的对话音频保存到本地。

四、生成字幕

生成字幕功能可以为您的音频文件创建对应的字幕文件。

步骤1:生成音频

首先,您需要生成一个音频文件(使用文字转语音或多人对话功能)。

步骤2:生成字幕

音频生成完成后,点击"生成字幕"按钮,系统会为您的音频创建字幕。

步骤3:下载字幕

字幕生成完成后,点击"下载字幕"按钮,将生成的字幕文件保存到本地。

五、语音克隆

语音克隆功能允许您上传一段语音样本,系统会学习并模仿该语音的特征,生成具有相似音色的语音。

步骤1:进入语音克隆页面

点击导航栏中的"语音克隆"进入语音克隆页面。

步骤2:上传语音样本

点击"上传语音文件"按钮,选择一个包含清晰人声的音频文件。

注意事项:

  • 支持的格式:MP3、WAV
  • 建议时长:5-30秒
  • 语音内容:清晰的普通话或英语朗读
  • 避免背景噪音和音乐

步骤3:输入文本

在文本输入框中输入您想要转换为克隆语音的文字。

字数限制:单次生成最多支持1000字。

步骤4:生成克隆语音

点击"生成克隆语音"按钮,系统会先分析您上传的语音样本,然后生成模仿该语音的新音频。

处理时间:语音克隆需要一定的处理时间,请耐心等待。

步骤5:下载语音

生成完成后,点击"下载语音"按钮将克隆语音保存到本地。

六、常见问题

  • 为什么有些语音没有模仿和风格选项?
    答:模仿和风格是部分语音才有的功能,不同的语音支持的功能可能不同。
  • 为什么多人对话页面提示需要先添加角色?
    答:多人对话需要使用已保存的角色配置,所以在使用多人对话功能之前,您需要先在文字转语音页面添加角色。
  • 如何删除已保存的角色?
    答:在文字转语音页面,点击"角色配置"按钮,在弹出的角色配置窗口中,找到您想要删除的角色,点击删除按钮即可。
  • 生成的音频文件会保存多久?
    答:为了保护用户隐私,生成的音频和字幕文件会定期清理(10分钟),建议您及时下载保存。
  • 一直生成失败如何查错?
    答:一直生成失败一般是内容有问题,可能的原因包括:1. 选择了外语但输入了中文内容;2. 内容中包含不是SSML标签的<>符号;3. 内容中包含非文字编码的内容。建议检查输入文本,确保内容符合要求。
  • 多音字读错怎么办?
    答:目前多音字纠正功能还在计划中,当前可以使用手动替换的方法处理。第1个方法较简单,直接替换成目标读音的中文字,例如"一行行",替换成"一航航"。