浮云梦配音使用教程

本教程将详细介绍如何使用浮云梦配音的各项功能，包括文字转语音、多人对话和生成字幕。

界面功能：点击页面右上角的 🌞/🌙 按钮可切换日/夜间模式，主题设置会保存到本地，下次访问时自动应用。

一、文字转语音

文字转语音是最基础的功能，您可以将输入的文字转换为自然流畅的语音。

步骤1：输入文本

在文本输入框中输入您想要转换为语音的文字，或点击"上传文件"按钮上传txt或docx文件。

自动保存：您的输入内容会自动保存到本地，刷新页面或重新打开时会自动恢复。上传文件后也会自动保存。

插入停顿：点击"插入停顿"按钮，可在文本光标位置插入2秒停顿。如需自定义停顿时间，可手动编辑 <break time="2000ms" />（时间参数可自定义，如1000ms、3000ms等）。

步骤2：选择语言和语音

在语音设置区域，首先选择语言，然后选择您喜欢的语音。

步骤3：调整参数

您可以调整以下参数：

音量：调整语音的音量大小
语速：调整语音的播放速度
音调：调整语音的音调高低
模仿：选择语音的角色扮演效果（注意：仅部分语音支持）
风格：选择语音的情感风格（注意：仅部分语音支持）

重要提示：模仿和风格是部分语音才有的功能，如果选择的语音不支持这些功能，对应的选项会显示"无可用模仿"或"无可用风格"，这是正常现象。

生成速度说明：带HD的语音为自动识别感情的高级语音模型，生成速度较慢。如果想添加停顿可以手动在需要停顿的位置增加 <break time="5000ms" />，时间参数可以自定义。

HD 语音介绍：HD 语音是一种高级语音模型，具有情感识别能力。它可以理解输入文本的内容，自动检测文本中的情绪，并实时调整说话语调，使之与文本情绪相匹配。这种技术能够让生成的语音更加自然、富有感情，适合需要表达情感的内容，如故事讲述、情感表达等场景。

注意事项：除了SSML标签，内容中不可以出现<>，否则会生成失败。

步骤4：生成语音

点击"生成语音"按钮，系统会开始处理您的请求。生成完成后，您可以在音频播放区域听到生成的语音。

文本字数限制：单次生成最多支持5000字，超过会自动截断。如需转换更长文本，请使用批量生成功能。

历史记录：生成语音后，系统会自动保存记录到历史记录中。点击"历史记录"按钮可查看所有历史，点击"重新生成"可一键填充所有参数到表单，方便修改后重新生成。

步骤5：下载语音

点击"下载语音"按钮，将生成的语音文件保存到本地。

历史下载：在历史记录中也可以下载之前的音频。如音频已失效（后台已清理），会提示您重新生成。

二、批量生成

当文本超过5000字时，可使用批量生成功能。

步骤1：进入批量生成页面

点击导航栏中的"批量生成"进入专门的长文本处理页面。

步骤2：输入或上传长文本

在文本输入框中输入长文本，或点击"上传文件"按钮上传txt或docx文件。

自动保存：输入内容会自动保存到本地，刷新页面会自动恢复。

步骤3：设置参数

选择语言、语音，设置音量、语速、音调等参数。

步骤4：生成语音

点击"生成语音"按钮，系统会自动将长文本分段，为每段生成语音，最后合并成一个完整的音频文件。

说明：如果文本中包含换行符，系统会保留段落结构，按照换行分段处理。

步骤5：下载语音

生成完成后，点击"下载语音"按钮将合并后的完整音频保存到本地。

三、多人对话

多人对话功能允许您创建多角色对话，每个角色可以选择不同的语音风格。

步骤1：添加角色

在使用多人对话功能之前，您需要先在文字转语音页面添加角色：

进入文字转语音页面
选择语言和语音
调整音量、语速、音调等参数
点击"角色配置"按钮
在弹出的角色配置窗口中，输入角色名称
点击"保存当前配置为角色"按钮

步骤2：创建对话段落

进入多人对话页面后，您可以：

点击"添加段落"按钮添加新的对话段落
为每个段落选择一个已保存的角色
在文本框中输入对话内容

步骤3：生成对话

点击"生成对话"按钮，系统会为每个段落生成语音，然后将它们拼接成一个完整的对话音频。

步骤4：下载对话

点击"下载语音"按钮，将生成的对话音频保存到本地。

四、生成字幕

生成字幕功能可以为您的音频文件创建对应的字幕文件。

步骤1：生成音频

首先，您需要生成一个音频文件（使用文字转语音或多人对话功能）。

步骤2：生成字幕

音频生成完成后，点击"生成字幕"按钮，系统会为您的音频创建字幕。

步骤3：下载字幕

字幕生成完成后，点击"下载字幕"按钮，将生成的字幕文件保存到本地。

五、语音克隆

语音克隆功能允许您上传一段语音样本，系统会学习并模仿该语音的特征，生成具有相似音色的语音。

步骤1：进入语音克隆页面

点击导航栏中的"语音克隆"进入语音克隆页面。

步骤2：上传语音样本

点击"上传语音文件"按钮，选择一个包含清晰人声的音频文件。

注意事项：

支持的格式：MP3、WAV
建议时长：5-30秒
语音内容：清晰的普通话或英语朗读
避免背景噪音和音乐

步骤3：输入文本

在文本输入框中输入您想要转换为克隆语音的文字。

字数限制：单次生成最多支持1000字。

步骤4：生成克隆语音

点击"生成克隆语音"按钮，系统会先分析您上传的语音样本，然后生成模仿该语音的新音频。

处理时间：语音克隆需要一定的处理时间，请耐心等待。

步骤5：下载语音

生成完成后，点击"下载语音"按钮将克隆语音保存到本地。

六、语音转换

语音转换功能可以将已有音频转换为不同的音色，保留原始语速、停顿和情感。

步骤1：进入语音转换页面

点击导航栏中的"语音转换"进入语音转换页面。

步骤2：上传音频文件

点击"上传音频文件"按钮，选择要转换的音频文件。

支持格式：MP3、WAV、OGG、FLAC、M4A、WebM，单个文件不超过 20MB。

建议：使用清晰的语音音频以获得最佳效果。

步骤3：选择目标音色

在音色选择区域，按语言筛选并选择您想要的目标音色。点击音色可以试听。

步骤4：生成并下载

点击"开始转换"按钮，系统会将音频转换为目标音色。转换完成后点击"下载"按钮保存。

注意：上传和转换的音频会定期自动清理，请及时下载。

七、字幕工具

字幕工具提供 AI 校准、双语字幕生成、格式转换三大功能，一站式处理字幕需求。

功能一：AI字幕校准

上传字幕文件和原始文案，AI 会智能修正语音识别产生的同音字错别字。可选"消除句末标点"选项。支持 SRT、ASS、VTT 格式。

功能二：双语字幕生成

上传字幕文件，选择目标语言，即可生成双语字幕。支持中文、英文、日文、韩文、德文、法文六种语言任意两种组合。

功能三：格式转换

支持 SRT、ASS、VTT 三种格式互转。ASS 格式提供 6 种预设特效样式：经典白字黑边、霓虹发光、渐变彩色、阴影立体、卡拉OK 高亮、电影字幕风。所有转换严格保持时间轴不变。

八、音色设计

音色设计功能允许您通过文字描述或上传音频来创建个性化的 AI 音色。

方式一：文字描述生成音色

在文本框中描述您想要的音色特征，如"温柔甜美的女声"。也可以使用快速标签预设（温柔女声、磁性男声、活泼少女、沉稳大叔、稚嫩童声、苍老长者）。

还可以进一步设置情绪语气、语速节奏和角色人设等参数。

方式二：上传音频克隆音色

点击录音按钮录制或上传参考音频（MP3/WAV，最大 10MB），系统会克隆该音色。

步骤3：输入合成文本并生成

在文本框中输入想要朗读的文字（最多 500 字），点击"生成"按钮。系统会使用您创建的音色合成语音。

智能润色：点击"AI润色"按钮可自动优化文本使其更适合朗读。

九、AI音乐

AI音乐功能可以通过文字描述一键创作原创音乐。

步骤1：选择模式

选择"纯音乐"或"带歌词"模式。纯音乐模式为实验性功能，可能不稳定。

步骤2：描述音乐风格

在"音乐风格"文本框中描述您想要的音乐风格，如"轻快的流行电子音乐，带有合成器和鼓点"。可以参考预设的 9 种风格示例。

步骤3：输入歌词（带歌词模式）

在"歌词内容"文本框中输入歌词。可以使用结构标签控制歌曲结构：[intro]引子、[verse]主歌、[pre-chorus]预副歌、[chorus]副歌、[bridge]桥段、[outro]结尾等。可以参考预设的歌词示例模板。

步骤4：生成并下载

点击"生成音乐"按钮，等待约 30-120 秒。生成完成后可选择 MP3 或 WAV 无损格式下载。

十、AI绘图

AI绘图功能可以通过文字描述生成高质量图片。

步骤1：选择模式

选择"文生图"（纯文字生成）或"图片编辑"（上传参考图+文字修改）模式。

步骤2：输入描述

在描述框中详细描述您想要的图片内容。支持专业摄影描述词（如相机型号、镜头参数、光线条件、构图方式）。可以参考预设的 6 种示例提示词。

步骤3：选择尺寸并生成

选择图片尺寸（自动、1:1、3:2、2:3、2K、16:9、4K横、4K竖共 8 种），点击"生成"按钮。

次数限制：未登录用户每日免费 5 次。

十一、常见问题

为什么有些语音没有模仿和风格选项？
答：模仿和风格是部分语音才有的功能，不同的语音支持的功能可能不同。
为什么多人对话页面提示需要先添加角色？
答：多人对话需要使用已保存的角色配置，所以在使用多人对话功能之前，您需要先在文字转语音页面添加角色。
如何删除已保存的角色？
答：在文字转语音页面，点击"角色配置"按钮，在弹出的角色配置窗口中，找到您想要删除的角色，点击删除按钮即可。
生成的音频文件会保存多久？
答：为了保护用户隐私，生成的音频和字幕文件会定期清理（10分钟），建议您及时下载保存。
一直生成失败如何查错？
答：一直生成失败一般是内容有问题，可能的原因包括：1. 选择了外语但输入了中文内容；2. 内容中包含不是SSML标签的<>符号；3. 内容中包含非文字编码的内容。建议检查输入文本，确保内容符合要求。
多音字读错怎么办？
答：目前多音字纠正功能还在计划中，当前可以使用手动替换的方法处理。第1个方法较简单，直接替换成目标读音的中文字，例如"一行行"，替换成"一航航"。

安全登录

邮箱注册

忘记密码

浮云梦配音使用教程

一、文字转语音

步骤1：输入文本

步骤2：选择语言和语音

步骤3：调整参数

步骤4：生成语音

步骤5：下载语音

二、批量生成

步骤1：进入批量生成页面

步骤2：输入或上传长文本

步骤3：设置参数

步骤4：生成语音

步骤5：下载语音

三、多人对话

步骤1：添加角色

步骤2：创建对话段落

步骤3：生成对话

步骤4：下载对话

四、生成字幕

步骤1：生成音频

步骤2：生成字幕

步骤3：下载字幕

五、语音克隆

步骤1：进入语音克隆页面

步骤2：上传语音样本

步骤3：输入文本

步骤4：生成克隆语音

步骤5：下载语音

六、语音转换

步骤1：进入语音转换页面

步骤2：上传音频文件

步骤3：选择目标音色

步骤4：生成并下载

七、字幕工具

功能一：AI字幕校准

功能二：双语字幕生成

功能三：格式转换

八、音色设计

方式一：文字描述生成音色

方式二：上传音频克隆音色

步骤3：输入合成文本并生成

九、AI音乐

步骤1：选择模式

步骤2：描述音乐风格

步骤3：输入歌词（带歌词模式）

步骤4：生成并下载

十、AI绘图

步骤1：选择模式

步骤2：输入描述

步骤3：选择尺寸并生成

十一、常见问题