Skip to content

Conversation

@zyumo777
Copy link

@zyumo777 zyumo777 commented Nov 12, 2025

更改说明

  • 添加了 Piper TTS 的完整安装指南
  • 包括安装步骤、模型下载、配置说明
  • 参考了现有 TTS 文档的风格和格式

更改内容

  • 新增 Piper TTS 章节
  • 提供了推荐的中文、英文、日文模型
  • 添加了详细的配置参数说明

追加的更新

新增 Fire Red ASR 模型使用教程

  • 添加了 Fire Red ASR 模型的完整使用指南
  • 包括模型下载、配置说明
  • 说明了 CPU/CUDA 推理的配置差异

@gemini-code-assist
Copy link

Summary of Changes

Hello @zyumo777, I'm Gemini Code Assist1! I'm currently reviewing this pull request and will post my feedback shortly. In the meantime, here's a summary to help you and other reviewers quickly get up to speed!

此拉取请求旨在通过引入 Piper TTS 的全面文档来增强项目的文本转语音(TTS)功能。它为用户提供了关于如何安装、配置和使用 Piper TTS 的详细指导,该系统以其本地化、快速和多语言支持而闻名。这些更改将使用户能够更轻松地集成和利用 Piper TTS,从而改善整体用户体验。

Highlights

  • 新增 Piper TTS 安装指南: 为 Piper TTS 添加了完整的安装指南,包括安装步骤、模型下载和详细的配置说明。
  • 推荐多语言模型: 提供了中文、英文和日文的推荐 Piper TTS 模型,并说明了下载方式和文件存放位置。
  • 详细配置参数: 新增了 conf.yaml 中 Piper TTS 的详细配置参数示例,涵盖了模型路径、语速、音量等多个控制选项。
  • Piper TTS 特点概述: 总结了 Piper TTS 的主要特点,如完全本地化、CPU 实时推理、多语言支持和可选的 GPU 加速。
Using Gemini Code Assist

The full guide for Gemini Code Assist can be found on our documentation page, here are some quick tips.

Invoking Gemini

You can request assistance from Gemini at any point by creating a comment using either /gemini <command> or @gemini-code-assist <command>. Below is a summary of the supported commands on the current page.

Feature Command Description
Code Review /gemini review Performs a code review for the current pull request in its current state.
Pull Request Summary /gemini summary Provides a summary of the current pull request in its current state.
Comment @gemini-code-assist Responds in comments when explicitly tagged, both in pull request comments and review comments.
Help /gemini help Displays a list of available commands.

Customization

To customize Gemini Code Assist for GitHub experience, repository maintainers can create a configuration file and/or provide a custom code review style guide (such as PEP-8 for Python) by creating and adding files to a .gemini/ folder in the base of the repository. Detailed instructions can be found here.

Limitations & Feedback

Gemini Code Assist may make mistakes. Please leave feedback on any instances where its feedback is incorrect or counter productive. You can react with 👍 and 👎 on @gemini-code-assist comments. If you're interested in giving your feedback about your experience with Gemini Code Assist for Github and other Google products, sign up here.

You can also get AI-powered code generation, chat, as well as code reviews directly in the IDE at no cost with the Gemini Code Assist IDE Extension.

Footnotes

  1. Review the Privacy Notices, Generative AI Prohibited Use Policy, Terms of Service, and learn how to configure Gemini Code Assist in GitHub here. Gemini can make mistakes, so double check it and use code with caution.

Copy link

@gemini-code-assist gemini-code-assist bot left a comment

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Code Review

本次 PR 添加了 Piper TTS 的完整安装指南,内容清晰,结构合理。我对文档中的一些细节提出了一些改进建议,旨在让用户能更轻松地完成配置,避免潜在的困惑。主要包括:明确自动下载模型方式的缺点、为 GPU 配置提供更清晰的指引,以及在示例配置中增加更多上下文信息。

- 方式一:手动下载
- 中文模型:[https://huggingface.co/csukuangfj/vits-piper-zh_CN-huayan-medium/tree/main](https://huggingface.co/csukuangfj/vits-piper-zh_CN-huayan-medium/tree/main)
- 其他模型:在 [Hugging Face](https://huggingface.co/models) 搜索 "piper" 或自行训练
- 方式二:使用命令自动下载(不推荐)

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

medium

建议在此处说明为什么不推荐使用命令自动下载。这可以帮助用户理解背后的原因并避免潜在的配置问题。例如,该命令可能会将模型下载到系统默认的缓存目录,而不是项目所需的 models/piper/ 目录,导致后续步骤失败。

Suggested change
- 方式二:使用命令自动下载(不推荐)
- 方式二:使用命令自动下载(不推荐,因其会将模型下载至系统缓存目录,而非项目所需的 `models/piper/` 目录

3. 在 `conf.yaml` 中配置:
```yaml
piper_tts:
model_path: "models/piper/zh_CN-huayan-medium.onnx" # ONNX 模型文件路径

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

medium

示例配置中的模型路径硬编码为中文模型 zh_CN-huayan-medium.onnx。为了方便使用其他语言(如文档前面推荐的英文或日文模型)的用户,建议在注释中提供一个其他语言模型的路径作为示例,或使用更通用的占位符。这可以避免用户直接复制粘贴配置后,因模型语言不匹配而产生困惑。

Suggested change
model_path: "models/piper/zh_CN-huayan-medium.onnx" # ONNX 模型文件路径
model_path: "models/piper/zh_CN-huayan-medium.onnx" # ONNX 模型文件路径(例如,英文为 "models/piper/en_US-lessac-medium.onnx")

noise_w: 0.8 # 说话风格变化程度(0.0-1.0)
volume: 1.0 # 音量(0.0-1.0)
normalize_audio: true # 是否标准化音频
use_cuda: false # 是否使用 GPU 加速(需要 CUDA 支持)

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

medium

此处提到了 use_cuda 选项,但没有提供如何配置 CUDA 环境的具体指引。为了帮助用户成功启用 GPU 加速,建议添加一个链接,指向文档中关于设置 CUDA 的详细说明(例如,可以参考 sherpa-onnx 部分的 CUDA 配置指南)。

Suggested change
use_cuda: false # 是否使用 GPU 加速(需要 CUDA 支持)
use_cuda: false # 是否使用 GPU 加速(需要 CUDA 支持,配置方法请参考 [CUDA推理](/docs/user-guide/backend/asr#cuda-推理)

@zyumo777 zyumo777 changed the title docs: 添加 Piper TTS 安装指南 docs: 添加 Piper TTS 安装指南 AND docs: 添加 Fire Red ASR 模型使用教程 Nov 28, 2025
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Labels

None yet

Projects

None yet

Development

Successfully merging this pull request may close these issues.

1 participant