Skip to content
Merged
Changes from all commits
Commits
File filter

Filter by extension

Filter by extension

Conversations
Failed to load comments.
Loading
Jump to
Jump to file
Failed to load files.
Loading
Diff view
Diff view
16 changes: 8 additions & 8 deletions README.md
Original file line number Diff line number Diff line change
@@ -1,17 +1,19 @@
# MeetingAssistant

> 本项目使用微软 Azure 语音识别与翻译服务。

## 一、项目概述
- **名称**:MeetingAssistant
- **平台**:Windows (Qt6 / C++)
- **定位**:实时中文→英文会议辅助工具

## 二、功能需求
1. **语音识别(ASR)**
- 使用百度云端识别服务,捕获麦克风音频(中文)
- 使用微软 Azure 语音服务,捕获系统音频输出(中文/英文
- 实时返回识别结果

2. **文本翻译**
- 将 ASR 中文结果调用百度翻译 API,返回英文文本
- 将 ASR 结果调用微软 Azure 语音翻译服务,返回目标语言文本
- 首期仅文字显示,后续可扩展为 TTS 输出

3. **实时字幕展示**
Expand All @@ -21,7 +23,6 @@
4. **控制交互**
- “开始 / 停止” 按钮:启动或终止 ASR + 翻译流程
- 固定中→英,无需语言切换下拉
- 无需音量 / 电平指示

## 三、非功能需求
- **性能**:端到端延迟越低越好,力争实时体验
Expand All @@ -34,10 +35,9 @@
- 界面布局:按钮区 + 字幕区 + 可选配置区

### 4.2 后端
- 百度 ASR SDK / REST API
- 百度 翻译 SDK / REST API
- 微软 Azure Speech SDK(语音识别与翻译)
- 音频采集:QtMultimedia 或 WASAPI
- 配置管理:通过配置文件或环境变量提供 Baidu API Key/Secret
- 配置管理:通过配置文件或环境变量提供 Azure API Key/Region
- 日志 & 调试:记录识别、翻译、网络错误日志

## 五、UI 设计草案
Expand All @@ -48,12 +48,12 @@
- 大字号、可滚动展示的英文字幕

3. **配置区(可选)**
- API Key / Secret 输入框或 “读取配置文件” 按钮
- API Key / Region 输入框或 “读取配置文件” 按钮

## 六、构建与部署
- **依赖**:
- Qt6
- 百度 ASR & 翻译 SDK
- 微软 Azure Speech SDK
- **编译**:
- CMake + MSVC
- **发布**:
Expand Down