diff --git a/README.md b/README.md index 094cf88..1155c8a 100644 --- a/README.md +++ b/README.md @@ -1,5 +1,7 @@ # MeetingAssistant +> 本项目使用微软 Azure 语音识别与翻译服务。 + ## 一、项目概述 - **名称**:MeetingAssistant - **平台**:Windows (Qt6 / C++) @@ -7,11 +9,11 @@ ## 二、功能需求 1. **语音识别(ASR)** - - 使用百度云端识别服务,捕获麦克风音频(中文) + - 使用微软 Azure 语音服务,捕获系统音频输出(中文/英文) - 实时返回识别结果 2. **文本翻译** - - 将 ASR 中文结果调用百度翻译 API,返回英文文本 + - 将 ASR 结果调用微软 Azure 语音翻译服务,返回目标语言文本 - 首期仅文字显示,后续可扩展为 TTS 输出 3. **实时字幕展示** @@ -21,7 +23,6 @@ 4. **控制交互** - “开始 / 停止” 按钮:启动或终止 ASR + 翻译流程 - 固定中→英,无需语言切换下拉 - - 无需音量 / 电平指示 ## 三、非功能需求 - **性能**:端到端延迟越低越好,力争实时体验 @@ -34,10 +35,9 @@ - 界面布局:按钮区 + 字幕区 + 可选配置区 ### 4.2 后端 -- 百度 ASR SDK / REST API -- 百度 翻译 SDK / REST API +- 微软 Azure Speech SDK(语音识别与翻译) - 音频采集:QtMultimedia 或 WASAPI -- 配置管理:通过配置文件或环境变量提供 Baidu API Key/Secret +- 配置管理:通过配置文件或环境变量提供 Azure API Key/Region - 日志 & 调试:记录识别、翻译、网络错误日志 ## 五、UI 设计草案 @@ -48,12 +48,12 @@ - 大字号、可滚动展示的英文字幕 3. **配置区(可选)** - - API Key / Secret 输入框或 “读取配置文件” 按钮 + - API Key / Region 输入框或 “读取配置文件” 按钮 ## 六、构建与部署 - **依赖**: - Qt6 - - 百度 ASR & 翻译 SDK + - 微软 Azure Speech SDK - **编译**: - CMake + MSVC - **发布**: