Skip to content

无法输入,识别结果仅写入到了剪贴板,没有粘贴。 #3

@HaujetZhao

Description

@HaujetZhao

仅写入到了剪贴板。没有粘贴。

[19:18:09] AudioRecorder: 纯内存录音开始
[ERROR] [19:18:11] 识别过程出错: OpenClipboard 失败 (0x800401D0 (CLIPBRD_E_CANT_OPEN))
   at System.Runtime.InteropServices.Marshal.ThrowExceptionForHR(Int32 errorCode, IntPtr errorInfo)
   at System.Windows.Clipboard.Flush()
   at VoiceSnap.MainWindow.<>c__DisplayClass25_0.<StopRecording>b__4()
   at System.Windows.Threading.Dispatcher.Invoke(Action callback, DispatcherPriority priority, CancellationToken cancellationToken, TimeSpan timeout)
   at System.Windows.Threading.Dispatcher.Invoke(Action callback)
   at VoiceSnap.MainWindow.StopRecording()

见到有这样的项目很开心,终于有人注意到这样的需求了。之前因为没有人写这样的软件,我是自己写了一个 CapsWriter ,用了 paraformer 实现,该有的功能都写上了,但我能力有限,没有做GUI。

回到这个软件,说一下我遇到的问题。

首先就是这个 issue 的,输入不了,我不确定是什剪贴板出了什么问题,应该比较容易解决。不过,我建议提供第二套输入方式,alt+keycode,实现方式应该能在 keyboard 中找到 ,这样,在同花顺一类软件中才能检测到输入的文字。

另外,注意到,从 UI 反应上,好像识别速度有些慢,松开按键后的转录时延有1秒以上。但具体速度不确定,建议在 log 中加入:录音识长、识别用时。我之前测试,sherpa-onnx 用 DirectML 处理 paraformer 是要比纯 CPU 要不少的。默认的 DirectML 是用的集显,独显的效果我忘了。

录音历史可以保留下,供用户试听,检查麦克风录音的效果、排除音频系统错误。

从介绍看,兄似乎有志于用 Fun ASR Nano 代替当前正在用的 SenseVoice,祝顺利!

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions