语音转文字输入法哪个好用(语音转文字软件免费的哪个最好用)
语音转文字输入法哪个好用
1.从XP时代开始,我就幻想用语音转文字。后来手机提前实现了这个功能,但是电脑端的语音输入一直没有进展。
2.为了能够在PC上用语音打字,我从2013年到2022年,体验了各种硬件和软件,最终找到了最适合PC的语音输入方案。
3.2013年,科大讯飞推出了PC版输入法。我以为PC语音输入的时代已经到来,所以我买了十几个小麦克风,尝试将语音转换为文本。
4.可测试的结果令人惊讶,语音识别的准确率异常低。即使我把Mai放在嘴里,我仍然不能清楚地记录它,并且80%以上的内容被错误地识别。
识别率低让我怀疑麦克风的接收有问题。如果你想打字,你需要换一个更好的麦克风。但我缺钱,不得不停止尝试。
语音转文字输入法哪个好用6.几年后,当经济较为富裕时,我订购了在线名人录音麦克风Blue Yeti,想象着4位数的麦克风可以带来完美的收音机识别效果。蓝色雪人
7.但事实是,它又受到了打击。
8.在Blue Yeti的无线电测试中,再次发现大量噪音,并在收货当天直接将其退回。
9.十几元的麦克风和千元的麦克风收音效果差不多,语音输入的识别率也极低。这让我猜测语音输入识别率低与硬件无关,而是PC上的语音输入方案不成熟,是软件导致的问题。
10.就这样,我再次暂停了PC上的语音输入尝试。
11.之后,用了五年的音箱出了问题。我升级了音响,增加了外接声卡,大大提升了视听体验。玩着玩着,我突然想起了我的语音输入梦,决定再试一次。
12.有了外置声卡,麦克风的选择就多了很多,你还可以用cannon line接口连接麦克风。
13.麦克风分为两类:电容式麦克风和动圈式麦克风。
14.电容话筒的收音效果很好,但更精致。它害怕潮水和落潮。您不能使用桌面麦克风支架。它适合悬臂悬挂在空中,每次使用后都需要放好。动态小麦的灵敏度和还原性比电容小麦低,因此对存储和使用没有要求,成本也会更低。
15.电容麦克风太麻烦了,所以我选择了一个简单的动圈麦克风-舒伯乐PRO248S。
16.选择麦克风后,为其配备麦克风支架和机关炮线缆,并连接原装外置声卡以完成语音输出的硬件配置。无线电设备
17.音频硬件搞定后,开始折腾语音输入法。
18.尽管科大讯飞是语音输入领域最知名的品牌,但科大讯飞的PC输入法一直不受重视,多年来一直没有更新。于是,我尝试了其他输入法的语音功能。在测试中,搜狗的语音识别功能不弱于科大讯飞,唯一的缺点是无法设置语音输入快捷键,因此整体体验良好。因此,语音输入法被切换到搜狗。
19.然而,一旦我备份了系统设置,我发现搜狗有多达27万个词库,其中99%是垃圾条目,甚至偶尔输入一次的内容也被输入法记录下来。更可怕的是,这个词库无法从云端删除。只要你进去过一次,搜狗就会永远记住它。
20.这不是输入法,而是键盘录音机。
21.中国的其他输入法在这方面几乎相同。为了不被键盘录音机错过,我只能改用开源输入法。
22.语音输入切换到开源的Quick Cut,使用阿里云和腾讯云的商用语音接口,识别率高于免费的搜狗和讯飞。快捷界面
23.Quick Cut的缺点:语音输入时要一直按大写键,不适合长时间语音输入;触发键无法更改,大写键与我的常用脚本冲突。因此,长时间的语音输入只能借助手机上的飞书进行转录。
24.面对Quick Cut的长语音输入问题,@李乐推荐微软语音输入——用语音打字来说话,而不是在电脑上打字。微软自带的语音输入,快捷键win+H. 3元麦克风,50 cm外,极低的声音念出来。
25.经过测试,我发现微软语音输入真的很容易使用,甚至有点吓人。测试期间,我临时有事要做。我去另一个房间和我的家人说话。当我回来时,我发现我刚才的对话被微软语音输入正确识别了。Microsoft语音输入
26.微软的语音输入非常灵敏,在很远的距离和很低的声音都可以识别。因此,我不必移动麦克风进行语音输入,并且我可以继续将麦克风放在不会阻挡我视线的远处角落。
27.“语音打字功能在此应用中受到限制”出现在Notepad++和微信中,但Visual Studio代码没有出现,但实际上,此提示对语音输入没有影响,因此您通常可以忽略此提示。
28.虽然微软语音输入的识别率只有85%,还不如阿里云的95%,但该系统的优势太明显了,微软语音输入的体验非常流畅。
29.启动快捷键Win+H,语音识别将立即启动。如果中途没有说话,应用程序将自动暂停,整理之前的输入,并插入适当的标点符号。如果停止超过一分钟,语音识别将暂停并等待它再次启动。换句话说,微软语音输入可以一键完成长语音输入。
30.之前的麦克风在放置时发生故障,因此我没有测量@李乐提到的低成本麦克风的语音输入效果。但是,微软输入的软件优化得非常好。根据目前的效果,推测一个便宜的麦克风也可以实现完美的无线电接收。总的来说,微软语音输入是目前最完善、最兼容的语音输入方案。
31.语音输入的三种方案:文章输入:微软语音输入+外置声卡+动圈麦克风,兼容性最高,简单易用,但准确度一般,用于文章的草稿阶段。一句话输入:快切+外置声卡+动圈麦克风,识别准确率最高,适合聊天。语音转写:飞书+手机,录音转文字,长语音识别率超高。
32.与2018年相比,2022年的语音输入方案改进了很多。硬件不再是问题,便宜的麦克风也能满足语音输入标准。语音识别取得了显著的进步。在AI技术的帮助下,短句的识别率从90%提高到95%,长句的识别率从50%提高到70%,并且可以正确插入标点符号。
33.目前,语音输入算法正在提高最后10%的准确率,我们期待“听写和键盘输入完全一致”的那一天早日到来。
34.最新文章链接:等了十年,可以在PC端使用的语音输入方案来了。