Login

159-8989-6529imesports@gxyyjt.com

  1. 首页 > 新闻动态 > 行业资讯

IM电竞讯飞输入法语音输入升级现真功能,不仅高效准确,还能畅所欲言

作者:佚名 日期:2024-04-16 12:13:23 点击数:

当谈论人工智能(AI)时,我们通常会看到世界上的机器人、计算机视觉、自动驾驶等。 影视剧更是夸张,动不动就出现AI威胁论等情节。 但事实上,AI应用并不局限于这些看似“高端”的领域。 相反,它们已经逐渐成为大多数人的“触手可及”,比如手机输入法。 近日,讯飞输入法新版支持中英文混合语音输入,并优化了普通话和七种方言口音的混合语音输入效果。 “用词而不用手”的未来指日可待。

语音输入软件哪个好_语音输入软件好用吗_语音输入好用的输入法

如今,语音输入又快又准,似乎没有什么毛病。 根据最新的第三方输入法报告显示,用户不仅要求“高效、准确”的语音输入,还要求“简单、便捷”。 打个比方,如果你在工作时时不时说中文和英文,那么当你回到家时,你自然会把普通话和家乡话混合起来! 所以你上班说话的时候就切换到英语识别模式,回家的时候就切换到相应的方言模式。 如果想要达到“雅俗共赏”的传播效果,可能会很麻烦。 需要手动在中文和英文、英文和中文、普通话和方言、方言和普通话、英语和方言之间来回切换。

语音输入好用的输入法_语音输入软件哪个好_语音输入软件好用吗

众所周知,科大讯飞输入法的语音输入速度为每分钟400字,语音识别准确率高达98%,支持23种方言语音输入。 近期推出语音输入“随心所欲”,解决了频繁切换识别模式的痛点。 此次“随心所欲说”实现了中英文混合语音输入,还优化了东北话/天津话/河南话/河北话/山东话/皖北话/四川等七种方言的混合语音输入效果方言和普通话。 你是怎么做到的?

据悉,科大讯飞输入法基于深度全序列卷积神经网络语音识别框架,用扩张卷积替代传统卷积,使每个卷积输出包含更广泛的信息,从而使模型能够实现更广泛的识别。语音中长期相关性的精确表示。 同时,还引入了基于长短期记忆网络的门控机制,使得CNN在长期相关建模过程中能够快速滤除噪声等干扰信息,增强上下文等长期信息,从而在实际应用中能够保证复杂场景下的语音识别效果。

另外重要的一点是CNN模型真正实现了端到端的建模。 之前的CTC等端到端建模方案已经可以在输出端直接输出汉字,实现了一定的效果提升。 然而,在输入端仍然采用人工设计的特征,在特殊场景下不可避免地会丢失信息。 科大讯飞此次直接对原始音频波形进行建模,避免了人工设计的特征提取流程带来的信息丢失,真正实现了端到端建模,进一步提升了识别效果。

从实用角度来看,CNN的新一代语音识别框架克服了DFCNN模型参数量大、计算复杂的问题,并且相对容易实现大规模并行运算。 在保证识别效果不损失的同时,系统资源占用规模和计算负载同比下降60%以上,让CNN能够在手机等设备上流畅运行。 好处还包括使本地化语音识别效果更接近云端识别效果。

近两年来,人工智能无处不在,出现了许多令人惊叹的突破。 国家还正式发布了《新一代人工智能发展规划》,其中对人工智能应用投入了大量篇幅。 人工智能在现实中经常可见。 更为突出的是,科大讯飞输入法已经实现了AI技术。 科大讯飞的黑科技不再只是科幻情结。 此次,中英文等混合语音输入的“喜心讲”,可以有效增强人机交互,让大众接触和使用。 这是一个非常好的实现。


标签: 讯飞 讯飞语音
随便看看