搜狗输入法完全基于人工智能输入。语音输入时代会到来吗?

AI时代,输入法也可以改变。 1月27日,拥有6亿日活跃用户的搜狗输入法宣布将完全基于人工智能。新更新的AI大版本20.0更新了AI语音、AI翻译、AI写作三大主要模型。在写作方面,新版本不仅显着扩展了词汇量,更好地理解用户的意图和上下文,还为医生、律师等专业群体提供了个性化的人工智能服务,例如快速录入技术术语、快速搜索法律文章、快速查询用药说明等。至于翻译功能,新版本提供30多种语言条目的即时翻译,并支持文本和音频格式。语音 AI 是本次更新的核心。基于大规模AI语音模型开发自研,新版本提升语音识别流畅度、整体识别准确率、拨号能力ct识别准确率。新版本还引入了“从口语到书面”和易于重新混合的校对功能,为易于使用语音输入重新混合的常见问题提供候选方案和解决方法,例如“他、她、它”和“dide”。腾讯搜狗输入法大机型产品总监柴宝全在接受界面新闻采访时表示,搜狗输入法拥有超过1亿的AI用户,日均语音使用量已接近20亿,而且用户中不少是年轻群体。语音输入是20年前互联网输入法诞生以来最重要的交互创新。过去,语音输入更多的是一种辅助工具。同音异义词、情态词、方言等语音识别能力很差,需要用户经常停下来纠正。然而,大规模语言模型诞生后,AI现在已经具备了理解上下文、主动推断用户输入意图的能力,涵盖了从日常使用到一些轻办公场景。在海外,有新加坡的Typeless、硅谷创业团队开发的Wi-Fi。目前已经有很多成熟的语音输入产品,比如spr Flow。其主要功能是语音到文本的转换,主要针对中心局综合体,专注于高效生产力场景。据报道,Wispr Flow的输入效率比手动输入快3至4倍,并且可以自动准确识别和编辑。官员们表示,在 80% 的情况下,用户不需要进行任何手动更改。在中国,一家武汉初创公司推出了类似的产品“Lightning Talk”。它是设备中创新的人工智能语音输入方法,利用本地语音模型实现毫秒级识别,自动理解语义并智能过滤口语单词,从而实现更高效的输入,速度比键盘快 4 倍。您的数据保存在本地,您的隐私得到更好的保护。拉尔GE互联网公司也押注于语音输入。除搜狗输入法外,微信官方推出的微信输入法、字节跳动主推的豆宝输入法、大机型“六虎”之一的智浦推出的智浦AI输入法,都将语音输入作为参与输入法竞争的核心标签。与走SaaS路线的Wispr Flow不同,该互联网巨头的语音输入专注于日常交流,更易于使用。凭借绿色和交通优势,您可以利用自己的生态系统的紧密集成来提供更友好的跨应用体验。作为互联网基础设施的一种,大公司再次重视输入法。这背后的逻辑是,它是互联网上几乎所有行为的开始。通过高频用户交互捕获大量用户意图数据,并自然地跨应用程序。因此,输入法ds 也可以被认为是 AI 代理的原型。此前,腾讯尝试将输入法与AI搜索相结合,发现用户使用率显着提升。然而,现阶段语音输入尚未达到最终形式。柴宝全认为,语音肯定是重要的输入方式,并且会持续增长,但书写的重要性也不容忽视。打字仍然是一项非常重要的技能,至少在硬件被完全摧毁之前是这样。用户的目标是获得最佳的输入结果,实现这一目标的方法有很多种,语音不一定是唯一的选择。 “Wispr Flow 是一种非常好的格式吗?不一定。这还需要时间。目前大部分 Vibe 编码(AI 编程)都没有键盘,但这并不意味着 Vibe 编码不需要键盘。也许是因为好的键盘不会很快出现。所以我们刚刚看到了输入法演进的令人兴奋的开始,而 Mike 1 距离定义还很远。蔡宝全说:“搜狗语音输入法目前正在优化设计,做到‘快’和‘准’,绝对值得尝试。比如很多用户在安静的环境下或者忙着开车的时候使用语音输入,所以新版本提高了语音输入识别的准确率。”从2011年到现在,相信上半年语音输入主要侧重于‘所闻即所得’的表达和创意要求。 “这将是我们努力的方向。”蔡宝全说。(界面新闻)

发表回复