多彩贵州网讯(本网记者 陈李育)“人们可以利用旅行翻译宝,解决旅行途中不会说、听不懂、看不懂的痛点。”5月25日上午,在2018数博会“遇见美好未来”分论坛上,搜狗IoT产品总监李健涛向参会嘉宾展示了搜狗在AI翻译领域的前沿科技成果。李健涛介绍,目前,搜狗语音识别准确率已达97%。AI在语音识别、图像识别、机器翻译等方面日渐趋于精准、接近真人水平。
2018数博会“遇见美好未来”分论坛上,演讲嘉宾就移动科技如何为大众创造更好未来分享了自己的做法及未来规划
李健涛在演讲中介绍,搜狗每日语音调用次数超3亿,峰值达3.6亿次以上,这些数据为搜狗在AI领域的发展,提供了大量的文字和语音数据支持。
而数据对人工智能至关重要。李健涛认为:“对人工智能来说,有两个重要的影响,一个是算法,一个是数据。”在算法方面,行业里面各家的差异并不大。但是人类需要通过数据训练机器,让机器懂得识别到底是什么处理机制。所以数据是很多人工智能公司能否产生重大技术突破的一个关键因素。
“对搜狗的人工智能算法来说,多年积累的海量数据帮助AI在语音识别、图像识别、机器翻译等方面日渐趋于精准、接近真人水平。”
李健涛介绍,搜狗整体人工智能布局围绕“语言”展开。主要是两大方面——语言的两种载体,一种是语音,一种是图像。“目前,搜狗语音识别准确率已达97%”。图像识别技术则收集了数十万张图像进行系统训练,最终实现了80%的图像识别高准确率,可完成对犬类、花卉等类似图片的识别。更加“黑科技”的点在于,搜狗实现了唇语的识别,支持10万+非特定人词汇量、口语测试集60%以上准确率,在车载或智能家居等垂直场景的命令集中,准确率达到90%以上。
在AI翻译技术方面,李健涛认为“搜狗的技术程度已经达到临界点,可以真正的大众民用化。”基于神经网络的机器翻译技术实现了语音翻译、对话翻译、文字翻译、图像翻译等丰富的交互翻译方式,可完成61种语言互译。
李健涛还在演讲中介绍了搜狗旅行翻译宝和搜狗录音翻译笔,这两款智能硬件翻译产品,针对了不同的场景和群体。搜狗旅行翻译宝首创离线翻译模式,翻译效果与在线效果持平,同时具备实景拍照翻译,“解决了不会说、听不懂、看不懂的痛点。”
而搜狗录音翻译笔主要面向学生、记者和商务人士,不仅支持实时录音转文字,还可以完成同传翻译、对话翻译功能。“语音识别准确率超过97%,每分钟400字的转写速度,支持分享给朋友和社交平台。”
|