曹操读书--知行合一,化于无形

网易有道AI语音团队负责人孙艳庆:AI技术如何更好与硬件结合|2021 CTIS

作者 :钛媒体 App 2021-06-11 17:49:00 审稿人 : admin 围观 : 评论

WKh曹操读书网
网易有道AI语音团队负责人孙艳庆
WKh曹操读书网

网易有道AI语音团队负责人孙艳庆WKh曹操读书网

6月9日,首届CTiS 2021消费者科技及创新展览会在上海新国际博览中心正式开幕。在钛媒体联合CTiS共同打造的“AI·创新数字生活主题论坛”上,网易有道AI云团队负责人孙艳庆博士分享了AI技术在网易有道智能硬件中的一些应用。WKh曹操读书网

网易有道产品,除了智能硬件之外,还有大家熟悉的有道词典等工具类的产品,以及精品课在线类的学习服务,包括数字类的教育。这里面有哪些AI技术,以及这些AI技术到底怎么样能够很好的和硬件形态进行结合?在孙艳庆看来,一定要找到一个痛点,具体到网易有道的产品中就是怎么解决儿童的背诵、学习语言、查词等。WKh曹操读书网

产品中的AI 

以有道翻译来说,这是从2008年就已经开始做的一项技术,至今已经做了十几年,孙艳庆介绍,经过三到四代核心技术引擎的发展,目前已经变成了神经网络的翻译引擎。除了简单的文字翻译,还加入了很多模态的形式,比如说图片翻译、文档翻译、语音翻译、AR翻译。它除了在手机端联网的方式,还可以在离线,完全没有网络的时候去应用。而且在词典笔的形态上,就可以得到一个很好的落地。WKh曹操读书网

此外,如果进行一个扫描或者点查,非常关键的技术是需要做OCR,就是把这个图片变成文字。有道的OCR技术目前支持100多种主流的语言文字,也可以在不同的场景下使用,比如说有时候扫描的并不是一个简单的单词或者例句,可能会是一个公式,或者手写的数学答案等等,所以针对不同的领域,也会做到一些定制的场景垂直化应用。WKh曹操读书网

还有语音交互技术,比如在词典笔的场景下需要语音的录入,语音识别要想得到一个很好的效果,比如在场馆里会有很多噪音,就需要做声学前端的信号处理。当然也有把这个单词读出来,去做语音合成。它其实就是通过语音进行人机交互的一个技术手段。WKh曹操读书网

技术与硬件结合

如果直接把一个手机给到孩子,不仅要担心他学习的效果,也会担心他去玩游戏或者看视频。WKh曹操读书网

孙艳庆介绍说,在智能软件的场景下,需要用手机从众多APP中去下载有道词典,再去打开它,找到所需要的功能页。而硬件的一个好处就是,拿到这个词典笔就可以直接去扫描或者点查,就能得到结果了,所以它会非常快。而且它会搭载和儿童,或者目标用户群体非常相关的功能,比如说互动点读。还有非常重要的一点,它是学习专用,可以带到课堂上。WKh曹操读书网

词典笔用了哪些技术,这些通用的技术又是如何和硬件更好的结合起来的?WKh曹操读书网

第三代词典笔在扫描、扫查的功能上又加入超快点查。这个功能让识别范围更广,除了纸面,包括很多商品的印刷品包装,都可以进行查词。WKh曹操读书网

孙艳庆介绍说,具体是把多项技术、把OCR和OID进行了结合。在早期词典笔摄像头扫描的广角是比较小的,为了支持超快点查,硬件也做了很多适配,包括广角提升了300%的效果。所以AI和应用的联合,才能打造一个综合的更好的体验。这也是全球首创的技术。WKh曹操读书网

WKh曹操读书网

词典笔不光能够查词,还可以去读绘本,和用户做互动。孙艳庆说,这个互动点读功能也是新发布的一个卖点,或者是一个杀手级的应用,它整个链条有这么几步:首先要在绘本上做一些铺码识别,还有麦克风双麦拾音,这样保证在嘈杂环境下也能有比较好的拾音表现,再加上语音识别。WKh曹操读书网

如,学生在听了阅读的标准发音之后,他是可以进行实时的练习。传统上来讲,他要说完了才能给出一个打分,这样的体验不是特别及时。这个互动点读的功能,就可以在他边读的时候就边出文字,就跟背诵是很类似的效果。为了达到最终的体验,也需要通过AI的技术来处理大量的素材,包括绘本资源、图像和音频,包括字幕的对齐,字幕的生成等等。WKh曹操读书网

所以,什么样的硬件是好的产品?什么样的AI技术是好的技术?以及技术和产品如何落地结合?在孙艳庆看来,一定要找到一个痛点,比如怎么解决儿童的背诵、学习语言、查词等等。WKh曹操读书网

下一步探索

关于未来的展望,孙艳庆说,第一,希望语言的学习不局限在英文,还可以学习中文,包括还有一些朋友去学习第二外语或者第三外语;另外,产品支持全学科,不光在语言学习类,还会支持数学的公式扫描和识别。孙艳庆认为,知识体系的构建是非常重要的,包括学习的资源,包括很多知识点。这是教育更加综合的一个思路。WKh曹操读书网

在英语的学习中,不同国家的用户他会有很多口音的差异,比如中国人说英语,中式英语,日本人说英语,以及印度人等等。全世界一百多个国家都把英语作为母语或者第二语言,其实英语的识别本身是非常有挑战的,口音成为对英语语音识别非常大的影响和挑战。WKh曹操读书网

在 2020年语音届盛会Interspeech口音英语语音识别挑战赛中,网易有道研究人员提交的系统在口音识别任务中排名第二。可以看到的,在很多国家或者很多口音,识别率还是没有达到非常完美的效果。孙艳庆说,好的可以做到百分之九十以上,差的也就只有百分之六七十的效果,这个领域还是值得继续去探索。WKh曹操读书网

除了口音英语值得探索,另外就是儿童发音,尤其是非母语的儿童去说英语,或者是其他的语言,更是难上加难,因为它叠加了两个挑战:非母语和口音。WKh曹操读书网

今年Interspeech也有一项比赛,网易有道拿了两个赛道的第一名,“但即使是最好的成绩,错误率仍然是大于20%。这是什么概念?可能五个单词就会有一个是错误的。这和我们理解也是一致的,因为儿童发音有他的特点,因此本身这个任务就是比较难的。这个方向我们还会继续去探索。”孙艳庆说。WKh曹操读书网

更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体AppWKh曹操读书网

WKh曹操读书网

核心关键字: 人工智能

相关文章

  • 拓展场景、研制配套技术及产品,四部门联合推进“能源+5G”应用
    拓展场景、研制配套技术及产品,四部门联合推进“能源+5G”应用

    创头条6月11日获悉,国家发展改革委、国家能源局、中央网信办、工业和信息化部日前联合印发《能源领域5G应用实施方案》。文件要求,未来3~5年,围绕智能电厂、智能电网、智能煤矿、智能油气、综合能源、智能制造与建造等方面拓展一批5G典型应用场景,建设一批5G行业专网或虚拟专网,探索形成一批可复制、易推广的有竞争力的商业模式。研制一批满足能源领域5G应用特定需求的专用技术和配套产品,制定一批重点亟需技术...

    2021-06-11 16:56:19
  • 区块链赋能公共服务领域 欧科云链大力推动技术发展
    区块链赋能公共服务领域 欧科云链大力推动技术发展

    近日,《工业和信息化部中央网络安全和信息化委员会办公室关于加快推动区块链技术应用和产业发展的指导意见》(以下简称《指导意见》)正式对外发布。在深化行业应用方面提出了具体举措。并部署了五项重点任务,其中在提升公共服务领域提出了具体要求,而这每一项都将有可能改变我们的生活。多位业内专家表示,《指导意见》绝大部分是围绕公共服务领域展开的,几乎包含了公共服务的方方面面,一方面,公共服务本就是区块链应用发展...

    2021-06-11 13:53:32
  • 巨人的碰撞:复盘“腾讯VS网易”的手游市场霸主地位之争
    巨人的碰撞:复盘“腾讯VS网易”的手游市场霸主地位之争

    图片来源@视觉中国文|互联网怪盗团自从中国的手游市场崛起以来,腾讯几乎总是占据着发行市场份额的第一,而网易几乎总是占据着第二。严格地说,两家的差距一直很大:2015年,网易的手游业务收入相当于腾讯的36%;到了2020年,这个比例下降到了27%。从事后诸葛亮的角度看,网易从来不曾有机会挑战腾讯在手游市场的霸主地位。就像我们现在回顾第二次世界大战,可以大言不惭地说:德国打不过苏联、日本打不过美国,乃...

    2021-06-11 09:49:04
  • 区块链产业再迎利好 欧科云链加快技术应用护航金融安全
    区块链产业再迎利好 欧科云链加快技术应用护航金融安全

    近日,《工业和信息化部中央网络安全和信息化委员会办公室关于加快推动区块链技术应用和产业发展的指导意见》发布,在赋能实体经济、提升公共服务、夯实产业基础、打造现代产业链、促进融通发展五方面共提出22项重点任务。区块链成为建设制造强国和网络强国,发展数字经济,实现国家治理体系和治理能力现代化的重要支撑。而在区块链应用落地方面,欧科云链等区块链头部企业不断探索,已经取得了一系列突破性成果。利好政策陆续出...

    2021-06-09 21:54:53
  • 网易云音乐IPO:雨淋湿了天空,毁得很讲究
    网易云音乐IPO:雨淋湿了天空,毁得很讲究

    文|表外表里(ID:excel-ers),作者:陈成、姚莎、胡汀琅,编辑|付晓玲、胡嘉雯1991年,高晓松喝醉酒哭着问老狼:“哥们儿写了那么多歌,谁听啊?”而15年后,这个问题依然困扰着国内做音乐的年轻人。2006年,北航毕业晚会上,刺猬乐队表演完《柏油公路》,鼓手石璐嚎啕大哭:“这东西这么好,什么时候才能被人发现?”但哭完后,他们依然在坚持,写歌、巡演、出唱片,一年又一年,哪怕曝光机会少、不出圈...

    2021-06-09 16:49:45
  • 创新人才辈出!2020年度云南省科学技术奖揭晓
    创新人才辈出!2020年度云南省科学技术奖揭晓

    科技日报记者8日从云南省科技厅获悉,为深入贯彻落实习近平新时代中国特色社会主义思想,认真贯彻落实党的十九届五中全会精神和习近平总书记关于科技创新的重要论述,立足新发展阶段、贯彻新发展理念、融入新发展格局,坚定实施创新驱动发展战略,大力营造人才辈出、人尽其才的制度环境,激发全省科技人员的创新创造活力,云南省人民政府日前发布了《关于2020年度科学技术奖励的决定》,对在全省科学技术进步、经济社会...

    2021-06-09 13:50:52
  • 铂力特注重技术创新 研发投入增幅62.32%
    铂力特注重技术创新 研发投入增幅62.32%

    “龙门行动”计划实施至今,西安新增20家境内外上市企业,新增数量比前八年总和还要多。更值得一提的是,仅去年一年,西安新增境内上市和精选层挂牌企业数量就为10家,创下了历史最高纪录。在资本市场上,“西安军团”的登场速度逐渐加快。从初创到上市,企业除具备硬核实力外,也离不开政策的扶持、金融资本的助力。值此2021全球创投峰会召开之际,投资界-西安创业记者走进“西安军团”,与负责人一起回顾企业登陆资本市...

    2021-06-08 12:50:47
  • 【钛晨报】苹果iOS15正式发布;辛巴控诉快手压榨;字节教育不打算裁员,将加注针对学校的技术服务
  • 印度软件技术园设立12个卓越中心,培育物联网等创业公司|海外政策
    印度软件技术园设立12个卓越中心,培育物联网等创业公司|海外政策

    创头条编译 印媒6月7日消息,印度软件技术园(STPI)将在全国设立12个卓越中心,培育小企业和创业公司,让这些公司开发医疗技术、物联网和智能农业等领域的产品和解决方案。“在加速研发、创新、知识产权创造和产品开发方面,这些卓越中心将发挥关键作用将,让印度在未来成为一个产品国家。”STPI负责人OmkarRai说。这些中心将在班加罗尔、甘地那加、巴特那、布巴内斯瓦尔、甘托克和伊塔那加等城市推出。目前...

    2021-06-07 17:51:25
  • 2020年度贵州省科学技术奖公示 贵阳高新区13个项目入围
    2020年度贵州省科学技术奖公示 贵阳高新区13个项目入围

    记者6月4日从贵阳高新区获悉,贵州省科学技术厅正对2020年度贵州省科学技术奖评审结果进行公示,公示显示贵阳高新区有13个项目获奖,占全省拟授奖总数的10.4%。    2020年度贵州省科学技术奖设立了最高科学技术奖、自然科学技术奖、技术发明奖、科学技术进步奖及科学技术合作奖5类奖项,共评出授奖项目125项。贵阳高新区获拟授奖的13个项目涉及自然科学奖、技术发明奖和科技进步奖,大部分是关键...

    2021-06-07 13:49:17
留言与评论(共有 0 条评论)
   
验证码: