曹操读书--知行合一,化于无形

国际聋人节:Google 将科技与无障碍设计结合

作者 :动点科技 2021-09-26 13:01:44 审稿人 : admin 围观 : 评论

2018 年奥斯卡最佳真人短片《沉默的孩子》中,当妈妈出门前对莉比说 “拜拜莉比,爱你” 的时候,听不见的莉比只是看着电视,然而在影片结尾,当莉比隔着围栏对家教老师用手语比出 “我爱你” 的时候,莉比对 “表达” 与 “被理解” 的渴望直击人心。tXU曹操读书网


今年的 9 月 26 日是第 64 个国际聋人节。据世界卫生组织数据显示,全球有 15 亿人患有某种程度的听力损失,人工耳蜗和助听器是他们的 “义肢”,慢速播放是他们在互联网生活中的常态。好在,科技更迭,给听障人群带来了更多的可能。tXU曹操读书网


打破 “障碍”,让每个人能平等地探索生活和世界。这也成为包括 Google 在内,许多科技企业、社会机构关注的方向。tXU曹操读书网


人工耳蜗语音增强技术研究tXU曹操读书网


许多耳聋或听障人士无法轻易获得无障碍服务来辅助日常口语对话,助听器虽然有所帮助,但对于听力受损严重甚至耳聋的人士,就需要借助人工耳蜗(CI)。人工耳蜗是一种电子设备,通过外科手术放入内耳中,并通过外部声音处理器将声音信号转换为电信号,刺激耳蜗残存的听神经,从而产生听觉。CI 领域仍然面临的主要挑战是如何最好地处理声音,即如何将声音转换为电极上的脉冲使它们更易于理解。Google 对人工耳蜗进行了探索性研究,实验了一些增强 CI 用户对语音的理解的办法。tXU曹操读书网


2019 年,Google 在一个小型内部项目中,邀请参与者聆听了 60 个预录制/预处理的音频样本,并请他们对舒适度进行评分。结果显示,聆听使用噪声抑制器处理过的语音,舒适度和理解度通常都会增加,证明语音增强预处理器(特别是噪声抑制器)可用于处理器的输入,增强用户在嘈杂环境中对语音的理解。tXU曹操读书网


tXU曹操读书网


语音增强网络被训练为抑制非语音,包括音乐,所以需要采取额外措施才能保留这一重要的用户享受。为此,Google 创建了原始音频与降噪音频的 “混合”,以便让足够多的音乐通过以保持可听性。在抑制非语音(例如噪声和音乐)的语音增强模块,Google 将原始音频转换成神经网络可使用的形式后,通过 AI 模型生成声音特性,并根据这些特性生成两个 “掩码”,分别作用于语音和非语音,然后通过将 “掩码” 与特性相乘,把分离的语音和背景音重建回音频域,最后进行混合一致性处理,提高音频质量。该模型对每 2.5 毫秒的输入音频进行估算,因此可以实时使用。tXU曹操读书网


Google 通过研究展示了未来功能更强大的人工耳蜗可以实现的性能,也凭借该成果,在由人工耳蜗制造商 Advanced Bionics、加州大学旧金山分校和明尼苏达大学共同举办的 2020 Cochlear Implant Hackathon 比赛中获得第二名。tXU曹操读书网


为视频会议软件开发实时手语检测模型tXU曹操读书网


大部分视频会议软件无法识别手语,因此当参会者需要通过手语进行交流时,他们无法被判断为发言人。Google 认为,视频会议作为人们工作生活交流的重要平台,每个人都应该能够平等地使用它们,尤其在疫情限制出行的情况下。于是,Google 开发了实时手语检测模型,通过人体姿势来判断参会者是否正在使用手语 “说话”。tXU曹操读书网


因为需要使用大量视频源作为输入来执行分类,所以 Google 设计了一个轻量级的模型,减小对 CPU 的消耗,以最大程度避免检测过程对通话质量的影响。当检测模型确定用户正在使用手语,它会通过虚拟音频电缆传递超声波音频,这虽然超出人类的听觉范围,但可以被视频会议软件检测到,并认为是用户正在发出声音。tXU曹操读书网


tXU曹操读书网


Google 对该检测模型进行了用户体验调查,参与者在视频会议期间像往常一样通过手语进行交流,或是参与者之间相互 “对话”,或是用手语和使用语音的用户进行交流。在这个过程中,手语被视为可听语音,成功触发了会议系统的 “麦克风” 图标,将参会人员的注意力吸引到手语参会者。参与者对检测模型也给出了积极的评价。tXU曹操读书网


为耳聋或听障人士设计应用tXU曹操读书网


除了通过相关研究寻求帮助残疾人日常沟通的方法,Google 也持续开发辅助应用不断优化产品无障碍设计,以下介绍三款专门针对耳聋或听障人士设计的应用。tXU曹操读书网


Live Transcribe & Sound Notifications 是 Google 与加洛迪特大学合作开发的应用,可与 Android,Wear OS 等系统适配,支持 80 种语言或方言。“实时转录” 功能利用先进的自动语音识别和声音检测技术,实时将语音转换为文字,帮助耳聋或听障人士理解对话。“重要声音通知功能” 则通过通知、闪光灯闪烁或手机振动提醒用户身边正在发生的关键声音,例如火警或门铃响起,以便用户快速响应。tXU曹操读书网


tXU曹操读书网


Live Caption 是一个自动字幕系统,会自动为用户设备上的视频、播客、电话、视频通话、音频消息、录制的内容生成实时字幕,目前 Pixel 手机,Google Meet,Chrome 都已添加该功能。tXU曹操读书网


Sound Amplifier 是一款 Android 辅助功能应用,通过过滤背景噪音而不过度增强 “重要的声音” 来提高清晰度。为了用户可以更加直观的了解 Sound Amplifier 是如何检测并增强声音的,该应用添加了音频可视化功能,即使用户听不出声音增强前后的区别,也可以知道声音增强的幅度。tXU曹操读书网


构建一个无障碍的世界,需要全社会共同的努力。这些特殊的日子只是一种唤醒:对残疾人士的关爱不能止步于此。希望未来有更多的科技创新帮助打破 “障碍”,让所有人都能相互交流和理解。tXU曹操读书网

相关文章

  • 支持原生智能语音交互,科沃斯发布首款家用服务机器人3.0产品 | 钛快讯
    支持原生智能语音交互,科沃斯发布首款家用服务机器人3.0产品 | 钛快讯

    科沃斯首次提出“家用服务机器人3.0”概念钛媒体9月15日消息,科沃斯机器人召开主题为“多维进化”的新品发布会,带来包括行业首款全能扫拖机器人地宝X1家族、AI智能语音助手YIKO以及多功能空气净化机器人沁宝Z1等新品。同时,科沃斯也通过提升家用服务机器人在功能性、智能性和交互性上的体验,首次提出了“家用服务机器人3.0”的概念。新发布的科沃斯地宝X1家族,其定位是全能扫拖机器人,在清扫方面,地宝...

    2021-09-16 06:56:10
  • 【钛晨报】小i机器人向上海高院提出iPhone停售禁令;贝壳否认赴港上市传闻;虎牙小鹿陪玩、欢聚Hello语音等7款陪玩软件被无限期下架
    【钛晨报】小i机器人向上海高院提出iPhone停售禁令;贝壳否认赴港上市传闻;虎牙小鹿陪玩、欢聚Hello语音等7款陪玩软件被无限期下架

    图片来源@视觉中国【钛媒体综合】近日,小i机器人(上海智臻智能网络科技股份有限公司)向上海市高级人民法院提出行为保全申请(禁令),要求苹果公司立即停止涉及Siri的专利侵权,停止生产、销售、许诺销售、进口、使用,侵犯ZL200410053749.9发明专利的iPhone产品。上海市高级人民法院已于昨日接受小i提出的禁令申请,案件持续审理中。“小i机器人”方面表示,小i机器人是中国发明专利ZL200...

    2021-09-08 07:49:52
  • 小米语音消息断点播放专利获授权,可避免重新播放已播放过的语音消息
    小米语音消息断点播放专利获授权,可避免重新播放已播放过的语音消息

    企查查APP显示,近日,北京小米移动软件有限公司“语音消息播放方法及装置”专利获授权,公开号为CN109245997B。企查查专利摘要显示,所述方法包括:在播放即时通讯应用中的语音消息过程中,响应于第一触发信号,暂停播放所述语音消息并设置断点;通过接收响应第二触发信号,从所述断点处开始播放所述语音消息。本公开实施例避免了从头开始播放语音消息时,重新播放已播放过的语音消息,提高信息获取的效率。...

    2021-08-09 18:02:00
  • 李小璐否认曾撩吴亦凡 曾被小G娜爆给吴亦凡发暧昧短信和语音
    李小璐否认曾撩吴亦凡 曾被小G娜爆给吴亦凡发暧昧短信和语音

    李小璐因为感情问题遭到了娱乐圈的封杀,虽然有很多男明星都犯过感情上面的错误,但是娱乐圈对于女性就是非常的严苛,所以现在网络上面也会有人替李小璐愤愤不平。李小璐很早之前就传过不少绯闻,还被小G娜爆料过她给吴亦凡发暧昧短信和语音。近日李小璐否认曾撩吴亦凡,引发大家的围观与热议,具体是怎么一回事呢? 李小璐...

    2021-07-21 21:58:44
  • 小冰公司完成 A 轮融资,发布新一代自然语音技术
    小冰公司完成 A 轮融资,发布新一代自然语音技术

    小冰公司已完成A轮融资,本轮融资由高瓴领投,五源、Neumann、IDG、GGV纪源资本及上轮投资人北极光与网易公司跟投。同时,小冰公司发布了最新的超级自然语音技术,该技术首次将人工智能语音自然度提升到与真实人类声音几乎无法分辨的程度,并支持通用全域场景。据了解,此次发布的小冰超级自然语音技术,突破了单一场景限制,使人工智能交互主体能够在说话、交谈、歌唱等人类全场景中,进行高度拟人交互。目前,小冰...

    2021-07-12 09:56:25
  • 专家解读智能语音发展:数据和算法仍存瓶颈,2B应用潜力更大
    专家解读智能语音发展:数据和算法仍存瓶颈,2B应用潜力更大

    【猎云网北京】7月7日报道7月6日下午,搜狐科技主办的《中国创新公司100》沙龙第二期成功举办。清华大学人工智能研究院听觉智能研究中心主任郑方教授、声智科技联合创始人&首席知识官常乐、科大讯飞AI研究院副院长陈志刚,共同探讨了智能语音技术的发展趋势,并分享了对智能语音商业化的思考。《中国创新公司100》是搜狐科技今年重磅打造的一档栏目,主要聚焦5G、AI、芯片、制造、出行、零售、社交等领域内的技术...

    2021-07-07 22:57:15
  • “语音识别方法及系统”发明专利荣获中国专利金奖
    “语音识别方法及系统”发明专利荣获中国专利金奖

    第二十二届中国专利金奖获奖名单近日公布,科大讯飞“语音识别方法及系统”发明专利荣获金奖。   语音语言是作为最自然便捷的交流方式,是人类社会的瑰宝。人类社会迈向智能时代之际,语音交互已成为智能设备的关键入口,将引领万物互联时代交互变革,深刻影响并改变人类的生活和生产方式,而语音识别作为语音交互的基础性关键核心技术,其重要性不言而喻。   据了解,此次获奖专利通过提出“静态+动态”网络空间实时...

    2021-06-29 12:54:03
  • AI语音识别企业“云知声”正式开始D轮融资,挚信资本领投
    AI语音识别企业“云知声”正式开始D轮融资,挚信资本领投

    企查查APP显示,6月24日,国内人工智能独角兽企业云知声智能科技股份有限公司正式开始D轮融资,截止目前已完成D1轮次近1亿美元的交割,本轮融资由挚信资本领投,启明创投、磐谷创投跟投。企查查信息显示,云知声专注于物联网人工智能服务,拥有完全自主知识产权,是世界领先的智能语音识别AI技术企业之一。公司成立于2012年6月,法定代表人为梁家恩,注册资本6357.34万元人民币,经营范围包括:计算机软硬...

    2021-06-24 11:56:40
  • 网易有道AI语音团队负责人孙艳庆:AI技术如何更好与硬件结合|2021 CTIS
    网易有道AI语音团队负责人孙艳庆:AI技术如何更好与硬件结合|2021 CTIS

    网易有道AI语音团队负责人孙艳庆6月9日,首届CTiS2021消费者科技及创新展览会在上海新国际博览中心正式开幕。在钛媒体联合CTiS共同打造的“AI·创新数字生活主题论坛”上,网易有道AI云团队负责人孙艳庆博士分享了AI技术在网易有道智能硬件中的一些应用。网易有道产品,除了智能硬件之外,还有大家熟悉的有道词典等工具类的产品,以及精品课在线类的学习服务,包括数字类的教育。这里面有哪些AI技术,以及...

    2021-06-11 17:49:00
  • MARSHALL Emberton:没有语音助手的小音箱还值得买吗?
    MARSHALL Emberton:没有语音助手的小音箱还值得买吗?

    上世纪五十年代,摇滚乐开始在战后繁荣稳定的美国兴起。几年后,大洋彼岸的伦敦,在一间小作坊内诞生了第一台MARSHALL音箱。伴随着英国摇滚的另类魅力,MARSHALL音箱开始流行。如今,这个品牌的音箱依旧活跃在很多人的案头,尤其是小红书上时尚博主的照片里,往往能看到它们的身影。不久前,MARSHALL推出了新款Emberton系列音箱,一直以来,Emberton都是MARSHALL便携音箱系列中最...

    2021-05-10 18:07:44
留言与评论(共有 0 条评论)
   
验证码: