白塔子镇| 北京国际雕塑园| 北滘交通中心| 柏隆镇| 乌伊岭| 鄄城县| 白文镇| 阿巴索夫| 安义县| 白沙万街道| 阿尔派电子| 北仑电厂| 巴棋苏木| 广德县| 百草路绕城路口| 乌尔禾| 北宫| 同江| 薄壁镇| 鄢陵| 宝云山| 覃塘| 白甸镇| 民丰县| 白家村村| 高陵县| 巴音沟牧场| 会同县| 八角亭村| 北留路|
VIP

七嘴八舌分不清谁讲话?Google靠AI分辨谁开口

2018-04-21 15:57:00来源:中国台湾网
标签:宛转 易赢在线平台 木樨地

  

  Google训练AI依据画面和声音判断说话的人。(图片来源:台湾“东森新闻云”)

  中国台湾网4月16日讯  据台湾“东森新闻云”报道,人类可以在嘈杂的人群中,依据声音传来的方向辨别说话的人,但计算机可就没有这么厉害了,不过 Google 今天公开一项技术,让AI在混杂的影片中,分辨开口说话的对象,并且将每一个人的声音拆开成为独立音档,这项技术除了有望改善YouTube的字幕功能外,也能提升多人视频对话的质量。

  据报道,Google藉由一段表演秀视频展示研究成果,AI会将声音元素与视觉画面结合起来进行判断,简单来说,当视频中左边的人在进行对话时,他的嘴巴应该要产生对应的开阖动作,AI藉由捕捉肢体细节来判断现在说话的人物是谁,接着再通过隔离单一声音讯号并加强、其他声音降低,完成独立单一音源的工作。

  除了展示隔绝声音的技术外,Google实际示范AI与YouTube目前的自动字幕的互动状况,这项技术未来有机会帮YouTube添加双轨道的字幕显示。

  Google特别提到,他们认为这项功能在视频会议上能有所贡献,期望技术能广泛运用在Google各项产品之中。若依据Google的论述,Hangouts、Duo 是有可能使用这项技术的产品名单,在七嘴八舌的视频会议中,藉由AI强化说话者的音量并隔绝杂音,会带来更好的服务体验。(中国台湾网 王怡然)

[责任编辑:王怡然]

相关内容

京ICP备13026587号 京ICP证130248号京公网安备110102003391网络传播视听节目许可证0107219号

关于我们|本网动态|转载申请|联系我们|法律顾问|违法和不良信息举报电话:86-10-53610172

长征街街道 孟公镇 万寿禅寺 中塘街兴安公寓 二九研究所
久筑社区 散湖 西山烧碱厂 河曲 甘家湖牧场
澳门皇冠赌场网站 大咖娱乐平台 九州娱乐ju111net 英皇娱乐app 博亚娱乐官网