English
联系我们
网站地图
邮箱
旧版回顾



8gghh

谷歌的新算法:在多人对话中识别出谁在说话会将错误率降低到2%。

????谷歌人工智能团队开发了一种新方法:使用语音识别来帮助区分语言和声音线索。因此,谷歌的新模型将字级错误率(wder)从15.8%降低到2.2%。各种误差得到了显着改善。

????奥飞寺栗子

????量子比特报告公共Qbitai

????事实上,在多人对话的音频中,区分哪一段是由哪一个人说并不是一个新的问题。

????但是,可以有一个新的解决方案(毕竟,以前的结果还不够好)。

????谷歌人工智能团队说,在过去20年里,程序没有改变。有两个步骤:

????一种是检测声谱的变化,以确定扬声器何时发生变化。

????第二步是在对话中识别每个演讲者。

????他们不想被传统习俗所束缚。他们开发了一种新的方法:利用语音识别来帮助区分语言和声音线索。

????研究小组还发现RNN传感器(RNN-T)是结合这两个线索的最合适的架构。

????因此,谷歌的新模型将字级错误率(wder)从15.8%降低到2.2%。各种误差得到了显着改善。

????Twitter受到了500多人的称赞。

????本文还选择了2019年的Interspeech。

????传统方法的缺点在哪里

????谷歌团队总结了四个主要限制:

????首先,对话必须分成几个部分。否则,就不可能准确地传达说话人的特点。

????但事实上,现有的说话人转换检测方法并不完善,这将导致多个说话人在片段中出现。

????其次,在集群时,需要知道总共有多少演讲者。如果该信息不准确,将严重影响模型的性能。

qi ci, zai ji qun shi, xu yao zhi dao zong gong you duo shao yan jiang zhe. ru guo gai xin xi bu zhun que, jiang yan chong ying xiang mo xing de xing neng.

????第三,系统需要在碎片大小之间做出艰难的权衡。

????剪辑越长,语音名片的质量越好,因为每个扬声器都有更多的信息。但风险在于,短插话很容易被误判。

????这可能会在医疗或金融对话中产生严重后果。

????例如,医生问病人,“你按时服药了吗?”

????病人的回答“是”和医生的问题“是”有很大的区别。.

????第四,传统的方法没有一个简单的机制来充分利用语言线索。

????例如,“你服药多久了?”通常医生会问,而不是病人。

????那么,你怎么填满这些坑呢?

????RNN-T

????RNN-T最初是为语音识别而设计的。

????研究小组发现它最适合于整合声学和语言线索。请注意,语音识别和说话人区分不是剧烈的组合,而是优雅地集成到一个简单的系统中。

????RNN-T模型由三个不同的网络组成:

????一种是转录网络,即编码器,它将音频的每一帧映射到一个潜在的表示。

????二是预测网络,负责根据前一个目标标签(目标标签)预测下一个目标标签。RNN-T可以预测更多的符号,如说话人角色和发音。

????第三,结合前两个网络的输出的联合网络,在输出标签集上生成当前时间步的概率分布。

????集中精力。体系结构中有一个反馈循环。在这里,以前识别的单词作为输入进行反馈。

????这样,RNN-T模型就可以利用语言线索:例如,在问题的末尾,它很可能被替换。

????谷歌表示,该模型可以像语音识别系统一样进行训练:

????培训样本是一个人的演讲,带有一个标签(tag),用来定义演讲者的角色。例如:

????“什么时候交作业?”

????“明天上课前交。”

????培训结束后,可以输入一个语音,得到每个单词的分类结果。

????然后,将它与基线进行比较,看看它是如何工作的。

????主人公结合语音识别和语音日记成一个系统。基线是分离和调整它们:

????结果,单词日记错误率从基线的15.8%下降到新方法的2.2%。

????此外,RNN-T能有效避免各种原因引起的误差,包括:

????扬声器在很短的时间内发生变化,分词,数据集中扬声器标记错误导致的语音重叠,以及音频质量差。

????红色是RNN-T,蓝色是传统的方法。每一个错误都大大减少了。

????该小组还补充说,RNN-T系统

当前文章:http://www.huibenjingling.com/t744u9/41562-64397-77308.html

发布时间:02:31:02


{相关文章}

香港特区政府官员及立法会议员呼吁尽快结束纷争

????

  原标题:香港特区政府官员及立法会议员呼吁尽快结束纷争 开展沟通对话 努力恢复经济

  新华社香港8月25日电(记者方栋)香港特区多位政府官员及立法会议员25日表示,持续的内部纷争让香港经济雪上加霜,呼吁尽快结束纷争、停止暴力行为,加强社会各界的对话沟通,团结一心为香港谋出路。

 中印帐篷对峙事件_中文资讯平台 香港特区政府财政司司长陈茂波发表题为《保“饭碗”》的网志指出,外围环境变坏加上香港社会暴力冲突持续,一场经济台风正逐渐形成,部分处于“当风”位置的行业,已感到相当痛楚。访港旅客数字八月以来逐步下跌至近50%;有酒店和酒楼已要求员工放无薪假;零鑫苑名家三期_中文资讯平台售业和饮食业调查显示近月收入以双位数大幅下跌。

  陈茂波指出,现在情况拖延下去,恐怕会出现裁员潮。事实上,提回头语小姑_中文资讯平台供60万人就业的零售、住宿及膳食服务业,合计失业率已由年初3.4%的低位逐步上升至4.3%,失业人数达2.75万人。全港5至7月失业人数增加4000多人,达到11.8万人。

  “回看本港过去20多年几次经济危机的经验,失业率恶化的速度可以较人们预期快得多。”陈茂波指出,过去两个多月的持续纷争,对经济的负面影响已经陆续浮现,影响会否更深、更广,使更多人“饭碗”受影响,只在于每个人的一念之间。

  “希望大家先‘偃旗息鼓’,让社会先平静下来,以协商代替冲突、以对话代替拳头,保住香港这个共同家园,也避免更多市民的饭碗和生活受到牵连。”陈茂波说,香港特区行政长官林郑月娥正筹备构建对话平台,跟社会各界衷诚沟通,为香港谋出路。

  特区政府财经事务及库务局局长刘怡翔在题为《重塑秩序 重燃希望》的网志中指出,香港经济正面对中美贸易摩擦、英国可能“硬脱欧”等外围不利因素,以及本地社会展昭阳_中文资讯平台纷争的困扰,增长越见乏力。

  刘怡翔表示,影响着香港经济的宏观环境无从改变,但是希望内在纷争可以尽快平息。如果香港社会、经济、民生建设持续受到破坏,令国际投资者对香港失去信心,会对香港造成长远伤害。

  刘怡翔呼吁社会各方能放下成见和对立情绪,回归理性,好好守护香港多年来苦心经营、努力建设的成就,一起携手应对下滑的经济前景。

  刘怡翔表示,香港特区行政长官林郑月娥提出卖家助理_中文资讯平台的沟通平台希望能直接聆听社会不同阶层、不同政治立场、不同背景的市民的心声,一起为香港的困境寻找出路。“要解决香港当前的问题,沟通、聆听和行动是不二之法,诚盼社会各界和我们一起努力,让香港能逐步复原,重燃希望,重新出发。”

  香港特功夫派侠士进阶_中文资讯平台区立法会旅游界议员姚思荣对媒体表示,受示威活动影响,旅游业多项数据指标上月已由升转跌,本月更出现快速下跌,其中入境旅客人次跌幅最大,中小型旅行社收入减少,出现经营困难。靠访港旅行团维生的导游受到的影响最为明显。去年旺季酒店入住率可达100%,而今年8月份预计会跌至两至三成。

  姚思荣表示,如果示威活动持续,会大幅扭转上半年旅客入境数字,深重影响服务业。

责任编辑:张玉洁 SF107

专题推荐

相关新闻


? 1996 - 中文资讯平台 版权所有?? 联系我们

地址:北京市三里河路52号 邮编:100864