世界最资讯丨Meta发布机器学习模型Voicebox:可从文本生成语音 精通六门语言


(相关资料图)

站长之家(ChinaZ.com)6月19日 消息:日前,Meta平台的人工智能研究部门推出了名为Voicebox的机器学习模型,可以将文本转换为语音。

与其他文本转语音模型不同的是,Voicebox能够执行许多未经过训练的任务,包括编辑、去除噪音和样式转换。

为训练模型,Meta的研究人员使用了一种名为“ “Flow Matching” ”的方法,该方法比其他生成模型中使用的扩散学习方法更高效和通用。由于担心滥用,Meta并没有发布Voicebox,以及将来可以支持很多应用。

Voicebox是一种生成模型,可以在英语、法语、西班牙语、德语、波兰语和葡萄牙语等六种语言中合成语音。它通过学习将语音音频样本映射到其转录本的模式来进行训练,从而可以用于许多下游任务。

与特定应用程序训练的生成模型不同,Voicebox在训练过程中使用文本作为训练目标,训练过程中,模型会预测语音片段,中间部分被屏蔽,根据周围的音频和文本转录本进行推理学习,学习使用文本生成自然语言语音。

Voicebox的一个有趣应用是语音采样。该模型可以从单个文本序列中生成各种语音样本。这种能力可用于生成合成数据来训练其他语音处理模型。“我们的结果表明,在Voicebox生成的合成语音上训练的语音识别模型的性能几乎与在真实语音上训练的模型一样好,错误率下降了1%,而在以前的文本到语音模型中,合成语音的错误率下降了45%到70%,”Meta写道。

不过Voicebox也有一定限制。由于它已经过有声读物数据的训练,因此它不能很好地转移到随意且包含非语言声音的对话语音中。它也不能完全控制生成的语音的不同属性,例如语音风格、语气、情感和声学条件。Meta团队还在探索技术来克服这些限制。

官方介绍网址:https://ai.facebook.com/blog/voicebox-generative-ai-model-speech/

(举报)

标签:

x 广告
中方呼吁关注叙利亚遭受恐怖主义威胁及外部占领问题

新华社联合国1月27日电(记者王建刚)中国常驻联合国副代表戴兵27日呼吁国际社会对叙利亚遭受恐怖主义威胁及外部

美乌总统通话讨论乌克兰局势

新华社华盛顿1月27日电(记者邓仙来)美国总统拜登27日与乌克兰总统泽连斯基通电话,讨论乌克兰局势。白宫当天发

安徽多地出现“桃花汛” 未来一周全省天气预报

3月16—17日,安徽出现了明显的降温和降水天气,多地出现了暴雨,局地大暴雨,气温也明显下降,18日最低气温甚至跌到了个位数。据气象部门

人民体谈:同唱一首歌,两岸共享冬奥荣光

1月25日,在北京冬奥会进入倒计时10天之际,由海峡两岸青年音乐人合唱的《我在北京等你》,唱响冬奥,让两岸同胞

兵贵神速赴战场 中铁四局铁军逆行战长春

奥密克戎变异株,正给国内疫情防控带来新的挑战。当前,吉林省疫情防控也到了最关键紧急的时期,吉林省政府迅速做出了兴建方舱医院的决策部

快手发布春节防诈攻略 助力老铁识诈反诈

日前,快手发布了一则《春节防诈攻略》,总结出春节期间极易出现的五种诈骗套路,意在“扫尘迎新、去诈存真”,帮

强化资源倾斜 徽商银行多措并举助推制造业高质量发展

制造业是立国之本、强国之基。作为现代经济的核心和实体经济的血脉,金融支持制造业高质量发展责无旁贷。近年来,徽商银行认真贯彻落实安徽

产业互联网发展渐入佳境 智慧应急建设未来可期

根据《2020联合国电子政务调查报告》显示,我国电子政务建设在疫情背景下突飞猛进,衡量国家电子政务发展水平核心

人民网评:有安全,才有年味

人们常说:家是春节的方向。虎年新春即将来临,很多人已经踏上了返乡旅途;也有人因为新冠肺炎疫情原因,选择就地

巴西中国和统会举办贺新春迎冬奥活动

人民网里约热内卢1月27日电 (记者吴杰、毕梦瀛)壬寅虎年新春、北京冬奥会双喜临门之际,中国巴西友人共同参与

x 广告

Copyright ©  2015-2022 起点城市网版权所有  备案号:皖ICP备2022009963号-12   联系邮箱: 39 60 29 14 2@qq.com