迄今最复杂人工智能语音模型创建,可模仿人的原声|总编辑圈点
(相关资料图)
Meta称研制出迄今最复杂人工智能语音模型。图片来源:英国《每日邮报》网站
科技日报记者 刘霞
据英国《每日邮报》23日报道,脸书母公司元宇宙平台公司(Meta)称,其已研制出“迄今功能最强大的语音生成式人工智能Voicebox”,它能够模仿任何人的声音,包括逝者。不过,由于担心这项先进技术会被滥用,Meta宣布不会公开其人工智能模型。
Meta公司深度学习人工智能研究人员在介绍Voicebox时指出,Voicebox使用了“流匹配”方法,其表现优于当前最先进生成式语音系统使用的扩散模型。结果显示,Voicebox生成的人工音频更容易理解,单词错误率为1.9%,低于竞争对手的5.9%。此外,Voicebox生成的音频与真人的相似性更高,同时速度快了近20倍。
在跨语言翻译时,Voicebox的表现优于备受赞誉的多语言文本—语音AI YourTS,单词平均错误率从10.9%降低到5.2%,音频相似度从0.335提高到0.481。
Meta阐述了Voicebox的多种用途,称其可用来帮助视障人士听到朋友和亲人的信息,或允许非母语人士用自己的声音翻译自己所说的话。据悉,Voicebox目前能说6种语言:英语、法语、西班牙语、德语、波兰语和葡萄牙语。
不过,Meta强调称,由于潜在的滥用风险,他们目前不会公开Voicebox模型及其代码。虽然他们认为向人工智能社区开放并分享研究,对于推动人工智能向前迈进非常重要,但在开放与责任之间取得正确的平衡也至关重要。
总编辑圈点
ChatGPT横空出世半年多时间,人们已然深刻感受到人工智能语言模型的强大。对于各种提问,它都能对答如流,令人惊叹。试想一下,如果人工智能在回答人类的提问时,不仅内容形式酷似真人,就连声音也令人真假难辨,用户恐怕会感受到更强的冲击力。而后者,正是语音生成式人工智能要实现的目标。不过,正如文中所言,这些强大的技术确实有被滥用的可能,在人工智能技术不断升级迭代的同时,相关监管与伦理约束也要及时“上路”。
关键词:
您可能也感兴趣:
为您推荐
CINNO Research:部分面板价格或将在第三季度企稳
苹果与酒店合作:LG成为首个支持AirPlay的酒店电视品牌
银川31死爆炸事故原因公布:烧烤店总店长、工作人员擅自更换减压阀导致液化气泄漏引发爆炸
排行
最近更新
- 迄今最复杂人工智能语音模型创建,可模仿人的原声|总编辑圈点
- 奥莱报:参加里克尔梅告别赛,梅西启程前往糖果盒球场
- 天天快讯:舰炮齐射太帅了!东部战区多型舰艇进行跨昼夜多科目...
- 全球时讯:高考后,奉贤驾校迎来学车热!C2驾照受学员青睐
- RMC:仍需等待,巴黎预计下周才能与加尔蒂达成协议离任
- 吉林省敦化市市场监管局开展市场监管领域检查工作
- 全球头条:避开美元,伊朗和斯里兰卡“以茶换油”
- 甘肃省瓜州县市场监管局:把好食品安全关 端午佳节不放“粽...
- 星火保怎么退保 怎么退掉星火保
- 提升居民消防安全意识,宝山这里开展系列宣传活动
- 环球焦点!盐南高新区人工智能招商推介会在青岛召开
- 天天消息!“中国考古01号”船举行首航福建公众开放日
- 端午节,收到来自“无人机”的意外惊喜!老年人足不出户看新...
- 黑龙江省双鸭山市市场监管局加强早市监管
- 夏天运动减肥效果更好?答案是……
- 世界快看:烟火端午|端午旅游“热度”攀升 周边游,短途游...
- 华尔泰:年产5万吨环己胺和二环己胺项目试生产
- 热讯:提升居民消防安全意识,宝山这里开展系列宣传活动
- 跨境电商年进出口规模首超2万亿元 继续保持增长势头 为外贸...
- 视讯!智翔金泰上市即破发 打新基金也“受伤”
- 宁吉喆:加大宏观调控力度 要帮助微观企业解决实际困难
- 普京是否仍信任俄国防部长绍伊古?克宫这样回应
- 打车软件显示目的地为阴曹地府 官方回应:为虚假地名已督促...
- 端午放“粽”不用怕,养生瑜伽拯救你!
- 每日动态!PICA游戏《猎人:荒野的呼唤》本周免费
- 当前快讯:支持挂机的复古传奇推荐 可以放置玩的传奇
- 《消失的她》夺2023年端午档冠军
- 扩招!广东2023高招专项计划有哪些新变化? |高考策-世界热资讯
- 葛思齐回应被大小S起诉:感谢还我清白
- 2023河南高考艺术类平行志愿投档办法|实时焦点