直线机

骄傲一次讯飞AI语音合成技术1分钟模仿

发布时间:2023/7/18 14:18:22   

人工智能产业迅速崛起,不管是计算智能、感知智能还是认知智能,中国都从追随者逐渐变成引领者,在世界科技范围内,中国科技力量不容小觑。不论是李斌的电动超跑,库卡的机械臂,胡郁的“语音合成技术”,还是印奇的“人脸识别技术”,无一不在向世界展示中国在科技各个领域勇冲第一的迅猛势头,而湖南卫视《我是未来》正通过这种科技秀的方式见证着越来越多“中国骄傲”的诞生。

假如有一天,你发现机器人发出的声音和你的一模一样,你是感到惊慌,还是该感到欢喜?这并不是危言耸听,这是AI技术中的语音合成技术在捣鬼。在这个合成图片肆意蔓延、虚假新闻充斥各大媒体的时代,一个可以让任何人说任何话的程序,似乎是引发更多麻烦的催化剂,但是人们对其的研究仍然乐此不疲。本期讯猫软件将带您在AI语音合成技术的浪潮里翻滚。

科大讯飞的语音合成技术已经炉火纯青到以假乱真的地步,通过采集声纹,可以模仿任何人说话。主持人张绍刚在现场甚至都被胡郁带来的女机器人“戏弄”了一番,成了连机器人都不放过的“怪蜀黍”,百口莫辩。

那么这项技术如果被不法分子加以利用,后果会怎样呢?现场体验官提出了这样的疑问。不料,胡郁却在《我是未来》节目中骄傲地表示:“自从运用了我们的语音识别技术,安徽的电话诈骗案件直线下降。”原因在于,科大讯飞不但可以通过声纹识别技术模仿别人说话,还可以凭借声纹精准识破语音模仿骗局。目前,此技术已经应用到电话诈骗案件侦查上,效果显著。

16日到18日,在天津举办的第二届世界智能大会上,科大讯飞董事长刘庆峰展示的机器人方言翻译引得现场嘉宾笑声不断,而一段机器人模拟配音员的电视节目配音更是十分专业。

新的语音合成技术只需要1分钟的声音样本,就可以模仿任何人说话。

之所以能产生如此高还原度的合成声音,背后的技术正是神经网络(NeuralNetwork)和机器学习(MachineLearning)。神经网络模拟电信号在人脑神经元之间的传递过程,对输入数据进行处理。它利用分层的神经元,从大量样本数据中总结出共同特征。目前,神经网络在图片识别、字幕生成等方面受到了广泛应用。

有了这项技术,网络上的流行混剪视频的制作将容易很多,制作者只需把画面剪切在一起,完全可以生成你需要的任何声音。除了这类应用以外,声音合成技术在更多的场景中都能派上用场,比如说为失语者配音。你可以把它想象成一款脑洞编辑器,可以让我们的生活更有趣。设想一些应用场景,如虚拟现实、有声书朗读、游戏、动画等,以及提高人们生活质量的应用,如个人助手、心理治疗等。

然而这项技术的漏洞也是显而易见,不在于技术本身,而在于使用它的人。如果这项技术被图谋不轨的人利用,社会上的误导、迷惑、欺骗行为可能会更加猖獗。小到钱财,大到人身安全、社会集体利益可能都会受到威胁,无意间的犯罪或者被侵犯都是非常可怕的事情。

关于技术的道德问题,警醒人类在未来(甚至现在)声音篡改模仿都是可能的,尽管现在法庭上还将录音作为一项重要的证据,他们不认为这是很妥当的,因为谁都可能伪造这种证据。而通过将这项技术发布给全世界,他们希望确保技术的安全性,希望人人都能接触到这个信息:在不久的将来声音也可以被破解。



转载请注明:http://www.aideyishus.com/lkyy/5253.html
------分隔线----------------------------