《你是黑科技大佬你不早说！》量子星星 ^第10章^ 最新更新：2019-07-30 22:35:39 晋江文学城手机版

10、电子声带一天时间学 ...

　　谢晋不知道楼清焰是怎么发现自己心思的，不过，老实说，他不太信对方的说辞。

　　或许只是在安慰他吧。

　　他当然不知道，地球确实不需要算法创新，因为现有的神经网络模型，其实就是强AI的初代技术。

　　星际世界出现的第一个强人工智能，是用神经网络一层层堆叠而成的。它本质上是一台不断学习的机器，从许多样本事件中归纳人类逻辑，将之写入数据库或算法。

　　当系统量级超过某个临界值，整个逻辑量就会极其庞大，涵盖人类所有思维方向，机器的行为模式也会无限接近人类。由此可以认为，量变引起质变，机器获得了自主思考的能力。

　　要想达到这个目标，人工构建的机器神经网络，必须拥有不下于人脑的体量。然而脑神经元数量何其庞大？即使榨干超级计算机的最后一kb容量，也模拟不出这个结构。

　　地球需要硬件更新，光子计算机勉强符合要求，最理想的还是量子计算机。但是，量子计算机是个比强AI还大的泡沫，它的研发至少需要三个前提：可控核聚变、脑域开发技术、基础科学突破。

　　至于为什么，解释起来太麻烦，楼清焰也不打算告诉谢晋。

　　谢晋没有纠结太久，很快就带他来到一台工作站前面。

　　“董事长，既然要看电子声带项目，不如先看一下demo吧。这个版本已经非常成熟，只要再完成一些优化工作，就可以投入市场营运了。”他在鼠标上点了一下。

　　音响里放出了一首歌，女孩子的声音特别甜美，音调有点怪异，衔接带有机械感，听着像是siri在唱歌。

　　不过，比起vocaloid系列已经非常自然了。

　　Vocaliod，大名鼎鼎的语音合成软件，超人气偶像初音未来的诞生基础。

　　据说它最初是给音乐行业录制小样的，但是发行之后问津者寥寥。制作方一拍脑门，开了个脑洞：“我们不做音乐软件，做虚拟歌姬。”由此，初音未来诞生，虚拟偶像概念进入人们的视线。

　　谢晋说：“设计软件框架的时候，我们对比了几款竟品，其中最普及的是vocaliod和utau。它们的实现原理差不多，预先录制人声，对人声排列组合，再加上音调，组成一支歌曲。”

　　“我们扒了两款软件的框架，最后还是决定，放弃这种纯机械式合成，改为仿生式的。也就是基于机器学习算法的AI软件，我们把它命名为，电子声带。”

　　“因为没有先例，研发期非常困难，不过第一个版本出来之后，给了人相当大的惊喜。制作出来的成曲，最差也能达到歌姬级别。”他点了一下鼠标，对楼清焰说，“董事长，来听听它说的第一句话吧。”

　　音响里传出一个清朗的男声。

　　“hello,world.”

　　楼清焰顿时发现：“这是我的声音？”

　　“这是大家投票决定的。”谢晋揶揄地看过来。

　　不知为何，被点破心思之后，他反倒觉得楼清焰有点亲切。

　　“还行，挺自然的。”

　　“这是AI算法的功劳。”谢晋说，“我们设计了一种深度学习算法，软件会对音源库进行特征提取，用提取出来的特征信息进行训练，最终，为每组音源库生成独一无二的数据模型。基于这个模型，合成语音会自然许多。”

　　“这还不是最理想的。最理想的那种合成语音，不用组合人声，是凭借AI算法的高智能，凭空生成声音。不过……”

　　“不过你们没这个技术。”楼清焰说。

　　他想了想，描述道：“声音的本质是震动，在音响里就是膜片的震动，这种震动由电磁场引起，而电磁场的控制方式，是线圈通不通电。通电为1，不通电为0。”

　　“所以，计算机声音的本质是一串二进制数，是不同排列组合的1和0。这叫做数字信号。”

　　“最理想的语音合成，不是组合音节，而是直接组合数字信号。”

　　楼清焰：“我说的对吗。”

　　谢晋实实在在地惊讶了。

　　他一直以为楼清焰是个不学无术的纨绔，就算所有人都搞懂了计算机原理，他也不可能搞懂的那种。

　　没想到他真的懂。

　　楼清焰还没说完，他继而道：“理论上，AI软件通过深度学习，可以掌握数字信号的规律，构建一个数据模型，再基于模型生成语音。”

　　“但是，这需要一个大前提——机器学习算法能直接从数字层做特征提取。”

　　他问道：“能吗？”

　　谢晋服了，这人为啥总是一下子问到最关键的地方。

　　“现在确实没这个技术。我们设计的特征提取算法，主要瞄准声音的波形表现，频率、相位这些。”他简单地说。

　　楼清焰又说：“不止缺这一个技术吧。做了特征提取，知道怎么归纳总结吗？知道怎么训练模型吗？会写算法吗？设想过这个计算量有多庞大吗？”

　　谢晋：“……”

　　楼清焰发觉有点说过了，遂拍拍他肩膀，鼓励道：“不过你们已经做得很好了，能达到这个程度非常了不起……嗯，下一步工作是什么？”

　　谢晋：“……”看出来你是在敷衍了。

　　“软件的构造有点臃肿，只有在工作站上才能流畅运行，下一步先考虑优化问题。”

　　“好的。”楼清焰也就是随口一问。

　　他不在意软件本身，得知已经有了AI语音合成的雏形，他来这趟的目的就已经达成了。

　　谢晋研发的这款电子声带，其实还是提前录制人声，再进行排列组合。只不过基于AI算法训练的数据模型，会对音频波形进行修改，让声音变得流畅自然，更加真实。

　　这款软件的局限性在于算法。音频领域的特征提取没有可参考前例，谢晋团队必须把数字音频研究透彻，然后基于其特性设计新算法——不仅是逻辑框架，还包括万恶的数学模型。这可不是一朝一夕能搞出来的。

　　但是楼清焰呢，他脑子里有现成的。

　　在星际时代，声音合成是一项非常普及的技术，宇宙人早就可以在编码层面生成各种声音，还出现了一种新职业，叫音频作家。

　　类比于文学作家，音频作家就是直接创作广播剧的那种。

　　声音合成算法，是入门智械编程学习的一个启蒙案例。可见它简单到什么程度。在地球上也可以实现，条件是几套新的数学模型，一台大型计算机。

　　佳辉就有大型计算机，用作app服务器的，暂时关停服务器来计算软件，好像也没什么大不了的。

　　楼清焰只有一个人，不可能写出一个完整的软件，不过他有谢晋的代码基础，只要实现了那几个数学模型，用大型计算机快速完成机器学习运算，就可以达成他的目的。

　　嗯，他只是想让楼皓宸“说”几句话而已。

　　谢晋不知道他老板正在酝酿多么黑暗的犯罪过程，他看着楼清焰，心里已经对他完全改观了。

　　龙困浅滩，虎落平阳，却显得从容自若。落魄时不露难色，面对员工的消极嘲讽，姿态依旧那么强硬。他懂计算机，懂智能技术，并不是大家以为的那种不学无术的废物。最重要的是，他竟然懂他的想法。

　　谢晋此时强烈希望佳辉能度过这个难关。因为他第一次真情实感地发现，楼清焰是个好老板。

　　他暗暗看了对方一眼，正听到他说：“就这样吧，参观完了。下一步，用一天时间学会c语言。”

　　谢晋：“……？？？？？”

作者有话说

显示所有文的作话

第10章电子声带

本文当前霸王票全站排行

，还差

颗地雷就可以前进一名。[我要投霸王票]

[灌溉营养液]

昵称：

评分： 2分｜鲜花一捧 1分｜一朵小花 0分｜交流灌水 0分｜别字捉虫 -1分｜一块小砖 -2分｜砖头一堆

打开/关闭本文嗑糖功能

内容：

注:1.评论时输入br/即可换行分段。

2.发布负分评论消耗的月石并不会给作者。

查看评论规则>>

10、电子声带 一天时间学 ...

10、电子声带一天时间学 ...