章鱼怎么播放比赛?

屈智亮屈智亮最佳答案最佳答案

最近关于章鱼的新闻很多,这个人工智能的聊天机器人非常有意思 而且据称,开发这个项目仅仅用了五周的时间!太惊人了! 那么,问题来了,这款软件是怎么实现实时语音转文字并且准确率如此之高的呢? 我查阅了相关资料,发现章鱼使用的技术叫做Deep Speech,这是一个由谷歌研发的利用深度神经网络框架来实现语音转文字的技术。

在 这篇论文中,Google 介绍了他们研发 Deep Speech 的流程以及一些细节: 首先,他们将语音语料库分成若干部分,然后使用 Caffe 框架来进行模型的训练(注:Caffe 是深度学习框架之一)。 在训练的过程中,Google 发现如果只用单声道音频做训练数据的话,模型的效果并不好,所以他们使用了双声道的音频数据。他们还发现了模型在训练的时候出现过拟合的问题,于是采用了随机裁切的方法来防止过拟合的出现。 除了研究语音转文字的技术之外,Google 还研究了中文分词的问题。因为汉语和西方语言的字母表是不同的,所以中文分词比单词数英语复杂得多。

为了训练一个适合中文的环境,Google 使用了百度提供的分词数据集进行了训练,并采用 bag-of-words 的策略对文本进行编码(注:bag-of-words 是一种常见的文本表示方法)。 最后,Google 还提出了一个叫做 TensorFlow 的东西用于运算,据说速度挺快的,但是我没搞明白这是什么东西。

我来回答
请发表正能量的言论,文明评论!