在语音识别中数据多样性的重要性是什么？

Q&AQ&A问答

在语音识别中数据多样性的重要性是什么？

来源：CPDA数据分析师网 / 作者：数据君 / 时间：2020-09-22

随着越来越多的公司转向自动语音识别工具并在整个组织中部署AI和ML模型
必须建立无偏见的健壮模型，无偏差AI模型非常重要，因此它们适用于每个人和每个组织，并产生有意义的结果来帮助解决问题，而不是制造问题，本部分将揭示如何消除模型中的偏差，并确保您拥有多样化的数据集，这些数据集尽可能代表组织的公正功能。

在模型训练中认识偏见
消除模型训练中的偏差的步是要承认ML模型中确实存在固有偏差，语音识别技术存在种族差异时，我们看到了这种无意识偏见的现象，这些系统通过分析大量数据来学习，因此，如果ML模型仅分析白人用户的语音模式，就不可避免地会产生偏差。

另一个更明显的例子是性别偏见
我们几乎每天都会使用默认情况下使用女性语音编程的语音助手技术来应对这种偏见，语音助手和语音技术领域的初创企业正在开始改变这种状况，但是要真正实现无性别的AI还有很长的路要走，展望未来，人工智能和机器学习可以帮助企业了解人类的偏见，并随着时间的推移努力加以纠正，这项性别偏见研究只是语音识别中偏见如何存在的一个例子，但它代表了大多数公司每天面临的问题。承认这种偏见是寻求解决方案的步。

拥有多样化的数据集
减少ML模型中的偏差的下一个也是重要的步骤是拥有多样化的数据集。从上面的斯坦福研究示例中可以看出，您的数据不仅必须代表不同的方言，而且还必须代表性别，以减少偏差并提高准确性。

在开发代表性数据集时，请确保您了解周围的人及其个人经历
如果一个模型是由居住在沿海州的白人异性恋男性建立的，那么该模型将更能反映出他们的偏见，例如他们使用的单词，讲话的节奏，方言和口音。利用从多种多样的数据集中学习的技术是一种缩小差距并允许听到所有声音的方法。需要强调的是，机器学习本身没有偏差，算法也不是有偏差的，但是如果提供的数据集不能准确代表您的总体，则它们可能会获得固有偏差。为了尽可能减少AI中的这些偏见，您需要确保代表组织中具有不同人口统计特征的广泛人群。

使用深度神经网络
终消除ML模型中的偏差的第三步是让公司使用深度神经网络，在典型的ML模型中，有怪物（模型）和“怪物”（人类）的创建者，“怪物”根据给定的数据进行学习，人类无需进行任何形式的硬编码，其一部分具有试探性和基于规则，而另一部分具有卷积网络，则存在插入自己的偏见的风险。

只有模型提供的数据可以训练模型以及如何随着时间学习
它与建立网络的人的信念无关，从而消除了固有的偏见，但是为了扮演魔鬼的拥护者，现在偏见已转移到标记训练数据（或如何收集数据）的人们的信念上，终，您拥有的数据科学策略越健壮，并且使用代表性数据集训练模型的能力越好，准确率就越高。

消除ASR中的偏差绝非简单的三步过程
然而，至关重要的是，您必须承认存在偏见及其产生方式，以了解采用多样化数据集的重要性。从那里开始，代表您想要转录的对话的源音频并考虑实现DNN，从而使正在进行的培训成为语音识别过程的一部分。这将提高语音识别模型的准确性，并有助于消除偏见，使您能够更好地了解并满足客户的需求。

客服热线：400-050-6600

商业联合会数据分析专业委员会

Prev article

如何避免在基础架构即代码模板中的常见风险？

返回列表

Next article

大数据如何在混乱中蓬勃发展？