? ? ? 为满足海外客户的业务需求,目前天天讯通的AI机器人系统正在对接谷歌和微软的ASR,目前微软的开发进入尾声了。
?????? 这两家是国际上知名的ASR厂商了,当然还有亚马逊、IBM等,之所以选择这两家来对接测试,主要也是海外的客户给我们提供的建议,毕竟这个客户以前就是在海外从事思科、Avaya的技术大牛。
?????? 那今天跟大家说说谷歌和微软的ASR各自有什么不同和他们的特点。
? ? ? ?一、对接过程的不同:
1. API风格:
? ? ? ? Google Cloud使用REST和gRPC两种API风格,开发者可以根据需求选择相应的接入方式。
Microsoft Azure提供了一系列的SDKs,可用于多种编程语言和平台,带来了可能性的灵活性,以及对不同客户端应用程序的原生支持。
2.认证方式:
? ? ? ? ?Google Cloud通常使用OAuth 2.0协议进行身份验证和授权。
? ? ? ? ?Microsoft Azure使用Azure Active Directory进行身份验证,并且提供了一系列的安全性和认证选项。
3.文档和支持:
? ? ? ? ?Google和Microsoft都提供了详细的文档和开发者指南,但他们的社区支持、教程和案例研究就会有所不同。
? ? ? ?二、特点以及优劣:
1.语种支持:
? ? ? ? Google Cloud Speech-to-Text支持120多种语言和方言,适合需要支持多种语言的全球化应用。
? ? ? ? Microsoft Azure Speech也支持多种语言,但可能在某些语种或方言上不如Google全面。
2. 实时识别能力:
? ? ? ? Google支持实时语音识别,其流式传输功能可以即时转写长时间的语音。
? ? ? ? Microsoft Azure同样支持实时转写,并提供了对实时、互动式会话场景的优化。
3. 准确性和识别性能:
? ? ? ? 准确性方面,两者都基于先进的深度学习模型,但在不同的用例和数据集上的表现可能会有所不同。
? ? ? ? 客户需要自行测试以确定哪个服务更适合特定的应用和语言。
4.价格:
? ? ? ? Google和Microsoft的定价模型可能存在差异,例如按请求次数或音频长度计费,这可能会影响到成本考虑。
? ? ? ? 还需要考虑免费层额度和价格随使用量增加的折扣。
5. 自定义模型:
? ? ? ? Google允许开发者通过上传特定领域的文本数据来训练自定义模型。
? ? ? ? Microsoft也提供了类似的Custom Speech服务,允许开发者优化识别准确性,特别是针对特定词汇和噪音环境。
6. 集成和生态系统:
? ? ? ? 集成到现有的Google Cloud或Microsoft Azure的服务和工具可能更加方便些,因为这两家公司都提供了比较完善的云服务生态系统。