在《机器学习期刊》(Machine Learning Journal)的一篇新文章中,苹果详细介绍了如何应对提高Siri识别当地兴趣点(如小企业和餐馆)名称能力的挑战。
简而言之,苹果表示,它已经建立了定制的语言模型Geo-LM,将用户的地理定位知识融入其中,提高了Siri自动语音识别系统的准确性。这些模型使Siri能够更好地评估用户的语音内容。
苹果表示,该公司为美国人口普查局(U.S. Census Bureau)定义的169个统计区域设置了Geo-LM系统,占美国总人口的80%。苹果还在全球范围内建立了一个单独的Geo-LM系统,以覆盖所有不受统计区域覆盖的区域。
当用户查询Siri时,系统会根据用户的当前位置使用Geo-LM系统。如果用户不在统计区域,或者Siri无法访问位置服务,系统就会默认使用全球Geo-LM系统。
苹果论文的技术性很高,而且相当详尽,但愿这种方式真的能够帮助Siri更好地识别不同地方的兴趣点名称,甚至能够根据用户的地理位置更好地区分爱荷华州和堪萨斯州的Tom餐厅。
在测试中,苹果公司发现,这些定制的语言模型可以将Siri的错误率降低41.9%至48.4%,这些错误率分布在美国八个主要城市:波士顿、芝加哥、洛杉矶、明尼阿波利斯、纽约、费城、西雅图和旧金山,但不包括像沃尔玛这样的大型连锁店。
根据研究公司Loup Ventures最近的一项研究,Siri在整体准确度上仍落后于Google Assistant,希望这些改进真的能提高Siri识别本地的能力。