iOS开发之类Siri的语言识别程序的开发与实践(Nuance技术)
相信Iphone4s之后Siri技术又火了一把,不过Siri的成功除了归于苹果公司Steve Jobs的领导之外,Siri的语音识别技术提供商Nuance公司的才是功不可没的。
Nuance是最大的专门从事语音识别软件、图像处理软件及输入法软件研发、销售的公司。除了已经红得发紫的Siri,Nuance还有一项破记录的产品,T9输入法,相信在苹果iphone流行之前,用过Nokia神机等品牌手机的用户一定很熟悉这个。
我们这里实现的语言识别功能正是基于Nuance的ASR技术,Siri只是Nuance技术的一种实现而已,Nuance的语音识别技术远远不止如此。
除了英语,法语,德语等西欧语言,中文,广东话,日语等东亚语言也包含在其中。
在开始之前,首先需要到Nuance注册一个开发者账户,获取一个ApplicationKey,并下载SDK,下面是SDK的说明。
http://www.nuance.com/for-developers/dragon-mobile-sdk/index.htm
在这之后就可以运用和开发语言识别程序,SDK主要包括ios和Android两个版本,ios版本发行较早,目前比较稳定,并有很多ios App基于开发,目前分别提供免费和商业版本,如果要商业开发的话,建议购买他的商业解决方案。
以下是开发语言识别的基本步骤和代码片段
1,导入语音识别framework
SpeechKit.framework
2,设置SpeechKitApplicationKey
//请从Nuance的邮件中复制 const unsigned char SpeechKitApplicationKey[] = {0x47, 0xbe, 0x50, 0x57, 0x05, 0xde, 0x0f, 0x0e, 0x70, 0x63, 0x10, 0x4b, 0xb2, 0xad, 0xfb, 0xab, 0x14, 0x96, 0x99, 0x0d, 0x8e, 0x50, 0x2c, 0x1a, 0xb2, 0x5b, 0xf6, 0x76, 0x7d, 0xd8, 0xd5, 0xc5, 0x97, 0x25, 0x1c, 0x9c, 0x03, 0x2c, 0xaa, 0x74, 0x8f, 0xba, 0xbf, 0x42, 0x67, 0xba, 0xed, 0x7b, 0x50, 0x87, 0x88, 0xde, 0xd7, 0xb4, 0xf8, 0x89, 0x10, 0xef, 0xff, 0x8d, 0xc7, 0xd5, 0x52, 0x51}; NSString *const SpeechKitID =@"XXXX"; NSString *const SpeechHost = @"sandbox.nmdp.nuancemobility.net"; |
3,实例化语音识别对象,并设置参数
//检测类型,用于识别并停止录音,可以是短暂停顿,手动控制等方式, detectionType = SKShortEndOfSpeechDetection; //识别类型,通常分为搜索和听写两种方式 recoType = SKSearchRecognizerType; //识别日语,可以是en,de,fr,zh_CN等 langType = @"ja_JP"; if (_voiceSearch) [_voiceSearch release]; _voiceSearch = [[SKRecognizer alloc] initWithType:recoType detection:detectionType language:langType delegate:self]; |
4,实现委托方法
//录音开始,这里是录音开始和录音录制过程中调用 - (void)recognizerDidBeginRecording:(SKRecognizer *)recognizer //录音完成,语言输入完成被识别,录音完成 - (void)recognizerDidFinishRecording:(SKRecognizer *)recognizer //识别解析完成,服务端请求完成,并获得结果 - (void)recognizer:(SKRecognizer *)recognizer didFinishWithResults:(SKRecognition *)results //识别发生错误 - (void)recognizer:(SKRecognizer *)recognizer didFinishWithError:(NSError *)error suggestion:(NSString *)suggestion |
I couldn’t resist commenting. Exceptionally well written!