使用科大讯飞的语音技术实现语音识别
来源:互联网 发布:关于初中英语的软件 编辑:程序博客网 时间:2024/05/16 17:40
目前,越来越多的app已经使用到了语音技术,无论是语音合成,语音识别,还是语义等,有时,为app增加语音技术,就可能为自己多增加一份市场用户,这里就科大讯飞的语音识别的代码调用做个介绍。
科大讯飞的语音服务是以SDK的形式提供的,就android平台来说,有三个SDK,现在以其中的弹出dialog的SDK为例。SDK在官网( http://open.voicecloud.cn/ )下载,解压之后有几个文件夹,分别如下:
1 bin文件夹下面的是SpeechDemo.apk,可以直接安装到手机上体验
2 doc文件夹下面是开发文档,有主要的接口描述和参数介绍
3 自己开发的话,需要引入一个jar包和一个so库,lib文件夹下面就是你的appid对应的so库和jar包
4 sample里面是一个工程,可以直接导入到eclipse里面,里面是主要接口的使用示例,run之后,也就是bin下面的SpeechDemo了
好了,废话不多说,直接建一个自己的工程,开始试一下使用这个服务吧!
新建一个工程,里面本身就有一个MainActivity和activity_main.xml,修改一下布局文件,添加一个按钮:
<Button android:id="@+id/startRecognizer" android:layout_width="wrap_content" android:layout_height="wrap_content" android:text="startRecognizer"/><TextView android:id="@+id/result" android:layout_width="wrap_content" android:layout_height="wrap_content" android:text="result:" android:layout_below="@id/startRecognizer" />
android上有三个sdk,分别有三个功能,三个sdk的区别参见 http://club.voicecloud.cn/forum.php?mod=viewthread&tid=6843
现在就以有界面的SDk为例,使用时,需要用到的是开发包中的msc.jar和libmsc.so,将libms.so放到工程中的libsarmeabi文件夹下(根据cpu型号选择放哪个库),将msc.jar放到工程中的libs文件夹下。
在MainActivity中添加按钮的点击事件,具体代码如下:
package com.personal.iflytekdemo;
import com.iflytek.cloud.speech.RecognizerResult;
import com.iflytek.cloud.speech.SpeechConstant;
import com.iflytek.cloud.speech.SpeechError;
import com.iflytek.cloud.speech.SpeechListener;
import com.iflytek.cloud.speech.SpeechUser;
import com.iflytek.cloud.ui.RecognizerDialog;
import com.iflytek.cloud.ui.RecognizerDialogListener;
import android.os.Bundle;
import android.app.Activity;
import android.view.Menu;
import android.view.View;
import android.view.View.OnClickListener;
import android.widget.TextView;
import android.widget.Toast;
public class MainActivity extends Activity implements OnClickListener{
private RecognizerDialog myDialog;@Overrideprotected void onCreate(Bundle savedInstanceState) { super.onCreate(savedInstanceState); setContentView(R.layout.activity_main); findViewById(R.id.startRecognizer).setOnClickListener(this); SpeechUser.getUser().login(MainActivity.this, null, null, "appid=xxxxxxxx", loginListener);}@Overridepublic boolean onCreateOptionsMenu(Menu menu) { // Inflate the menu; this adds items to the action bar if it is present. getMenuInflater().inflate(R.menu.main, menu); return true;}@Overridepublic void onClick(View v) { // TODO Auto-generated method stub switch(v.getId()) { case R.id.startRecognizer: myRecognize(); break; default : break; }}private SpeechListener loginListener = new SpeechListener(){ @Override public void onCompleted(SpeechError error) { // TODO Auto-generated method stub if(error!=null) Toast.makeText(MainActivity.this,"login failed", Toast.LENGTH_SHORT).show(); else Toast.makeText(MainActivity.this,"login success", Toast.LENGTH_SHORT).show(); } @Override public void onData(byte[] arg0) { // TODO Auto-generated method stub } @Override public void onEvent(int arg0, Bundle arg1) { // TODO Auto-generated method stub }};private void myRecognize(){ myDialog =new RecognizerDialog(this); //设置引擎为转写 myDialog.setParameter(SpeechConstant.DOMAIN, "iat"); //设置识别语言为中文 myDialog.setParameter(SpeechConstant.LANGUAGE, "zh_cn"); //设置方言为普通话 myDialog.setParameter(SpeechConstant.ACCENT, "mandarin"); //设置录音采样率为 myDialog.setParameter(SpeechConstant.SAMPLE_RATE, "16000"); //设置监听对象 myDialog.setListener(recognizerDialogListener); //开始识别 myDialog.show();}private RecognizerDialogListener recognizerDialogListener = new RecognizerDialogListener(){ @Override public void onError(SpeechError error) { // TODO Auto-generated method stub } @Override public void onResult(RecognizerResult result, boolean isLast) { // TODO Auto-generated method stub ((TextView)findViewById(R.id.result)).append(result.getResultString()); }};
}
然后,在AndroidManifest.xml中添加以下权限:
好了,最后就开始运行吧,一下是笔者运行结果截图:
返回的结果是json格式的,接下来就是需要你来解析返回的json结果了,具体的解析方法,在sample里面的demo工程中也有,可以参见官网上下载的开发包中demo工程中的com.iflytek.mscdemo.util.JsonParser.java
到此为止,就哦了,开始体验你的语音之旅吧!
- 使用科大讯飞的语音技术实现语音识别
- 使用科大讯飞的语音技术实现语音识别
- [语音合成技术第四讲]使用C++实现语音识别
- ios语音识别实现——科大讯飞的使用
- 使用科大讯飞提供的SDK实现android语音识别
- 语音识别技术的基础
- 语音识别技术的先锋
- 语音识别的技术原理
- 语音识别技术的最新进展
- iOS 使用科大讯飞技术实现语音转文字(语音听写)
- 在.net中使用语音识别和语音合成技术
- 语音识别技术在树莓派平台上的使用
- 语音识别技术简述
- 语音识别技术
- 语音识别编程技术
- 语音识别编程技术
- 语音识别技术
- 语音识别技术简述
- 序列化和反序列化
- UI_网络编程
- 方便测试的 adb 命令 集合
- leetcode-118 Pascal's Triangle
- Android 在程序中关闭和打开屏幕
- 使用科大讯飞的语音技术实现语音识别
- android - anim translate中 fromXDelta、toXDelta、fromYDelta、toXDelta属性
- 2015年4月7号的日志
- CentOS7 或 RHEL7 mount windows共享目录 Permission denied 问题
- CentOS连接OpenVPN教程(Linux下OpenVPN客户端配置教程)
- nyoj-1156-素数三元组
- Boosting算法简介
- Foundation框架——集合初级
- vc中通过ADO操作数据库