微软开源认知服务CNTK的测试(语音训练)
来源:互联网 发布:python 数据挖掘 项目 编辑:程序博客网 时间:2024/05/16 01:16
前段时间,微软开源了认知服务的工具箱,直到近期才有时间进行测试。
看了文档,这个CNTK工具包还是非常厉害的,可以支持语音识别,图像分类,机器翻译等多种任务。里面也集成了多种深度学习的模型。such as deep neural networks (DNNs), convolutional neural networks (CNNs), recurrent neural networks (RNNs), long short term memory (LSTM), logistic regression, and maximum entropy model, that can be illustrated as a series of computational steps
基本上将主流的深度学习框架都涵盖在里面了。
(1) 安装步骤:
准备工作
1、 现在编译好的win下的安装包:https://github.com/Microsoft/CNTK/releases,(有不同版本)
2、 解压到下面文件夹:E:\\cntk安装\CNTK-2-0-beta4-0-Windows-64bit-GPU-1bit-SGD
安装必要环境:
E:\cntk安装\CNTK-2-0-beta3-0-Windows-64bit-GPU-1bit-SGD \cntk\prerequisites所有文件,以及安装python3.4以上版本,并安装https://repo.continuum.io/archive/Anaconda3-4.1.1-Windows-x86_64.exe
说明:本文Anaconda3安装目录为:E:\Anaconda3
创建cntk python环境
进入目录E:\Anaconda3\scripts
使用命令:conda env create --file E:\zhangxiong\cntk安装\CNTK-2-0-beta4-0-Windows-64bit-GPU-1bit-SGD\cntk\Scripts\install\windows\conda-windows-cntk-py34-environment.yml
注:这个过程可能无法一次成功,使用命令conda clean –-lock解锁之后,重新执行上述命令
pipinstall E:\cntk安装\CNTK-2-0-beta4-0-Windows-64bit-GPU-1bit-SGD\cntk\cntk\Python\cntk-2.0.beta4.0-cp34-cp34m-win_amd64.whl
安装CNTK python 环境
安装上述教材会报错:xxxx.whl is not asupported wheel on this platform
这是由于官方教程中python版本不一致(可能是更新所致),因此需要将cntk-2.0.beta3.0-cp34-cp34m-win_amd64.whl文件改名为cntk-2.0.beta3.0-cp35-cp35m-win_amd64.whl
再执行上述代码:
设置环境变量:
setx PATH=E:\cntk安装\CNTK-2-0-beta4-0-Windows-64bit-GPU-1bit-SGD\cntk\cntk;%PATH%
测试验证安装是否成功
进入example目录:E:\cntk安装\CNTK-2-0-beta4-0-Windows-64bit-GPU-1bit-SGD\cntk\Examples\Tutorials\LogisticRegressionAndMultiClass
使用命令:
cntkconfigFile=lr_bs.cntk makeMode=false command=Train
训练成功:目录中生成model文件夹,如图所示
训练并测试一个算法:
cntk configFile=lr_bs.cntk makeMode=false command=Train
:Output:DumpNodeInfo:Test
根据测试文件生成了MC.txt.z测试结果文件(在Linux下可打开查看)
语音测试speech
进入目录E:\cntk安装\CNTK-2-0-beta4-0-Windows-64bit-GPU-1bit-SGD\cntk\Examples\Speech\AN4\Data
输入命令:
cntk configFile=../Config/FeedForward.cntk
同样可以得到训练模型
后续根据该训练模型就可以实现语音的识别。
- 微软开源认知服务CNTK的测试(语音训练)
- Qt 调用微软认知 语音识别服务
- Bing Speech微软必应语音认知服务-文字语音互转
- 对标Google,微软开源其人工智能CNTK
- 微软认知服务,人脸识别技术的初级实现
- 如何备份微软的语音识别引擎的训练配置文件
- 测试的初步认知
- 微软开源深度学习工具包CNTK更新2.3版,带来多重性能改进
- 微软认知服务开发实践(1) - 牛津计划简介
- 微软认知服务开发实践(2) - 计算机视觉
- 微软认知服务开发实践(3) - 人脸识别
- 微软认知服务开发实践(4) - 情绪识别
- 微软认知服务开发实践(5) - 视频检测
- 微软认知服务 人脸识别 API 之 概述
- 微软认知服务 人脸识别 API 之 发现
- 微软认知服务 人脸识别 API 之 查找相似
- 微软认知服务 人脸识别 API 之 识别
- 微软认知服务 人脸识别 API 之 确认
- css单边投影与双侧投影
- SSH框架---核心原理(二)
- 闲谈--心态
- 安装apk时出现错误Failure [INSTALL_FAILED_DEXOPT]问题解决的方法
- servlet 验证码
- 微软开源认知服务CNTK的测试(语音训练)
- List集合转化为自定义规则的字符串,List集合序列化为一个String 字符串(规则自己定)
- SpannableString的使用
- C#和C++混合编程
- myeclipse内存优化方法备忘
- Win7(64) + eclipse(64)+ tomcat7(64)+ jdk7(64)开发环境配置
- C#中的is和as操作符
- android databinding实践之:databinding 注解
- openstack定制开发