99行Swift编写人工智能图片识别服务器
来源:互联网 发布:杭州小周seo 编辑:程序博客网 时间:2024/05/22 13:46
今天Perfect正式公开了第一个TensorFlow Swift服务器的源代码,详细内容可以在本页链接下载:
Perfect TensorFlow 机器视觉演示程序github.com/PerfectExamples/Perfect-TensorFlow-Demo-Vision
本源代码展示了如何在服务器端使用Perfect TensorFlow开发Swift 应用,并实现人工智能图像识别的网络服务。如果您还不熟悉Perfect软件框架,请首先尝试 Perfect 模板服务器 。
本项目的主要目的是展示Perfect TensorFlow Swift的服务器端实现。
Swift 兼容性说明
本项目目前使用 Swift 3.1 或者 Swift 4.0 工具链编译,可以在macOS / Ubuntu上使用。
编译运行
运行以下命令可以运行本示例程序并在8080端口创建服务器:
git clone https://github.com/PerfectExamples/Perfect-TensorFlow-Demo-Vision.gitcd Perfect-TensorFlow-Demo-Vision./install.sh./.build/debug/PerfectTensorFlowDemo
应该能够看到以下输出:
[INFO] Starting HTTP server localhost on 0.0.0.0:8080
意味着服务器已经准备好,请访问 http://localhost:8080/ 查看演示主页,您可以如下图所示上载一个本地图片考验计算机是否能够识别,或者甚至可以用鼠标手绘一个草图来测试计算机视觉识别能力。下面的例子是上载了一个信封✉️的照片,然后服务器识别返回给客户端,用英语问这是不是一个信封,并列出了可能是信封的概率::
组合键control-c可以停止服务器运行。
服务器API
本项目的目标是制作这样的一个服务器,在调用根目录/recog函数API之后,客户端可以给服务器用POST表单发送一张图片,然后服务器对图像内容进行识别,识别完成之后返回给客户端一个json字符串,其中内容就是识别图像内容的结果;即如果图像内容是一个闹钟⏰,则回复字符串{“value”:”clock”}。
简介
本样例代码使用了一个预先训练好的机器视觉模型(数学家万岁,搞人工神经网络的数学家万岁万岁万万岁!):
(http://arxiv.org/abs/1512.00567).
您可以将人工神经网络模型文件加载到一个Perfect TensorFlow Session对象,像这样:
let g = try TF.Graph()let def = try TF.GraphDef(serializedData: model)try g.import(definition: def)
连同模型一起下载的还有一个已知物体的名单(英文)文件:
try fTag.open(.read)let lines = try fTag.readString()tags = lines.utf8.split(separator: 10).map { String(describing: $0) }// 字符串数组变量应该看起来像这样:// tags = ["dummy", "kit fox", "English setter", "Siberian husky" ...]
一旦从客户端收到图片后,服务器会将图片内容正规化:
public func constructAndExecuteGraphToNormalizeImage(_ g: TF.Graph, imageBytes: Data) throws -> TF.Tensor { let H:Int32 = 224 let W:Int32 = 224 let mean:Float = 117 let scale:Float = 1 let input = try g.constant(name: "input2", value: imageBytes) let batch = try g.constant( name: "make_batch", value: Int32(0)) let scale_v = try g.constant(name: "scale", value: scale) let mean_v = try g.constant(name: "mean", value: mean) let size = try g.constantArray(name: "size", value: [H,W]) let jpeg = try g.decodeJpeg(content: input, channels: 3) let cast = try g.cast(value: jpeg, dtype: TF.DataType.dtFloat) let images = try g.expandDims(input: cast, dim: batch) let resizes = try g.resizeBilinear(images: images, size: size) let subbed = try g.sub(x: resizes, y: mean_v) let output = try g.div(x: subbed, y: scale_v) let s = try g.runner().fetch(TF.Operation(output)).run() guard s.count > 0 else { throw TF.Panic.INVALID } return s[0] }//end normalize
然后就可以跑一下TensorFlow的会话输出:
let result = try g.runner().feed("input", tensor: image).fetch("output").run()
结果是一个概率数组,其长度与名单吻合,用于预测名单中每一个对象可能的概率。因此只要找出数组中最大概率就可以获得图像被“识别”的结果:
public func match(_ g: TF.Graph, image: Data) throws -> (Int, Int) { let normalized = try constructAndExecuteGraphToNormalizeImage(imageBytes: image) let possibilities = try executeInceptionGraph(image: normalized) guard let m = possibilities.max(), let i = possibilities.index(of: m) else { throw TF.Panic.INVALID }//end guard return (i, Int(m * 100)) }
最后一步就是把概率索引转换为对象名称,然后发给客户端:
let tag = tags[result.0] let p = result.1 response.setHeader(.contentType, value: "text/json") .appendBody(string: "{\"value\": \"Is it a \(tag)? (Possibility: \(p)%)\"}") .completed()
大功告成!就是这样简单!
当然,如果您仍然觉得服务器配置和部署比较麻烦,那么请访问Perfect官网perfect.org,下载Perfect Assistant 2.0 ,即软件助手2.0版本,即可实现Swift函数库和预装人工智能服务器整体打包管理、编译、部署一条龙,目前支持亚马逊弹性计算和谷歌应用引擎,还将陆续增加更多服务器部署方案选择,这样您就可以随时改进自己的程序应用,逐步增加人工智能和神经网络、以及机器深度学习的新功能啦!
- 99行Swift编写人工智能图片识别服务器
- Swift 3 编写的图片分享应用
- Python人工智能之图片识别,Python3一行代码实现图片文字识别
- Java编写图片上传服务器
- Golang编写简单图片服务器
- Flask搭建简单图片识别服务器
- 苹果首份人工智能报告:让机器识别图片更精准
- 人工智能,深度学习,用DQN算法,或者更新的增强算法,进行图片识别小游戏?
- swift 如何上传图片到django 的后台服务器
- Swift 头像上传(4)Alamofire上传图片到服务器
- 99行Swift完成Markdown在线编辑服务器
- 人工智能之动物识别系统
- 人工智能与OCR识别研究
- 人工智能与OCR识别研究
- 常用手势识别 swift
- swift 手势识别
- Swift-手势识别
- 图片识别
- java 中序列化的作用和好处
- MySQL 权限管理简单篇
- 大话设计模式——简单工厂模式
- AWS 连接超时分析(AWS-route53 + nginx + tomcat)
- Soot实践(一):利用Soot来获取Android的组件列表
- 99行Swift编写人工智能图片识别服务器
- 蚁人
- 二部图匹配
- maven入门:mac IntelliJ IDEA 配置maven(三)
- 为什么Dialog不能用Application的Context
- 数据仓库模型的层级结构以及范式建模和维度建模
- 用Glide框架加载图片
- 责任链(职责链)模式简例[Chain of Responsibility]
- 1106 排序