调用百度API实现简单的文字识别

来源:互联网 发布:哈尔滨师范大学数据 编辑:程序博客网 时间:2024/06/06 14:21

偷懒是学习的动力。最近上的课程多数是英文的材料,而且还是图片,对于我这种英语恐惧症的人而言就是噩梦,unfriendly!!!!于是发现了百度的api–OCR

具体细节请看API文档:http://ai.baidu.com/docs#/OCR-API/top

第一步获取access_token

首先需要进行百度开发者认证,然后创建一个文字识别的应用
image.png

import requestsimport ssl,sys# 获取tokenhost =  'https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials&client_id=&client_secret='# 填入 自己的APIKEY 和SKheaders = {    'Content-Type':'application/json;charset=UTF-8'}res = requests.get(url=host,headers=headers).json()print(res['access_token'])

第二步调用api

import requestsimport base64import ssl,sysurl = 'https://aip.baidubce.com/rest/2.0/ocr/v1/general_basic'  data = {}  data['access_token']='刚才回去的token'#读取图片  file=open('1.png','rb')  image= file.read()  file.close()  data['image'] = base64.b64encode(image)  headers={    "Content-Type":"application/x-www-form-urlencoded",    "apikey":"自己的APIkey"}res = requests.post(url=url,headers=headers,data=data)result = res.json()with open("1.txt","a") as f:    for line in result["words_result"]:        print(line["words"],end="")        f.write(line["words"]+"\n")