Python语言实现百度语音识别功能的实例


本文摘自php中文网,作者小云云,侵删。

未来的一段时间,人工智能在市场上占有很重的位置,Python语言则是研究人工智能的最佳编程语言,下面,就让我们来感受一下它的魅力吧!

百度给的样例程序,不论C还是Java版,都分为method1和method2两种,前者称为隐式(post的是json串,音频数据编码到json里),后者称为显式(post的就是音频数据)本文主要介绍了Python语言实现百度语音识别API的使用实例,具有一定借鉴价值,需要的朋友可以参考下,希望能帮助到大家。

一开始考虑到pythonwave包处理的都是“字符串”,担心跟C语言的数组不一致,所以选择低效但保险的method1,

即先将音频数据base64编码,再加上采样率、通道数等信息汇集成dict,最后总体编码成json串

结果老是报:

3300输入参数不正确

先后试过urllib2和pycurl包,都是上面情况

不得已换用method2,成功(看来wave包对音频的存储并不是“字符串”)

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

40

41

42

43

44

#encoding=utf-8

import wave

import urllib, urllib2, pycurl

import base64

import json

## get access token by api key & secret key

  

def get_token():

  apiKey = "xxxxxxxx"

  secretKey = "xxxxxxxxx"

  auth_url = "https://openapi.baidu.com/oauth/2.0/token?grant_type=client_credentials&client_id=" + apiKey + "&client_secret=" + secretKey;

  res = urllib2.urlopen(auth_url)

  json_data = res.read()

  return json.loads(json_data)['access_token']

  

def dump_res(buf):

  print buf

## post audio to server

def use_cloud(token):

  fp = wave.open('vad_0.wav', 'rb')

  nf = fp.getnframes()

  f_len = nf * 2

  audio_data = fp.readframes(nf)

  

  cuid = "xxxxxxxxxx" #my xiaomi phone MAC

  srv_url = 'http://vop.baidu.com/server_api' + '?cuid=' + cuid + '&token=' + token

  http_header = [

    'Content-Type: audio/pcm; rate=8000',

    'Content-Length: %d' % f_len

  ]

  c = pycurl.Curl()

  c.setopt(pycurl.URL, str(srv_url)) #curl doesn't support unicode

  #c.setopt(c.RETURNTRANSFER, 1)

  c.setopt(c.HTTPHEADER, http_header)  #must be list, not dict

  c.setopt(c.POST, 1)

  c.setopt(c.CONNECTTIMEOUT, 30)

  c.setopt(c.TIMEOUT, 30)

  c.setopt(c.WRITEFUNCTION, dump_res)

  c.setopt(c.POSTFIELDS, audio_data)

  c.setopt(c.POSTFIELDSIZE, f_len)

  c.perform() #pycurl.perform() has no return val 

if __name__ == "__main__":

  token = get_token()

  use_cloud(token)

运行结果

1

{"corpus_no":"6150045491002357923","err_msg":"success.","err_no":0,"result":["播放小苹果,"],"sn":"243903724071431919050"}

相关推荐:

.Net开发之微信公众平台语音识别实例详解

浅析如何利用JavaScript进行语音识别

HTML5语音识别标签写法附图_html5教程技巧

以上就是Python语言实现百度语音识别功能的实例的详细内容,更多文章请关注木庄网络博客!!

相关阅读 >>

Python数据分析怎么学

Python能做什么?Python爬虫是什么?

Python怎么定义一个变量

Python字典一个键只能有一个值吗

Python合并两个字典的效率实例比较

Python setup.py install是什么意思

Python如何求水仙花数?

Python学成后做什么

Python如何使用lxml来读写xml格式文件的实例分享

Python怎么把string变为hex

更多相关阅读请进入《Python》频道 >>




打赏

取消

感谢您的支持,我会继续努力的!

扫码支持
扫码打赏,您说多少就多少

打开支付宝扫一扫,即可进行扫码打赏哦

分享从这里开始,精彩与您同在

评论

管理员已关闭评论功能...