梅延涛

梅延涛的博客

他的个人主页  他的博客

从google 的 dict中获取单词读音

梅延涛  2010年11月12日 星期五 10:46 | 2479次浏览 | 0条评论

最近狂背单词,有些单词我的语音库里面没有读音,所以只能从google上拿mp3读音,然后放到虚拟机Win里用软件转成wav的播放。昨天搜了一下才知道,原来Linux做这个太方便了…

第一步是拿音乐文件,直觉上用Python实现最快,就弄了一下:

def main():
    HOST = 'www.gstatic.com'
    PATH = '/dictionary/static/sounds/de/0/'
    BUFSIZE = 20480

    try:
        word = sys.argv[1]
    except Exception, diag:
        print diag
        return

    try:
        h1 = httplib.HTTPConnection(HOST,80)
        h1.request("GET", PATH + word +'.mp3')
        r1 = h1.getresponse()
        if r1.status == 404:
            raise Exception, "Error 404: file " + word +".mp3 not found!\n"
            return
    except Exception, diag:
        print diag
        return


    mp3of = open(word+'.mp3', 'w')  # output file

    while True:
        data = r1.read(BUFSIZE)
        if not data:
            mp3of.close()
            convToWav(word)
            return
        else:
            print len(data)
            mp3of.write(data)

#END def main():

if __name__ == '__main__':
    main()

 

弄完后发现,原来Linux下面有个命令 GET可以直接拿下来:

GET http://www.gstatic.com/dictionary/static/sounds/de/0/hello.mp3 > hello.mp3

$?返回0表示成功,返回1就是失败了。


拿下文件后,要转换成和WyabdcRealPeopleTTS一样的wav格式,方面用aplay命令播放:

mpg123 -r 11025 --8bit -w hello.wav hello.mp3

 

这个没啥大不了的,放在这里做个备份,万一那天望了这些命令可以回头来找:)

评论

我的评论:

发表评论

请 登录 后发表评论。还没有在Zeuux哲思注册吗?现在 注册 !

暂时没有评论

Zeuux © 2024

京ICP备05028076号