旗下產(chǎn)業(yè): A產(chǎn)業(yè)/?A實(shí)習(xí)/?A計(jì)劃
全國(guó)統(tǒng)一咨詢熱線:010-5367 2995
首頁(yè) > 熱門(mén)文章 > 大數(shù)據(jù)分析 > 大數(shù)據(jù)分析Python PyAudio庫(kù)語(yǔ)音API轉(zhuǎn)文字教程

大數(shù)據(jù)分析Python PyAudio庫(kù)語(yǔ)音API轉(zhuǎn)文字教程

時(shí)間:2020-07-02來(lái)源:5wd995.cn點(diǎn)擊量:作者:Sissi
時(shí)間:2020-07-02點(diǎn)擊量:作者:Sissi



  在大數(shù)據(jù)分析Python語(yǔ)音轉(zhuǎn)文字教程中,我將演示如何使用Python將語(yǔ)音轉(zhuǎn)換為文本。這可以借助“語(yǔ)音識(shí)別” API和“ PyAudio”庫(kù)來(lái)完成。
 

  語(yǔ)音是最常見(jiàn)的交流手段,世界上大多數(shù)人口都依靠語(yǔ)音相互交流。語(yǔ)音識(shí)別系統(tǒng)基本上將口語(yǔ)翻譯成文本。語(yǔ)音識(shí)別系統(tǒng)有很多現(xiàn)實(shí)的例子。例如,Apple SIRI可以識(shí)別語(yǔ)音并將其截?cái)酁槲谋尽?br />  

  語(yǔ)音識(shí)別如何工作?

大數(shù)據(jù)分析
 

  隱馬爾可夫模型(HMM)是一種深度神經(jīng)網(wǎng)絡(luò)模型,用于將音頻轉(zhuǎn)換為文本。完整的詳細(xì)過(guò)程已超出大數(shù)據(jù)分析Python語(yǔ)音轉(zhuǎn)文字教程的范圍。在大數(shù)據(jù)分析Python語(yǔ)音轉(zhuǎn)文字教程中,我將演示如何使用Python將語(yǔ)音轉(zhuǎn)換為文本。這可以借助“ 語(yǔ)音識(shí)別” API和“ PyAudio ”庫(kù)來(lái)完成。
 

  語(yǔ)音識(shí)別API支持多個(gè)API,在大數(shù)據(jù)分析Python語(yǔ)音轉(zhuǎn)文字教程中,我使用了百度語(yǔ)音識(shí)別API。有關(guān)更多詳細(xì)信息,請(qǐng)檢查 此。它有助于將語(yǔ)音轉(zhuǎn)換為文本的翻譯。
 

  Python庫(kù)

大數(shù)據(jù)分析
 

  將音頻文件轉(zhuǎn)換為文本
 

  腳步:
 

  導(dǎo)入語(yǔ)音識(shí)別庫(kù)
 

  初始化識(shí)別器類(lèi)以識(shí)別語(yǔ)音。我們正在使用谷歌語(yǔ)音識(shí)別。
 

  語(yǔ)音識(shí)別支持的音頻文件: wav,AIFF,AIFF-C,F(xiàn)LAC。 在此示例中,我使用了“ wav”文件
 

  我用過(guò)“拍攝的”電影音頻剪輯,上面寫(xiě)著 “我不知道你是誰(shuí),如果你要贖金,我不知道你想要什么,我可以告訴你我沒(méi)有錢(qián)”
 

  默認(rèn)情況下,百度識(shí)別器會(huì)讀取英語(yǔ)。它支持不同的語(yǔ)言,有關(guān)更多詳細(xì)信息,請(qǐng)參閱此文檔。
 

  碼

大數(shù)據(jù)分析
 

  輸出量

大數(shù)據(jù)分析
 

  如何轉(zhuǎn)換不同的音頻語(yǔ)言?
 

  例如,如果我們要閱讀法語(yǔ)音頻文件,則需要在recogonize_百度中添加語(yǔ)言選項(xiàng)。其余代碼保持不變。請(qǐng)參考更多 文檔

大數(shù)據(jù)分析
 

  輸出量

大數(shù)據(jù)分析
 

  麥克風(fēng)語(yǔ)音轉(zhuǎn)換成文字
 

  腳步:
 

  1、我們需要安裝PyAudio庫(kù),該庫(kù)用于通過(guò)麥克風(fēng)和揚(yáng)聲器接收音頻輸入和輸出?;旧?,它有助于使我們的聲音通過(guò)麥克風(fēng)傳播。

大數(shù)據(jù)分析
 

  2、代替音頻文件源,我們必須使用Microphone類(lèi)。其余步驟相同。
 

  碼

大數(shù)據(jù)分析
 

  我剛剛說(shuō)過(guò)“你好嗎?”
 

  輸出量

大數(shù)據(jù)分析
 

  用另一種語(yǔ)言說(shuō)話怎么樣?
 

  同樣,我們需要在Recognize_百度()中添加所需的語(yǔ)言選項(xiàng)。我正在用泰米爾語(yǔ)(印度語(yǔ))交談,并在語(yǔ)言選項(xiàng)中添加“ ta-IN”。

大數(shù)據(jù)分析
 

  我只是在泰米爾語(yǔ)中說(shuō)“你好”,它準(zhǔn)確地在泰米爾語(yǔ)中打印了文字。
 

  輸出量

大數(shù)據(jù)分析
 

  注意:
 

  百度語(yǔ)音識(shí)別API是將語(yǔ)音轉(zhuǎn)換為文本的簡(jiǎn)便方法,但需要互聯(lián)網(wǎng)連接才能運(yùn)行。
 

  在大數(shù)據(jù)分析Python語(yǔ)音轉(zhuǎn)文字教程中,我們了解了如何使用百度語(yǔ)音識(shí)別API將語(yǔ)音轉(zhuǎn)換為文本。這對(duì)于NLP項(xiàng)目尤其是處理音頻筆錄數(shù)據(jù)非常有幫助。如果您要添加任何內(nèi)容,請(qǐng)隨時(shí)發(fā)表評(píng)論!

 

預(yù)約申請(qǐng)免費(fèi)試聽(tīng)課

填寫(xiě)下面表單即可預(yù)約申請(qǐng)免費(fèi)試聽(tīng)!怕錢(qián)不夠?可先就業(yè)掙錢(qián)后再付學(xué)費(fèi)! 怕學(xué)不會(huì)?助教全程陪讀,隨時(shí)解惑!擔(dān)心就業(yè)?一地學(xué)習(xí),可推薦就業(yè)!

?2007-2021/北京漫動(dòng)者教育科技有限公司版權(quán)所有
備案號(hào):京ICP備12034770號(hào)

?2007-2022/ 5wd995.cn 北京漫動(dòng)者數(shù)字科技有限公司 備案號(hào): 京ICP備12034770號(hào) 監(jiān)督電話:010-53672995 郵箱:bjaaa@aaaedu.cc

京公網(wǎng)安備 11010802035704號(hào)

網(wǎng)站地圖