Pulseaudio

音頻播放未從頭開始

  • November 26, 2019

當我執行帶有 mpg321 或 aplay 或 sox 之類的音頻文件時,甚至在 TTS(文本說話)中執行音頻文件時,音頻僅從我第二次重現音頻文件時正確輸出……

每個文本到語音中的範例:如果寫“Hello World!” 它只說“orld”,或者如果我寫“you are a good boy”,它只說“a good boy”……為什麼?

我怎樣才能解決這個問題?

在 TTS 中,所有 TTS 都會發生這種情況:espeak、Google Api、VoiceRSS Api 等……並且也發生在我的舊樹莓(Raspbian)中,不僅在我的 Ubuntu(14.04.1 LTS)中

我猜是因為音頻引擎或類似的東西有 0.5 - 2 秒的延遲才能啟動。然後跳過音頻的第一秒或第二秒。

如果我執行相同的音頻兩次或三次等,從第二次開始它執行良好,但前提是我很快……

我需要它來進行文字朗讀。

Raspberry Pi 和 Ubuntu Machine 都通過 HDMI 連接。

我該如何解決?說出所有的話?還有一開始的音頻?

您通過 HDMI 連接的輸出設備需要幾秒鐘才能同步到它開始從您的系統接收的數據流。您可以考慮先添加幾秒鐘的靜音,或者在應用程序期間持續播放靜音以保持同步,然後在需要時混合 TTS 輸出。

編輯:似乎與這個問題有關,那裡的建議也可能有所幫助:askubuntu.com

打開 pavucontrol 會使同步保持打開狀態,所以當你想做 TTS 時就啟動它。

注意:在我的系統上打開它會阻止我啟動 SPDIF 直通(即杜比數字),但關閉它並在啟動直通之前等待幾秒鐘使它們工作。

引用自:https://unix.stackexchange.com/questions/184684