DAV首頁(yè)
數字音視工程網(wǎng)

微信公眾號

數字音視工程網(wǎng)

手機DAV

null
null
null
卓華,
null
null
null
null
null
null

我的位置:

share

關(guān)于語(yǔ)言清晰度(可理解性)的深入洞察(三)

來(lái)源:同創(chuàng )音頻        編輯:ZZZ    2024-06-26 08:52:38     加入收藏

聲音的指向性,即聲音在不同方向上傳播的強度和特性。

 在上一期中,我們深入探討了語(yǔ)音頻譜、共振峰以及影響語(yǔ)言清晰度的關(guān)鍵因素。本期,我們將聚焦聲場(chǎng)對語(yǔ)言清晰度的影響,并為大家總結麥克風(fēng)放置的實(shí)用規則。

 

 關(guān)于聲場(chǎng)對語(yǔ)言清晰度的影響

 在探討聲場(chǎng)對語(yǔ)言清晰度的影響時(shí),一個(gè)關(guān)鍵的觀(guān)察點(diǎn)是聲音的指向性,即聲音在不同方向上傳播的強度和特性。通過(guò)精心設計的實(shí)驗和測量,我們可以觀(guān)察到聲場(chǎng)中的諸多細節,這些細節對于理解如何捕捉和傳達清晰的語(yǔ)言至關(guān)重要。

 當發(fā)言人發(fā)言時(shí),其聲音不僅受到周?chē)晥?chǎng)環(huán)境的影響,還受到人的頭部和身體的影響。這種影響在多個(gè)維度上展現,包括指向性、距離與方向、以及頭部和胸部的反射等。

下面是人類(lèi)說(shuō)話(huà)者在垂直和水平平面上的極坐標圖。

(參考: Chu, W.T.; Warnock, A.A.C.: Detailed Directivity of Sound Fields Around Human Talkers.)

 首先,值得注意的是,當我們繪制出人類(lèi)說(shuō)話(huà)者在垂直和水平平面上的極坐標圖時(shí),可以發(fā)現一個(gè)明顯的現象:電平在經(jīng)過(guò)A加權后,男性和女性在正面和背面之間的差值大約為7dB。這意味著(zhù)聲音在直接面對的方向上最為強烈,而在背后則相對較弱。

 然而,這一數據并沒(méi)有揭示出關(guān)于頻率相關(guān)性的全部信息。事實(shí)上,高頻聲音在背面的衰減比低頻聲音更為顯著(zhù)。這一發(fā)現對于麥克風(fēng)的選擇和放置位置具有指導意義,因為它意味著(zhù)為了捕捉更多的高頻細節,麥克風(fēng)需要更加靠近說(shuō)話(huà)者的正面。

(參考: Chu, W.T.; Warnock, A.A.C.: Detailed Directivity of Sound Fields Around Human Talkers.)

 從上圖可以看出,方向性從大約1kHz及以上增加。將這一事實(shí)與1kHz以上頻率的重要性相結合,很明顯,當在人前面而不是在人后面拾音時(shí),可以獲得更高的可懂度。

(參考: Chu, W.T.; Warnock, A.A.C.: Detailed Directivity of Sound Fields Around Human Talkers.)

 此外,在垂直面上,我們注意到一個(gè)有趣的細節:與其他方向相比,330°方向(大致指向胸部區域)的水平面更高。這并非偶然,而是由于聲音從胸部反射出來(lái)所導致的。這種反射不僅增強了該方向上的聲音強度,還可能對頻譜產(chǎn)生一定的影響,尤其是在低頻部分。

 

 距離與方向

 由于并非所有麥克風(fēng)都放置在距離講話(huà)者1米的地方,因此了解當我們靠近聲源時(shí)會(huì )發(fā)生什么是很有趣的。

 下圖顯示了在給定方向上1米處記錄的語(yǔ)音頻譜的偏差。角度(+45度、0度和-45度)在垂直平面內。這些結果是10個(gè)談話(huà)者的平均值。

 三個(gè)圖中的每條線(xiàn)分別顯示了80厘米、40厘米、20厘米和10厘米處的偏差。

 如果在改變方向和距離時(shí)頻譜沒(méi)有變化,所有曲線(xiàn)都將是直線(xiàn),但隨著(zhù)我們離談話(huà)者越來(lái)越近,偏差會(huì )增加。

 下圖顯示了從軸向平面向上45°的測量位置。與這里的偏差是微妙的。而不那么依賴(lài)于距離。

 下圖顯示了當我們在軸向平面下方45°的測量位置。身體對聲音的反射對的影響是巨大的。

 下圖顯示了在軸向上偏差在一定程度上介于其他兩個(gè)之間,這意味著(zhù)語(yǔ)音的頻譜隨著(zhù)到麥克風(fēng)的距離而變化。

(參考: Brixen, Eddy B.: Near field registration of the human voice: Spectral changes due to positions. AES Convention 104, Amsterdam, the Netherlands. Preprint 4728)

 研究表明,聲音在垂直和水平平面上都表現出明顯的指向性,其中高頻聲音的指向性尤為顯著(zhù)。這意味著(zhù)在麥克風(fēng)拾音時(shí),麥克風(fēng)的位置和方向對語(yǔ)音清晰度至關(guān)重要。此外,隨著(zhù)我們與聲源的距離變化,語(yǔ)音的頻譜也會(huì )發(fā)生變化,這進(jìn)一步強調了麥克風(fēng)放置的重要性。

 對于頭部和胸部的反射,研究同樣揭示了它們對語(yǔ)音頻譜的顯著(zhù)影響。領(lǐng)夾式麥克風(fēng)或頭戴式麥克風(fēng)雖然提供了行動(dòng)自由,但也可能導致記錄的頻譜與自然感知的頻譜存在差異。因此,在選擇和放置麥克風(fēng)時(shí),我們需要考慮這些因素對語(yǔ)音清晰度的影響。

 

 頭部和胸部

 在廣播和現場(chǎng)聲音應用中,首選的麥克風(fēng)通常是領(lǐng)夾式麥克風(fēng)(胸部佩戴)或頭戴式麥克風(fēng)(頭戴),這允許用戶(hù)有更多的行動(dòng)自由。人們應該意識到這樣一個(gè)事實(shí),即將麥克風(fēng)放置在如此短的距離處會(huì )導致記錄的頻譜不同于在正常收聽(tīng)距離處感知到的自然和中性頻譜。這種差異遠遠不能忽略。

 以下是五條曲線(xiàn),解釋了將麥克風(fēng)放置在身體或頭部時(shí)語(yǔ)音頻譜的變化。所有曲線(xiàn)均基于測量值,平均為10人(見(jiàn)參考文獻)。

 上曲線(xiàn)(胸部)量化了在胸部采集的語(yǔ)音頻譜與在軸上1米處采集的同一個(gè)人的語(yǔ)音頻譜的不同方式。當將麥克風(fēng)放在胸部時(shí),關(guān)鍵2-4 kHz范圍內的頻率會(huì )顯著(zhù)降低。

 第二條曲線(xiàn)(頸部)顯示了麥克風(fēng)離下巴更近時(shí)的偏差。這一立場(chǎng)非常適用于廣播,因為如果記者或受訪(fǎng)者穿著(zhù)t恤、運動(dòng)衫等或外套,這是放置領(lǐng)夾式麥克風(fēng)的唯一實(shí)用方法。在戶(hù)外使用時(shí),麥克風(fēng)可以披著(zhù)毛皮或戴在圍巾后面。在任何情況下:輔音頻率都會(huì )大幅降低。

 前額曲線(xiàn)表明,將麥克風(fēng)放在前額上是對頻譜干擾最小的位置。這個(gè)位置非常適合舞臺和電影,但不適合新聞。

 耳朵曲線(xiàn)顯示了在這個(gè)位置較高頻率的逐漸衰減。將麥克風(fēng)放置在耳朵處可以很方便;然而,它需要補償以保持語(yǔ)音可懂度。

 將麥克風(fēng)放在臉頰(耳機)時(shí),與大多數其他位置相比,2-4 kHz的范圍更好。然而,仍然需要在最高頻率下提升。DPA耳機具有內置升降裝置。

 需要注意的是,與胸部姿勢相比,“微笑的角落”(臉頰處)的語(yǔ)音水平高出約10 dB。

 從曲線(xiàn)中可以看出,在800Hz附近存在上升的一般趨勢,這可以被認為是補償的。然而,最顯著(zhù)的偏差是導致語(yǔ)音可懂度降低的衰減。這一定要時(shí)刻注意!

(參考: Brixen, Eddy B.: Spectral degradation of speech captured by miniature microphones mounted on Persons’ heads and chests. AES Convention no. 100, Copenhagen, Denmark. Preprint 4284.)

 

 麥克風(fēng)的放置規則

 基于上述分析,我們?yōu)辂溈孙L(fēng)的選擇和放置制定了以下規則:

 人聲手持麥克風(fēng)應位于口腔前方,角度為±30°,并盡量保持軸向對齊。

 領(lǐng)夾式/胸部佩戴式麥克風(fēng)應使用預均衡或后期均衡來(lái)補償在胸部位置處缺失的3-4kHz頻率范圍。

 頭戴麥克風(fēng)相對中性,但可能仍需對高頻進(jìn)行適當補償。

 講臺麥克風(fēng)應具有指向性,并指向講話(huà)者的嘴部,以減少環(huán)境噪音的影響。

 在多揚聲器環(huán)境中,應選擇定向麥克風(fēng),并確保每個(gè)揚聲器的麥克風(fēng)能夠將其他揚聲器的聲音衰減至少10 dB。

 

 結語(yǔ)與展望

 至此,關(guān)于語(yǔ)言清晰度(可理解性)的深入洞察系列已告一段落。我們希望通過(guò)這一系列文章,為大家提供了對語(yǔ)音產(chǎn)生、傳播和接收過(guò)程中影響語(yǔ)言清晰度的因素的全面理解。

 然而,音頻技術(shù)的探索永無(wú)止境。在未來(lái),我們將繼續關(guān)注音頻技術(shù)的最新發(fā)展,并為大家帶來(lái)更多關(guān)于音頻原理、前沿技術(shù)及其應用場(chǎng)景的探討。讓我們共同期待音頻技術(shù)為我們帶來(lái)的更多可能!

免責聲明:本文來(lái)源于同創(chuàng )音頻,本文僅代表作者個(gè)人觀(guān)點(diǎn),本站不作任何保證和承諾,若有任何疑問(wèn),請與本文作者聯(lián)系或有侵權行為聯(lián)系本站刪除。
掃一掃關(guān)注數字音視工程網(wǎng)公眾號

相關(guān)閱讀related

評論comment

 
驗證碼:
您還能輸入500