游客來到有電子導覽機的世博會場館,在租賃處花20元租一臺導覽機,就可直接從專門通道進館參觀。帶上耳機,打開手中一臺PSP大小的導覽機,事先存儲在導覽機中的展館信息就會通過畫面和語音播放。導覽機中存儲的內容相當豐富,內容多達近20項。游客既可以手工選擇,也可以通過感應遍布在館內的無線基站,走到哪里,講解到哪里。
在導覽機幫助下,在世博會場館的參觀過程非常順暢,所獲得的信息也非走馬觀花。當游客從出口處離開,手中的導覽機發出警報,提示游客到指定地點歸還機器。工作人員表示,一臺導覽機成本大約在700元人民幣,警報是為了避免有游客將機器帶出場館范圍。
與一般導覽機相比,世博會上使用的第二代電子導覽機受環境影響小,適合在噪雜,無線信號紛亂的室內使用,無線定位精度達到0.5米,即使人洶涌,依然能做到對世博游客的個性化導游服務。




無線導覽機的語音合成技術介紹
語音合成,又稱文語轉換技術,能將任意文字信息實時轉化為標準流暢的語音朗讀出來,相當于給機器裝上了人工嘴巴。它涉及聲學、語言學、數字信號處理、計算機科學等多個學科技術,是中文信息處理領域的一項前沿技術,解決的主要問題就是如何將文字信息轉化為可聽的聲音信息,也即讓機器像人一樣開口說話。我們所說的“讓機器像人一樣開口說話”與傳統的聲音回放設備(系統)有著本質的區別。傳統的聲音回放設備(系統),如磁帶錄音機,是通過預先錄制聲音然后回放來實現“讓機器說話”的。這種方式無論是在內容、存儲、傳輸或者方便性、及時性等方面都存在很大的限制。而通過計算機語音合成則可以在任何時候將任意文本轉換成具有高自然度的語音,從而真正實現讓機器“像人一樣開口說話”。



為了合成出高質量的語言,除了依賴于各種規則,包括語義學規則、詞匯規則、語音學規則外,還必須對文字的內容有很好的理解,這也涉及到自然語言理解的問題。下圖顯示了一個完整的文語轉換系統示意圖。文語轉換過程是先將文字序列轉換成音韻序列,再由系統根據音韻序列生成語音波形。其中一步涉及語言學處理,例如分詞、字音轉換等,以及一整套有效的韻律控制規則;第二步需要先進的語音合成技術,能按要求實時合成出高質量的語音流。
無線導覽機的語音合成和語音識別技術是實現人機語音通信,建立起一個有聽和講能力的口語系統所必需的兩項關鍵技術。使電腦具有類似于人一樣的說話能力,是當今時代信息產業的重要競爭市場。和語音識別相比,語音合成的技術相對說來要成熟一些,并已開始向產業化方向成功邁進,大規模應用指日可待。





您好,歡迎蒞臨鷹米智能科技,歡迎咨詢...
![]() 觸屏版二維碼 |