展覽時間:7月26日-29日
展覽地點:上海世博展覽館
展位號:H3-D512
7月26日,以“智能時代 同球共濟”為主題的2025世界人工智能大會暨人工智能全球治理高級別會議將在上海世博中心和世博展覽館舉辦。屆時,聲網(wǎng)將于H3館D512展位亮相,并發(fā)布新版對話式AI引擎。
聲網(wǎng)對話式AI引擎具備650ms超低延時響應(yīng)、優(yōu)雅打斷、選擇性注意力鎖定、全球主流模型適配等核心能力,可支持任意文本大模型快速升級為對話式多模態(tài)大模型。通過“對話式AI引擎”,開發(fā)者可以快速部署智能助手、虛擬陪伴、口語陪練、智能客服、智能硬件等對話式AI場景。
響應(yīng)快、打斷快
聲網(wǎng)對話式AI引擎的響應(yīng)延遲中位數(shù)為650ms,打斷延時中位數(shù)為340ms。
模型多、音色多
對話式AI引擎支持全球幾乎所有大模型廠商,同時支持全球主流語音合成供應(yīng)商任意切換,客戶在供應(yīng)商處定制、克隆等自定義音色也能上線。
智能打斷、無懼弱網(wǎng)
對話式AI引擎可以做到智能打斷,同時在周圍人聲很多時,基于選擇性注意力鎖定,鎖定對話人聲,準確識別誰在說話。人模對話場景下,該產(chǎn)品可以實現(xiàn)抗丟包80%以上,斷網(wǎng)3-5秒能流暢對話。
開發(fā)省心、價格省錢
從對話時AI引擎Console到任意模型開口說話,需要2行代碼+15分鐘。同時,對話式AI引擎1分鐘不到1毛錢,每分鐘價格為0.098元。
此次WAIC,聲網(wǎng)新版對話式AI引擎將首次亮相,并在人與AI對話的音頻、視頻體驗帶來全新升級,敬請期待!
聲網(wǎng)成立于2014年,是全球?qū)崟r音視頻云服務(wù)開創(chuàng)者,為人與人、人與智能體的音視頻互動提供優(yōu)質(zhì)體驗。聲網(wǎng)API已賦能AI、社交直播、教育、游戲、IoT、金融、醫(yī)療、企業(yè)協(xié)作等20余行業(yè),共計200多種場景。
(來源:世界人工智能大會)