①豆包即將發(fā)布最新實時語音大模型,并將基于此模型全量上線豆包App實時語音通話功能。
豆包即將發(fā)布最新實時語音大模型,并將基于此模型全量上線豆包App實時語音通話功能。目前,豆包APP已小范圍測試最新能力,部分用戶在豆包App的實時通話界面已更新。此前,業(yè)內(nèi)就曾有消息稱豆包將上線最新情感語音大模型,測試效果超過GPT-4o。據(jù)了解,該傳言提及模型即為上述實時語音模型。最新模型通過面向語音生成和理解進行統(tǒng)一建模,區(qū)別于此前的ASR+LLM+TTS級聯(lián)方式,在對話效果上有大幅提升,實時交互上不僅低延時,也能流暢打斷。
根據(jù)火山引擎2024冬季force原動力大會披露的數(shù)據(jù),豆包大模型的日均調(diào)用量在高速增長,2024年5月豆包大模型的日均tokens調(diào)用量為1200億,7月增長到5000億,9月達1.3萬億,截止2024年12月15日已經(jīng)突破了4萬億,在7個月的時間里增長超過33倍。中信證券表示,豆包大模型表現(xiàn)超預期,體現(xiàn)字節(jié)跳動在AI的投入形成正反饋,國內(nèi)AI產(chǎn)業(yè)追趕海外的效果開始體現(xiàn),國內(nèi)龍頭公司有望加速在AI領(lǐng)域的投入。
據(jù)財聯(lián)社主題庫顯示,相關(guān)上市公司中:
海天瑞聲在互動平臺回復稱,字節(jié)跳動一直以來是公司的重要客戶,公司為其提供智能語音、計算機視覺以及自然語言等各類數(shù)據(jù)產(chǎn)品或服務。
樂鑫科技在投資者關(guān)系活動上表示,公司聯(lián)合推廣豆包大模型落地在IoT設備的相關(guān)應用方案。
《中國城市報》社有限公司版權(quán)所有,未經(jīng)書面授權(quán)禁止使用
Copyright ? 2015-2025 by www.yktax-zh.com. all rights reserved