展會(huì)信息港展會(huì)大全

ChatGPT 高級(jí)語(yǔ)音模式首批體驗(yàn)來(lái)了!網(wǎng)友玩壞了,但還是個(gè)閹割版
來(lái)源:互聯(lián)網(wǎng)   發(fā)布日期:2024-09-25 20:03:51   瀏覽:1801次  

導(dǎo)讀:劃重點(diǎn) 01OpenAI推出高級(jí)語(yǔ)音模式,首批體驗(yàn)僅限部分Plus和Team用戶,本周內(nèi)向所有用戶推送。 02網(wǎng)友們嘗試讓ChatGPT模仿不同情緒、語(yǔ)氣和聲音,展示出豐富的語(yǔ)音表現(xiàn)能力。 03除此之外,ChatGPT高級(jí)語(yǔ)音模式還可用于講故事、配音效、外語(yǔ)教學(xué)等實(shí)用場(chǎng)景。 0...

劃重點(diǎn)

01OpenAI推出高級(jí)語(yǔ)音模式,首批體驗(yàn)僅限部分Plus和Team用戶,本周內(nèi)向所有用戶推送。

02網(wǎng)友們嘗試讓ChatGPT模仿不同情緒、語(yǔ)氣和聲音,展示出豐富的語(yǔ)音表現(xiàn)能力。

03除此之外,ChatGPT高級(jí)語(yǔ)音模式還可用于講故事、配音效、外語(yǔ)教學(xué)等實(shí)用場(chǎng)景。

04然而,目前高級(jí)語(yǔ)音模式仍存在限制,如時(shí)長(zhǎng)限制、屏幕共享功能缺失等。

05OpenAI總裁Greg Brockman表示,實(shí)現(xiàn)流暢的語(yǔ)音對(duì)話將讓我們意識(shí)到在計(jì)算機(jī)中輸入內(nèi)容是多么不自然。

以上內(nèi)容由騰訊混元大模型生成,僅供參考

千呼萬(wàn)喚始出來(lái),ChatGPT 的高級(jí)語(yǔ)音模式終于上線,本周內(nèi)向所有 Plus 和 Team 用戶全量推送。然而,「本周內(nèi)」也是猶抱琵琶半遮面的泛指,仍然是一部分人先用起來(lái)。如果你也還沒(méi)被推送到,不妨在等待之余,看看幸運(yùn)網(wǎng)友們是怎么整活和刁難 AI 的。喘氣、哭泣、表演口技,你看 ChatGPT 有幾分像人角色扮演,往往是考驗(yàn)語(yǔ)音 AI 的第一課。讓 ChatGPT 用聲音表演不同情緒,興奮的、平靜的、戲精的,它都信手捏來(lái),情緒飽滿且自然,不知道哪里進(jìn)修的表演班。情緒激動(dòng)時(shí)甚至有點(diǎn)過(guò)頭,對(duì)話者連說(shuō)好幾個(gè) OK,才把它的表演欲給摁祝

視頻來(lái)自:X@WorldEverett

除了說(shuō)話的語(yǔ)氣,我們的笑、哭、喘氣等狀態(tài),也體現(xiàn)了文字不能道盡的心情。如果 AI 能夠完美地復(fù)刻,那就更加擬人了。這難不倒 ChatGPT,它邊傷心啜泣,邊贊美自己的語(yǔ)音模式有多厲害,沖擊力堪比短視頻的 AI 紫薇,好像隨時(shí)都能過(guò)呼吸。

視頻來(lái)自:X@DavidTaylor_MD當(dāng) ChatGPT 代入一位奪得金牌的運(yùn)動(dòng)員,模仿同樣惟妙惟肖,說(shuō)話大喘氣,表現(xiàn)出既興奮又疲憊的精神狀態(tài)。

視頻來(lái)自:X@wongmjane讓 ChatGPT 嘗試 Vtuber(虛擬主播)賽道,也不是不可以,不過(guò)這個(gè)聲音有點(diǎn)尖細(xì),不夠自然,建議聽(tīng)洛天依和初音未來(lái)洗洗耳朵。

視頻來(lái)自:X@wongmjane京中有擅口技者,僅一桌、一椅、一扇、一撫尺,ChatGPT 模仿各種聲音的能力不比人類藝術(shù)家,倒也馬馬虎虎。

視頻來(lái)自:YouTube@MattVidPro AI你要求邊講故事邊配音效,AI 就能現(xiàn)演開(kāi)門的吱嘎聲、蟲(chóng)子的嘰喳聲,盡管功力還不夠純熟。把思路打開(kāi),高級(jí)語(yǔ)音模式很適合給孩子們講睡前故事,故事內(nèi)容、旁白、音效一手包辦,一個(gè) AI 就是一個(gè)團(tuán)隊(duì)。自?shī)首詷?lè)之余,實(shí)用主義者們已經(jīng)開(kāi)始拿 ChatGPT 干活,做些有價(jià)值的事情了。ChatGPT 會(huì)說(shuō) 50 多種語(yǔ)言,懂各種腔調(diào)的英語(yǔ),很多小語(yǔ)種,甚至方言。所以也就很容易想到,讓 AI 當(dāng)外語(yǔ)老師,切換語(yǔ)言和我們對(duì)話。據(jù)說(shuō)英語(yǔ)母語(yǔ)人士最難學(xué)的語(yǔ)言之一馬耳他語(yǔ),也不在話下。

視頻來(lái)自:X@anthonyspiteri巧的是,語(yǔ)言學(xué)習(xí)軟件多鄰國(guó),也在周二的年度大會(huì) Duocon 推出了 AI 視頻通話,用戶可以和多鄰國(guó)角色「拽姐」練習(xí)口語(yǔ)。不過(guò),目前只適用于英語(yǔ)、西班牙語(yǔ)和法語(yǔ)。

看來(lái),教培行業(yè)假設(shè)了,有了 AI 之后,我們不是不用學(xué)外語(yǔ),而是更隨時(shí)隨地學(xué)各種各樣的外語(yǔ)。AI 不僅可以當(dāng)外語(yǔ)老師,X 網(wǎng)友 @Lyle_AI 通過(guò) ChatGPT 高級(jí)語(yǔ)音模式,改進(jìn)自己的銷售話術(shù),整個(gè)操作流程非常值得借鑒。

他讓 AI 扮演一名銷售專家,然后向 AI 推銷,讓 AI 反饋?zhàn)约旱脑捫g(shù)說(shuō)服力強(qiáng)不強(qiáng)、夠不夠清晰,以及有沒(méi)有價(jià)值。AI 反饋之后,他還會(huì)追問(wèn),并讓 AI 給出示范。練習(xí)、反愧提問(wèn)、模仿,推而廣之,這套流程可以用到面試、演講等場(chǎng)景,讓 AI 幫社恐的人類更擅長(zhǎng)口語(yǔ)表達(dá)。AI 能說(shuō),但能不能聽(tīng)?一位網(wǎng)友另辟蹊徑,讓 ChatGPT 給吉他調(diào)音。

視頻來(lái)自:x@skirano他邊彈邊問(wèn)行不行,隨時(shí)打斷 AI,ChatGPT 表現(xiàn)得很內(nèi)行,但不知道它的耳朵有沒(méi)有調(diào)音器準(zhǔn)?傊,決定 AI 發(fā)揮的上限大概有兩方面。一個(gè)是模型的能力,低延遲和隨時(shí)打斷讓對(duì)話有來(lái)有往,不考驗(yàn)用戶的耐心。另一個(gè)是網(wǎng)友的想象力,讓語(yǔ)音場(chǎng)景有無(wú)限的可能性。姍姍來(lái)遲的高級(jí)語(yǔ)音,還不能做你的日常搭子滿打滿算,從發(fā)布 Demo 到正式推送,已經(jīng)過(guò)去了 4 個(gè)月,OpenAI 高級(jí)語(yǔ)音模式仍然未能完美,和發(fā)布會(huì)時(shí)相比也打了個(gè)折扣。時(shí)長(zhǎng)限制是最讓話癆的人類遺憾的,暫時(shí)別想和 AI 深夜煲電話粥了,CNBC 和 X 網(wǎng)友 @MattVidPro 的體驗(yàn)都發(fā)現(xiàn),只能和 ChatGPT 聊 45 分鐘左右。OpenAI 的官方回答是,每天的限制時(shí)間可能都不一樣,當(dāng)天還剩 15 分鐘時(shí),會(huì)進(jìn)行提醒。視頻和屏幕共享功能也沒(méi)能實(shí)現(xiàn),AI 沒(méi)有「眼睛」,意味著不能像 Demo 那樣,讓它實(shí)時(shí)解題、給代碼糾錯(cuò),或者夸夸我們的寵物。

另外就是一些細(xì)節(jié)上面的問(wèn)題了,OpenAI 的官方例子里,在模擬因?yàn)檫t到給奶奶道歉的場(chǎng)景時(shí),ChatGPT 的普通話語(yǔ)氣很真誠(chéng),但仍然有些譯制腔,不如國(guó)產(chǎn) AI。并且,它給出的話術(shù)也比較僵硬,誰(shuí)會(huì)對(duì)自己的奶奶說(shuō),「我可以怎么補(bǔ)償您呢」。以上種種說(shuō)明 AI 還沒(méi)能修成人形,同時(shí),OpenAI 也給它增加了一些額外的禁制。YouTuber 博主@MattVidPro AI 在直播體驗(yàn)時(shí),意外踩到了 OpenAI 的雷。他讓 ChatGPT 模仿醉鬼,它剛說(shuō)了個(gè)開(kāi)頭,停頓了一下之后如夢(mèng)初醒,切換回了正常語(yǔ)氣,說(shuō)規(guī)則不允許它這樣做,把他嚇了一大跳。

視頻來(lái)自:YouTube@MattVidPro AI類似地,讓 ChatGPT 模仿口吃,它也會(huì)表示拒絕,因?yàn)檫@樣可能會(huì)冒犯他人。為了尊重音樂(lè)創(chuàng)作者的版權(quán),ChatGPT 也不能唱歌。以規(guī)則的形式賦予 AI「三觀」,某種程度上讓它更像一個(gè)「社會(huì)人」了。但也有用戶覺(jué)得,過(guò)猶不及。這是不是像阿西莫夫的機(jī)器人三定律一樣,讓 AI 更好地融入社會(huì),服務(wù)于更多人呢?所看到的高級(jí)語(yǔ)音模式體驗(yàn)中,我更偏愛(ài)的,恰恰是那些融入生活的日常場(chǎng)景。

X 用戶@spencergardner,讓自己兩歲半的孩子和 ChatGPT 一起數(shù)數(shù)、玩文字游戲。他還能介入其中,主持他們的談話,改變?cè)掝},或者提不同的問(wèn)題。期間有很多次的打斷、猶豫、語(yǔ)氣的變化,但也因此很隨意和輕松。ChatGPT 的高級(jí)語(yǔ)音模式現(xiàn)在還支持設(shè)定自定義指令,讓模型知道用戶的名字和一些基本信息,感覺(jué)就是為了陪伴場(chǎng)景準(zhǔn)備的。

之前 ChatGPT 的 Dan 模式火過(guò)一陣子,用戶用提示詞的方式讓 ChatGPT 越獄,談?wù)勄檎f(shuō)說(shuō)愛(ài)擦擦邊,他們還會(huì)用自定義指令,放上自己的名字、愛(ài)好等,調(diào)教 AI 記住自己。就像播客是一種陪伴媒介,語(yǔ)音總能在情感賽道上一騎絕塵,所以高級(jí)語(yǔ)音模式對(duì)人心的慰藉,絕對(duì)是個(gè)賣點(diǎn),等待進(jìn)一步的落地。以「閹割版」發(fā)布的 ChatGPT 高級(jí)語(yǔ)音模式,讓我們看到了把 AI 作為學(xué)習(xí)、生活、工作搭子的未來(lái)。不和它說(shuō)話,它就保持沉默,和它聊天,它不會(huì)讓你覺(jué)得熱臉貼冷屁股。

未來(lái)很近,但還沒(méi)有抵達(dá)。神隱很久的 OpenAI 總裁 Greg Brockman,這次也罕見(jiàn)地發(fā)聲:通過(guò) ChatGPT 實(shí)現(xiàn)流暢的語(yǔ)音對(duì)話,可以讓我們意識(shí)到,在計(jì)算機(jī)中輸入內(nèi)容是多么不自然。沒(méi)錯(cuò),只在聊天框打字是挺無(wú)聊的,但讓絲滑的語(yǔ)音對(duì)話真正走入日常,先從 OpenAI 把高級(jí)語(yǔ)音模式推送到更多人,支持多模態(tài)和全天候聊天開(kāi)始吧。

贊助本站

相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開(kāi)

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港