物流及供應(yīng)鏈多元技術(shù)研發(fā)中心(LSCM)邀請(qǐng)到3位名人參與「名家聯(lián)乘AI真人發(fā)聲書(shū)項(xiàng)目」,分別是特許氣象學(xué)家林超英、全國(guó)港澳研究會(huì)副會(huì)長(zhǎng)譚耀宗和著名藝人汪明荃,3人早前錄音朗讀著作部分章節(jié),LSCM利用收錄的語(yǔ)音訓(xùn)練人工智能AI模型製作人工智能AI合成語(yǔ)音。
林超英表示,是抱著理解騙案形成的心態(tài)參加,在聽(tīng)到合成錄音後覺(jué)得很震驚,擔(dān)心日後收到自己打給自己的電話(huà),連講廣州話(huà)時(shí)有少許潮州口音都可捕捉到。他希望將來(lái)這個(gè)世界可做到聽(tīng)書(shū),聽(tīng)書(shū)可記得多點(diǎn),看書(shū)是過(guò)眼雲(yún)煙,推廣聽(tīng)書(shū)風(fēng)氣或許是好的發(fā)展方向。
汪明荃稱(chēng),最近出一本書(shū)記錄粵劇進(jìn)度,而做有聲書(shū)可作推廣,人們?cè)谒奥?tīng)書(shū)可學(xué)到野。她認(rèn)為語(yǔ)氣特色很相似,達(dá)到百分之九十,害怕人們冒認(rèn)自己做其他事情,期望能盡快拿出安全方程式,既可與人分享又可節(jié)省很多時(shí)間。汪明荃相信今次只是嘗試,要製作整本書(shū)牽涉很多版權(quán)問(wèn)題,需要多方面同意才可實(shí)行。
譚耀宗透露,進(jìn)行了3小時(shí)的錄音,聽(tīng)完難分真假,害怕自己聲線(xiàn)用作其他不當(dāng)行為,而錄音的速度是比原來(lái)快20%,他解釋講慢點(diǎn)人們?nèi)菀孜眨妒翘嶙h加快10%,並發(fā)現(xiàn)AI講出來(lái)是照讀,如果能做到口語(yǔ)化會(huì)更真實(shí)。他更希望這種技術(shù)可一直鋪下去,香港人生活太忙碌,有聲好書(shū)可於跑步或健身時(shí)聽(tīng)。譚耀宗未來(lái)會(huì)錄普通話(huà),相信會(huì)很困難,因讀書(shū)時(shí)要求標(biāo)準(zhǔn),害怕懂普通話(huà)的人批評(píng)。
物流及供應(yīng)鏈多元技術(shù)研發(fā)中心研究及技術(shù)開(kāi)發(fā)總監(jiān)唐志鴻指,經(jīng)驗(yàn)顯示1至4小時(shí)錄音都可製作到合成語(yǔ)音,愈多錄音愈細(xì)微地方都可捕捉。他更提到沙聲可調(diào)校,但調(diào)校後是否與真人聲音相似是另一個(gè)課題。唐志鴻認(rèn)為製作合成語(yǔ)音需要投入很多硬件、軟件、電腦和隊(duì)伍,故只有大型科技巨頭才可做到,普通人可到有關(guān)平臺(tái)製作,但只是玩樂(lè),製作不到自己需要東西。
唐志鴻介紹,實(shí)驗(yàn)室一直製作中、英文和其他語(yǔ)言,還嘗試過(guò)俄文、阿拉伯文、西班牙文、意大利文,並會(huì)透過(guò)很便宜轉(zhuǎn)移方式,交由行業(yè)公司如出版商和作者進(jìn)行製作。(蔡啟文攝)
頂圖圖說(shuō):特許氣象學(xué)家林超英、著名藝人汪明荃和全國(guó)港澳研究會(huì)副會(huì)長(zhǎng)譚耀宗接受傳媒訪問(wèn)後合照。
特許氣象學(xué)家林超英談及參與真人發(fā)聲書(shū)原因。
全國(guó)港澳研究會(huì)副會(huì)長(zhǎng)譚耀宗認(rèn)為如果AI能做到口語(yǔ)化會(huì)更真實(shí)。
著名藝人汪明荃認(rèn)為有聲書(shū)可節(jié)省很多時(shí)間。