快速把文本轉化爲影片!AI 影片生成器 Synthesia、Pictory、Deforum Stable Diffusion 介紹與教學

在這個網路發達的世代,網絡視頻已經成爲各大商家宣傳自己的重要媒介。但原來即使沒有攝影器材,不懂剪輯軟件,也能創作出精美的影片!現時網上有許多 AI 影片生成器,不需要任何攝影器材就能夠自動將文本、網頁内容、關鍵詞等製作成爲影片。如果你想利用影片去宣傳自己的品牌,不妨試試以下 3 個 AI 影片生成器。

Synthesia

於 2017 年推出的 Synthesia 是由四名分別來自 UCL,Stanford,TUM 和 Cambridge 的 AI 研究者成立的。他們希望能夠鼓勵用戶在沒有相機、收音工具或工作室的情況下自由地進行影片創作。使用程式時只需要寫出文字稿,就能自動生成一隻由 AI Avatar 讀出脚本的影片。全程不需要錄影的拍攝方法顛覆了現今内容創作的模式,提升用戶的創作效率。

在使用 Synthesia 時,首先要選擇適合你影片用途的模本,再寫出影片脚本,其後選擇喜歡的 Avatar 去讀出你的脚本,最後可以下載成品並將其發佈。當然,免費版會有所限制,只能使用基本的功能,並不能自行選擇 Avatar。

synthesia ai video generation 人工智能影片生成器
Photo Credit: Synthesia

小編使用免費版本時,只能有限度地選擇適合影片主題的模板,在寫作限制下也只能寫出 200 字符以内的文稿。寫好了文稿后就可以按下 Continue 鍵,隨後填寫電郵地址即可獲得專屬的 AI 影片。

synthesia ai video generation 人工智能影片生成器
Photo Credit: Synthesia

填寫電郵地址後,大約 3 分鐘就收到一封郵件表示成品已經完成,指示我按下鏈接前往影片所在網址。

synthesia ai video generation 人工智能影片生成器

不同模板中會出現不同的字體版面,以上就是 Learning & Development 模板的固有字體版面,在免費版中不論你所打的文稿關於什麽,影片最後都會呈現這些字體版面,所以最終有可能出現實際影片與文本内容不相符的情況。

雖然免費版有許多限制,但成品卻意外地自然,Avatar 發音標準流暢,並沒有平常 AI 影片的生硬感。

值得一提的是,Synthesia 支援超過 120 種語言和口音,用戶能自由地選擇影片語言。單單中文這個語言已經分爲幾種口音,甚至支援廣東話視頻。小編試過在文本欄中打入中文,產出了 Avatar 講出流利中文的影片,應用上十分方便。可惜的是免費版無法選擇口音,只能默認製作出普通話的視頻。

Pictory

另一個 AI 影片生成器 Pictory 是一間 2019 年在美國西雅圖成立的初創公司。其中一名創辦人 Vikram Chalana 表示:「我們觀察到現在人工智能在内容創作上的重要角色,也看到了圖像設計大衆化的趨勢,因此有了創辦 Pictory – 用 AI 令影片製作大衆化的想法。」

他們的團隊更發現,縱然全球的短視頻市場越趨變大,但許多商業機構依然在使用冗長的文章、網誌去宣傳。這時,Pictory 就能夠運用 AI 技術自動把文稿、網誌或圖片分析並連同網絡上的無版權相片合成影片,使各大公司能方便且有效地製作影片,與受衆有更高的互動率。

pictory ai video generation 人工智能影片生成器
Photo Credit: Pictory

Pictory 分別有 Script to Video,Article to Video,Edit Videos using Text 和 Visuals to Video 四個功能。小編今天將會試用 Script to Video 和 Article to Video 這兩個功能。

Article to Video
只要在 Article to Video 一欄中複製想要轉換成視頻的文章所在 URL 就可以自動識別出文章重點,繼而合成短視頻。

pictory ai video generation 人工智能影片生成器
Photo Credit: Pictory

小編這次想把 Fimmick Academy 的文章變成影片用作宣傳用途,在複製 URL 後等待幾秒系統就自動識別了文章重點,並將其劃分爲小段句子。雖然的確點出文章重點,但有時還是需要人手微調一下字句確保萬無一失。

pictory ai video generation 人工智能影片生成器
Photo Credit: Pictory

確定影片文字内容後就可以自由選擇合適的影片主題。小編這次選擇了 Standard,希望影片主題可以低調且專業。

最後影片成品比想象中好,AI 自動尋找的背景影片與文章重點相符,系統會將它認爲的重點標注爲不同顏色,視覺上更突出。但是有時 AI 找出來的背景影片也有可能與自己想表達的不同,這時候可以展開一個影片列表,裏面有一系列 AI 推薦的影片可供選擇。總體來看 Article to Video 這個功能非常簡單易用。

Script to Video
Pictory 官網上推薦用戶在製作教育、説明用途的影片時使用。製作時只需要在網頁中輸入或複製相關文稿就可以隨即合成影片。同樣地,這次小編在 Fimmick Academy 找到一小段文字,去試試看 Script to Video 這個功能。

pictory ai video generation 人工智能影片生成器
Photo Credit: Pictory

只要簡單地把想呈現出來的文字分段打出來,之後再選擇相應的影片主題即可。

等待不出一分鐘後,影片就剪輯完成了。配圖基本上與文本對應,有時也會出現圖文不符的情況。但作出輕微人手調整後成品還算滿意,想表達的資訊也基本上可以清晰表現出來。

Deforum Stable Diffusion

這個軟件是 Replicate 的其中一個 AI 合成工具。Replicate 是由一群工程師及創作者組成的一個平台,他們致力於提供不同的 AI 軟件給人們使用,並認爲 machine learning 不應該只局限於高學歷的人使用,而是應該要普及化,降低其使用門檻。秉持著這個信念,他們不斷完善平台上的各種 AI 創作工具,令人們可以隨意在網上發揮他們的創作力。

而 Deforum Stable Diffusion 這個軟件則能夠把一段文字利用 AI 技術自動合成一條連續動畫影片。與前面介紹的軟件不同,這款軟件能夠把自動生成的動畫串聯起來,使他們變得連貫,令視頻的呈現變得更順暢自然。

Photo Credit: Deforum Stable Diffusion

免費版只有兩次試用機會,看完網頁提供的示範後可以自己試著打出一些文字,例如一棵樹、一個蘋果、小女孩、女孩在森林中行走和天空等元素。然後合成出來的視頻就會串聯著這幾個元素的畫面。視頻的風格可能有點抽象,但是該展現出來的元素都會呈現到,相信如果多試幾次,再做微調後會達到更好的效果。

網站上亦展示了很多用戶創作出來的動畫影片給大家欣賞及參考,以下就是其中一位用戶創作出來的「A journey」,影片中自然地展現出一個人在不同場景的旅程,感覺就像平時插畫書中會出現的畫面。

總體而言 Deforum Stable Diffusion 這款軟件能夠製作出來的動畫影片質量高且仔細,許多細節都能夠被表現出來,但對新手而言一開始可能難以掌握,需要多次嘗試及練習才能真正製作出心目中的動畫影片。

比較 3 個 AI 影片生成器

Synthesia,Pictory 和 Deforum Stable Diffusion 都是簡單易用的免費 AI 影片生成器,用戶只需要輸入一些文字或指令系統就可以自動生成精美的影片。

三款影片生成器各有不同,Synthesia 主要能滿足到需要一個人物幫忙作出解説的用途,Pictory則能夠輕鬆地幫助用戶將文本變爲影片,Deforum Stable Diffusion 則更為藝術性一些,適合比較希望獲得創作靈感的人。由於他們的功能各不相同,大家可以根據自己的需求自由地選擇使用哪一種軟件。

總結

如今的網絡世界興起速食文化,人們漸漸會花越來越少的心力、時間仔細閲讀文本的 blog posts,可能轉而去觀看相關的影片。這時候,AI 影片生成器能夠迎合市場需要,幫助商家在短時間内合成大量資訊性的影片去宣傳自己。不但節省製作成本,還提高了與客戶的互動率,可以説是兩全其美。

但是,在方便大家的同時,這些嶄新的工具也引起了不同爭議,例如 AI 在生成影片時可能引起的種族歧視、加深刻板印象等情況,這些問題都值得我們去反思和注意。你認爲這些 AI 生成工具在未來會取代影片編輯者嗎?歡迎到 Facebook 和我們分享一下!

※ 此專欄文章為作者觀點,不代表本網立場。※

作者:Boling

訂閱電子報

最新文章

解鎖 AI 真正潛力!Google 69 頁 Prompt 秘笈公開,生產環境實戰指南

解鎖 Google 官方認證 Prompt 技巧!獲取 69 頁 AI 調教指南,掌握生產環境防呆設定、成本控制與人格設定實戰心法,附可下載 PDF 與案例模板

OpenAI.FM:OpenAI 推出的文字轉語音模型

OpenAI.FM 是 OpenAI 推出的革命性文字轉語音(TTS)模型,能生成高度自然的語音輸出,適用於有聲書、客服機器人、語言學習等場景。本文深入解析其技術原理、應用優勢及未來發展,帶你了解 AI 語音技術的最新趨勢!

Tanka:搭載 AI 長期記憶的團隊協作利器

在資訊爆炸的時代,團隊協作面臨著前所未有的挑戰。如何高效地溝通、共享知識、追蹤進度,成為企業提升效率的關鍵。為此,全球首款搭載 AI 長期記憶的通訊工具 Tanka 應運而生。

Gemini Code Assist 的全面分析

探索 Google 的 Gemini Code Assist,一款 AI 編碼助手,提升開發效率與程式碼品質。支援多語言與 IDE,提供免費個人版及付費企業版,適合初學者與專業團隊。立即了解其功能與優勢!

Google 推出 PaliGemma 2 mix

Google 於 2025 年 2 月 19 日推出 PaliGemma...