
80種語言可供選擇,文字轉語音軟件Ondoku。這是無需安裝,並且任何人都可免費使用的文字轉語音服務。 您還可以使用允許您免費與 ChatGPT 交談的擴展程序 ( Ondoku3-ChatGPT )。
80種語言可供選擇,文字轉語音軟件Ondoku。這是無需安裝,並且任何人都可免費使用的文字轉語音服務。 您還可以使用允許您免費與 ChatGPT 交談的擴展程序 ( Ondoku3-ChatGPT )。
Stable Diffusion XL 是一種新的生成式 AI 模型,它使用擴散過程逐漸將隨機資訊轉化為連貫的圖片。它是 Stable Diffusion 1.5 的後繼產品,它在圖片生成能力方面取得了顯著進步。
Stable Diffusion XL 的主要改進之一是它使用了更大的圖像數據集進行訓練。這導致它能夠生成更逼真和更具細節的圖片。Stable Diffusion XL 還使用了一種新的擴散過程,它可以更有效地生成圖片。這導致了生成圖片所需的時間更短,並且圖片的質量更好。
Stable Diffusion XL和Stable Diffusion 1.5主要有以下幾個區別:
規模不同:
訓練數據不同:
生成質量不同:
應用範圍不同:
根據官方提供的規格內容,總結 SDXL 1.0 主要改進:
SDXL 1.0 是一個具有多項重要改進的新型圖像生成模型。根據官方提供的規格內容,以下是我的總結:
教程
繁體中文 | 简体中文 | English |
Stable Diffision最新模型SDXL 1.0使用全教程 | How to run SDXL 1.0 model | |
BARK INFINITY 係一個功能強大嘅聲音合成器 A.I. TTS(人工智能文本轉語音)嘅開放源碼項目。由 Suno 團隊開發,基於 GPT 類模型產生語音,與其他的語音生成不同的是它含有創意部分,能夠生成真人語氣、混合語言朗讀,還包括音樂、背景雜音、和簡單的音響效果,亦可以在語音中夾雜笑聲、嘆氣和哭泣等表達。
佢可以將文字轉換成自然流暢嘅語音,俾人聽起嚟實在好似真人咁。佢有好高嘅音質同埋唔同嘅語音風格可供選擇,用家可以根據自己嘅需要同喜好進行設定。
如果你唔想自行安裝,可以去 Suno Discord 試玩,Suno 甚至可以用 txt2song 方式幫你生成歌曲。
我用咗 Tate McRae 嘅 What would you do 第一段歌詞,用 /chirp 指令生成下面的歌:
Pika Labs 是個全新的圖片轉視頻的 A.I. 工具,加入文字提示或圖片,即可生成影片視頻或動畫。
目前它只能透過 Discord 伺服器操作。您可以在 Pika Labs Discord 伺服器上的任一「#generate」頻道來生成影片。簡單使用「/create」指令,加上一些描述提示詞,或從你手機上傳一張相片。我建議您先查看「#getting-started」頻道,因為那裡包含極其有用的提示,及非常有用的參數來調整視頻的寬高比。
我用 Stable Diffusion 先做一張圖,然後用 pika 的頻道輸入: /create girl 然後上傳 Stable Diffusion 的圖片所產生的影片如下:
/create Girl smile
Prompt: 請用繁體中文,廣東話形式比較 Google Bard 與 Claude 有何不同
Google Bard > Bard 和 Claude 都是 Google AI 創建的大型語言模型。他們都接受了大量的文字和程式碼數據集的訓練,能夠生成文字、翻譯語言、編寫不同類型的創意內容,並以信息豐富的方式回答您的問題。但是,兩者之間也存在一些關鍵差異。
Bard 是事實語言模型,而 Claude 是生成語言模型。這意味著 Bard 更好地理解和回答事實問題,而 Claude 更好地生成創意文字格式,如詩歌、程式碼、腳本、音樂作品、電子郵件、信件等。此外,Bard 是基於 Transformer 架構的,而 Claude 是基於 GPT-3 架構的。這意味著 Bard 在處理自然語言方面更快、更有效率,而 Claude 在生成創意文字格式方面更好。
總的來說,Bard 和 Claude 都是強大的語言模型,具有不同的優勢和劣勢。最好的模型將取決於您的特定需求。如果您需要一個可以理解和回答事實問題的語言模型,那麼 Bard 是一個不錯的選擇。如果您需要一個可以生成創意文字格式的語言模型,那麼 Claude 是一個不錯的選擇。
Claude > 好嘅,我比較下 Google Bard 同 Claude 嘅分別:
總括嚟講,佢哋都係利用 AI 自然語言處理技術,但因為創造目的不同,所以各有特色。日後可能會互相啟發,共同進步。
Prompt: 請用廣東話介紹 OpenAI 在 7月 18 日向美國專利商標局 USPTO 提交 “GPT-5” 商標申請的情況!
Claude > OpenAI 喺 7月18 號申請咗「GPT-5」嘅商標, 打算開發一個可以處理語言、圖片同聲音嘅多模式AI系統。
GPT-5計劃可以做到自然語言處理、文字生成、理解語義、語音轉文字等等, 進一步提升 AI 嘅多媒體處理能力。
雖然 OpenAI 行政總裁早前否認佢哋而家有開發 GPT-5, 但申請商標似乎係為咗未來發展先做准備。
從功能上睇, GPT-5 可能與 GPT-4 差不多, 主要提升係喺多媒體方面。不過係咪真係有GPT-5 計劃開發, 仲要看 OpenAI 日後嘅行動同官方消息才確定得。
但無論點, AI 發展趨勢係朝多模式處理方向去, 將語言、圖片、聲音等結合, 做到更自然互動。相信 GPT-5 一日出世, 將會再次風靡全球, 值得期待佢嘅能力。
Prompt: OpenAI行政總裁早前否認佢哋而家有開發GPT-5 ?
Google Bard > 是的,OpenAI行政總裁Sam Altman在2022年11月否認了他們正在開發GPT-5的傳言。他在推特上說:「我們不會在未來幾年內推出GPT-5。」
然而,這並不意味著OpenAI沒有在開發更強大的語言模型。在2023年1月,他們發布了名為DALL-E 2的新的圖像生成模型。DALL-E 2能夠生成逼真和細緻的圖像,從文字描述中,這表明OpenAI在圖像生成方面的技術不斷提高。
因此,雖然OpenAI可能不會在未來幾年內推出GPT-5,但他們可能正在開發更強大的語言模型。我們將不得不等待才能看到OpenAI接下來會推出什麼。
Wonder Studio – 揭示CG角色變成真人場景的AI工具!
Wonder Studio,一個革命性嘅AI工具,可以將CG角色變成真人場景!無論你係一個電影製片人、遊戲開發者,定係想要添加特效嘅內容創作者,Wonder Studio都能夠助你將虛擬角色融入現實世界。
呢個AI工具有強大而智能嘅算法,可以將你嘅CG角色自動適應於真人影像中。只需上傳你嘅CG角色圖像同埋真人場景,Wonder Studio就會進行深度學習分析同埋處理。工具將根據場景中嘅光線、陰影同其他元素,自動調整CG角色嘅外觀同移動,令佢哋好似真人咁存在係影像中。
Wonder Studio具備直觀而易用嘅界面,令你可以輕鬆上手。喺工具中,你可以選擇不同CG角色嘅風格同特徵,同時亦可以調整佢哋嘅大小、位置同動作,以滿足你對真人場景嘅需求。
唔使刻意投資大量嘅時間同金錢喺創建真人場景,現在只需使用Wonder Studio,你就可以簡單地將虛擬嘅CG角色轉化成令人驚艷嘅真人場景。無論你係想要為電影增添特效、營造逼真嘅虛擬遊戲場景,抑或者喺網絡廣告中加入令人難以置信嘅CG角色,Wonder Studio係你嘅最佳選擇!
Wonder Studio 官方網站:https://www.aicamera-product.website/。