news

AI日報|ChatGPT 一鍵生成 PPT!CapCut 聯手 Gemini 剪片變超簡單,騰訊超強翻譯模型開源

May 22, 2026
Updated May 22
1 min read

AI 科技動態:ChatGPT 測試 PowerPoint 簡報生成,CapCut 聯手 Gemini 升級影音編輯

科技圈的創新總是不停歇。每天都有許多新技術問世,不僅改變工作模式,也重塑人們的生活習慣。你知道嗎?最近這幾天,各大企業陸續推出實用的新工具。來解釋一下這些新發展如何影響大家的工作與日常。

ChatGPT 正式支援 PowerPoint 簡報製作

製作簡報往往耗費大量心力。現在 ChatGPT 推出 PowerPoint 測試版功能,直接將生成式語言模型帶入微軟的簡報軟體中。使用者只要輸入日常對話指令,就能自動生成投影片、更新現有簡報,甚至將各種雜亂的筆記轉換為結構完整的圖文內容。

這項功能目前已在全球範圍內開放測試,涵蓋企業版、教育版以及一般免費用戶。這不僅節省時間,更讓排版變得輕鬆自如。

關於這項新功能,許多人會問:企業或個人資料會被拿去訓練模型嗎?大家完全可以放心。根據官方說明,預設情況下,企業版與教育版等用戶的資料,絕對不會用於改進未來的語言模型。這種設定確實能讓企業用戶安心導入。只要點擊幾下滑鼠,原本需要耗費數小時的文書排版工作,轉眼間就能輕鬆完成。

CapCut 與 Gemini 攜手合作:對話即剪輯的新體驗

影音創作者的福音來了。知名剪輯軟體 CapCut 宣布與 Gemini 展開合作,未來用戶將能夠直接在 Gemini 應用程式中,呼叫 CapCut 的進階編輯功能。這代表什麼意義?以往需要繁複時間軸操作的剪輯流程,即將轉變為直覺的「對話式」體驗。

使用者只需透過文字對話,就能精確調整影像與影片細節。這種互動模式讓創意工作流程變得更加連貫。開發團隊相信,未來的內容創作一定會走向高度對話與智能化整合。這僅僅是個開端,後續勢必會有更多令人驚豔的應用場景出現,讓剪輯變得像聊天一樣簡單。

騰訊開源 Hy-MT2 翻譯模型:輕量級與多語種的突破

語言隔閡一直是國際交流的一大挑戰。騰訊團隊最新發布的 Hy-MT2 多語種翻譯模型 帶來了令人矚目的進展。這個系列包含 1.8B、7B 以及採用混合專家架構的 30B-A3B 等多種尺寸,支援高達 33 種語言的互相翻譯。

值得一提的是,針對終端設備的部署需求,團隊運用了 AngelSlim 1.25-bit 極限「量化」技術。這項技術讓 1.8B 輕量級模型 的儲存空間大幅縮減至區區 440 MB,同時將推論速度提升了 1.5 倍。即便體積小巧,其整體表現依然超越市面上微軟或豆包等多款主流商業 API。

期望推動整個社群的發展,團隊也一併開源了名為 IFMTBench 的評量標準,用來檢驗模型遵循翻譯指令的能力。開發者可以透過 HuggingFace 或 ModelScope 平台,以及 7B 模型專屬頁面 取得這些資源。若要整合模型進行翻譯任務,官方也釋出了「Hy-MT2-Translator Skill」,可於 ClawHub 與 SkillHub 下載。目前騰訊也正式與 WMT26 合作舉辦「影片字幕翻譯任務」以及「通用機器翻譯任務」,邀請全球技術好手共同參與。

美團發布 LongCat-Video-Avatar 1.5:打造高穩定性數位人

數位人技術正逐漸走入日常商業應用。美團開源了最新的 LongCat-Video-Avatar 1.5 框架,專注於打造高穩定性的音訊驅動數位人。這個升級版本捨棄了舊有的 Wav2Vec2,改用語音辨識準確度極高的 Whisper-Large 作為音訊編碼器。

這樣的改動帶來了非常明顯的成效。生成的數位人不僅嘴型同步更加自然,連全身的動作穩定度也大幅提升。除此之外,這套模型具備極佳的風格適應性,不管是寫實人類、動漫角色,甚至是可愛的動物,都能完美套用。

在推論效率方面,透過先進的步數蒸餾技術,如今只要 8 個步驟就能產出高品質影像,兼顧了視覺保真度與伺服器運算成本。對技術細節感興趣的讀者,可以直接查看官方提供的 技術報告 以及位於 Hugging Face 的模型檔案。這絕對是製作虛擬主播與影音內容的強大武器,相關原始碼也可在 GitHub 專案頁面 中找到。

Claude 成為企業資安與合規的得力助手

當企業面臨日益多變的網路威脅時,防禦手段也必須與時俱進。Claude 正在協助眾多合作夥伴將 Opus 模型應用於網路安全領域。這並非紙上談兵,許多實際案例已經展現出驚人的成效。

舉例來說,資安公司 Wiz 運用 Opus 模型每週持續對超過 15 萬個生產環境資產進行攻擊模擬測試,成功找出數以千計的高風險漏洞。Palo Alto Networks 則運用該技術,將原本需要一年的滲透測試工作縮短至短短三週內完成。Accenture 同樣透過整合 Opus,將掃描分析時間從 3 到 5 天壓縮到一小時以內。

同時,Anthropic 官方也宣布 Claude 現已支援更多資安與合規工具,確保企業在引進人工智慧技術的過程中,能夠符合嚴格的稽核標準。這種將頂尖語言模型直接轉化為全天候資安專家的做法,確實為企業防護網帶來了全新的氣象。

問與答

Q:ChatGPT for PowerPoint 會使用我的簡報資料來訓練未來的 AI 模型嗎? A:預設情況下是不會的。針對企業版 (Business, Enterprise)、教育版 (Edu) 以及教師版等用戶,分享給 ChatGPT 的資料絕對不會用於改進未來的語言模型。

Q:CapCut 與 Gemini 的整合將如何改變影音剪輯的工作流程? A:用戶未來將能直接在 Gemini 應用程式中使用 CapCut 的進階編輯功能,這會讓原本繁複的剪輯流程走向直覺的「對話式」與智能化整合體驗

Q:騰訊的 Hy-MT2 翻譯模型在終端設備的部署上有什麼突破? A:Hy-MT2 系列支援高達 33 種語言的互譯。為了解決終端設備的部署限制,團隊採用了 AngelSlim 1.25-bit 極限「量化」技術,成功將 1.8B 輕量級模型的儲存空間縮減至只有 440 MB,同時還讓推論速度提升了 1.5 倍

Q:美團 LongCat-Video-Avatar 1.5 為了提升數位人的穩定性與生成效率,做了哪些關鍵技術升級? A:在穩定性方面,模型將音訊編碼器升級為 Whisper-Large(取代舊有的 Wav2Vec2),大幅提升了唇音同步的自然度與全身動作的穩定性;在推論效率方面,運用了先進的步數蒸餾 (step distillation) 技術,現在只需要 8 個推論步驟 (8 NFE) 即可生成兼顧視覺保真度與伺服器成本的高品質影像。

Q:Claude Opus 在協助企業提升網路安全防禦方面,具體達成了哪些成效? A:Claude Opus 在自動化資安防禦上帶來了顯著的效率提升。例如 Wiz 能夠每週持續對超過 15 萬個生產環境資產進行攻擊模擬測試;Palo Alto Networks 成功將相當於一年的滲透測試工作量縮短至 三週內完成;Accenture 則是將掃描分析時間由原本的 3 到 5 天大幅壓縮至 一小時以內

分享至:
Featured Partners

© 2026 Communeify. All rights reserved.