AI 日報: Project Deal 實驗、GPT-5.5 提示詞指南與 NotebookLM 自動分類
這聽起來或許有些不可思議,但人工智慧早已悄悄跨越了單純的文字對話對答,開始在真實世界中執行具體的複雜任務。如今的 AI 代理不僅能幫忙寫程式與整理枯燥的文獻,甚至還能代替人類在辦公室裡討價還價。這一切正以極度流暢的方式融入日常工作流程。接下來將仔細檢視近期幾個備受矚目的核心技術進展,看看這些聰明的系統如何重塑數位體驗與商業互動。 當 AI 開始在辦公室討價還價:Anthropic 的 Project Deal 帶來了哪些驚喜? 老實說,讓 AI 代替人類進行金錢交易聽起來有點像科幻小說的情節。Anthropic 近期發布了一項名為 Project Deal 的內部實驗研究,結果卻證明這完全可行,甚至表現得相當出色。 這場實驗在一個基於 Slack 建立的辦公室內部市場中進行。69 名員工並沒有親自上陣,他們全權委託 Claude 模型代表自己執行買賣職能。這可是一場涉及真實資金往來的活動。這群 Claude 代理在上架的 500 多件實體商品中,成功促成了 186 筆交易,總成交額突破 4000 美元。從滑雪板到一整袋乒乓球,AI 在這段期間必須自行評估商品價值、提出報價並與其他 AI 展開激烈的談判。如果有興趣了解完整的數據與實驗設計細節,可以直接參考這份詳盡的 官方 PDF 報告。 人們可能會問:讓 AI 自己談判,人類真的會滿意結果嗎?實驗數據給出了一個令人深思的答案。代表員工出面的模型如果是能力更強的 Opus 版本,通常能比輕量級的 Haiku 版本取得更優渥的交易條件。Opus 代理不僅能賣出更多商品,還能為同一個物品爭取到更高的售價。有趣的是,那些被較弱模型代表的員工,在事後的滿意度調查中竟然完全沒有察覺到自己處於劣勢。這引發了一個值得探討的議題。未來當 AI 廣泛代理人類進行商業互動時,模型智商的落差很可能會在無形中造成一種全新的經濟階層差異。這的確是個必須謹慎面對的發展方向。


