Anthropic 發布了其 AI 模型更安全、更便於公眾使用的版本
Anthropic社が、より安全で一般利用に適したAIモデルを公開
更新日: 2026年6月11日 04:20
在2026年6月9日,AI公司Anthropic推出了Claude Fable 5,這是其強大的Mythos模型的新版本,專為大眾設計。
2026年6月9日、AI企業のAnthropicは、一般の人々向けに設計された強力なMythosモデルの新しいバージョン、「Claude Fable 5」を発表しました。
這次發布代表了在平衡高效能人工智慧與必要安全性方面邁出的一大步。
このリリースは、高性能な人工知能と不可欠な安全性を両立させる上での大きな一歩を意味しています。
此前,原始的Mythos模型因具備識別危險網路安全漏洞的能力,僅限於特定的研究小組使用。
以前、オリジナル版のMythosモデルは、危険なサイバーセキュリティの脆弱性を特定する能力があったため、特定の研究グループのみに制限されていました。
為了填補這一空白,Anthropic開發了Fable 5,它使用與Mythos相同的先進架構,但包含了嚴格的安全護欄。
このギャップを埋めるため、AnthropicはFable 5を作成しました。
當AI檢測到高風險請求(例如涉及毒素、生物學或網路威脅的請求)時,它會自動將任務轉移至較不複雜的Claude Opus 4.8模型。
これはMythosと同じ高度なアーキテクチャを使用しつつ、厳格な安全ガードレールを組み込んだものです。
Anthropic指出,此系統對不到5%的用戶產生干擾,確保大多數人能在無問題的情況下享受完整效能。
AIが毒物、生物学、サイバー脅威に関するリクエストなどの高いリスクを検知すると、タスクを自動的により複雑でないClaude Opus 4.8モデルへと切り替えます。
這種雙軌策略——為大眾提供過濾版本,為授權合作夥伴提供無限制版本——凸顯了科技界在提供尖端運算能力同時維持安全性方面持續的掙扎。
さらに、すべてのアクティビティには、悪用を防ぐために30日間のデータ保持ポリシーが適用されます。
這些介面層級的保護措施是否足以遏制先進AI,仍是專家間激烈辯論的主題。
一般向けのフィルタリング版と認可されたパートナー向けの無制限版を提供するというこの二段構えの戦略は、最先端の能力を提供しつつ安全性を維持するという、テクノロジー界で続く葛藤を浮き彫りにしています。
