Anthropic社が、より安全で一般利用に適したAIモデルを公開
Anthropic 發布了其 AI 模型更安全、更便於公眾使用的版本
更新於: 2026年6月11日 上午04:20
2026年6月9日、AI企業のAnthropicは、一般の人々向けに設計された強力なMythosモデルの新しいバージョン、「Claude Fable 5」を発表しました。
在2026年6月9日,AI公司Anthropic推出了Claude Fable 5,這是其強大的Mythos模型的新版本,專為大眾設計。
このリリースは、高性能な人工知能と不可欠な安全性を両立させる上での大きな一歩を意味しています。
這次發布代表了在平衡高效能人工智慧與必要安全性方面邁出的一大步。
以前、オリジナル版のMythosモデルは、危険なサイバーセキュリティの脆弱性を特定する能力があったため、特定の研究グループのみに制限されていました。
此前,原始的Mythos模型因具備識別危險網路安全漏洞的能力,僅限於特定的研究小組使用。
このギャップを埋めるため、AnthropicはFable 5を作成しました。
為了填補這一空白,Anthropic開發了Fable 5,它使用與Mythos相同的先進架構,但包含了嚴格的安全護欄。
AIが毒物、生物学、サイバー脅威に関するリクエストなどの高いリスクを検知すると、タスクを自動的により複雑でないClaude Opus 4.8モデルへと切り替えます。
Anthropic指出,此系統對不到5%的用戶產生干擾,確保大多數人能在無問題的情況下享受完整效能。
Anthropicによると、このシステムによって中断されるユーザーは5%未満であり、大多数の人が問題なくフルパフォーマンスを享受できます。
此外,所有流量均須遵守30天的數據保留政策以防止濫用。
一般向けのフィルタリング版と認可されたパートナー向けの無制限版を提供するというこの二段構えの戦略は、最先端の能力を提供しつつ安全性を維持するという、テクノロジー界で続く葛藤を浮き彫りにしています。
這些介面層級的保護措施是否足以遏制先進AI,仍是專家間激烈辯論的主題。
このようなインターフェースレベルの保護策で高度なAIを制御するのに十分かどうかは、専門家の間で激しく議論されています。
