今回は、Anthropicが満を持して一般公開したMythos級モデルClaude Fable 5を、リリース当日からお互いに実戦投入してみた初感を持ち寄りました。
僕はCodex CLI(GPT-5.5)では辿り着けなかった複雑なバグを含む、4つのバグ調査を一気に投げ、阿部さんは寝る直前にダメ元でシステム全体のリアーキテクトを依頼。翌朝それぞれが目にした結果とは。さらに「実行が速い」と感じる阿部さんに対して、僕の体感は意外にも「遅い」。それなのにトータルでは速いと感じてしまう、この逆説の正体がひとつの論点になっています。
SWE-bench ProやGDPval-AAのスコアの伸び方も含め、これまで大局観と細部の精度を別モデルに分担させてきた僕らの開発スタイルそのものを問い直される回でした。レビューサイクルやトークン消費の話まで、前提が一段更新された感覚があります。
終盤では、ここ数日で急に話題になっている「ループエンジニアリング」にも触れていますが、二人とも思うところがありすぎたため、また別の時に詳しくお話ししたいと思います。
▼Claude Fable 5(Anthropic公式発表)
https://www.anthropic.com/news/claude-fable-5-mythos-5
▼Claude
https://claude.ai/
▼Claude Coworkが1週間分無料でトライアルできる招待コード
https://claude.ai/referral/PMQIAlW1uQ?s=cowork&v=apps