42【圧倒的性能】Claude Fable 5のファーストインプレッション

今回は、Anthropicが満を持して一般公開したMythos級モデルClaude Fable 5を、リリース当日からお互いに実戦投入してみた初感を持ち寄りました。僕はCodex CLI（GPT-5.5）では辿り着けなかった複雑なバグを含む、4つのバグ調査を一気に投げ、阿部さんは寝る直前にダメ元でシステム全体のリアーキテクトを依頼。翌朝それぞれが目にした結果とは。さらに「実行が速い」と感じる阿部さんに対して、僕の体感は意外にも「遅い」。それなのにトータルでは速いと感じてしまう、この逆説の正体がひとつの論点になっています。 SWE-bench ProやGDPval-AAのスコアの伸び方も含め、これまで大局観と細部の精度を別モデルに分担させてきた僕らの開発スタイルそのものを問い直される回でした。レビューサイクルやトークン消費の話まで、前提が一段更新された感覚があります。終盤では、ここ数日で急に話題になっている「ループエンジニアリング」にも触れていますが、二人とも思うところがありすぎたため、また別の時に詳しくお話ししたいと思います。 ▼Claude Fable 5（Anthropic公式発表） https://www.anthropic.com/news/claude-fable-5-mythos-5 ▼Claude https://claude.ai/ ▼Claude Coworkが1週間分無料でトライアルできる招待コード https://claude.ai/referral/PMQIAlW1uQ?s=cowork&v=apps

6月10日

このチャンネルの新着放送

51【ゼロから作るか、乗っかるか？】Orca拡張の自作アプリで並列開発

26分

3日前

50【エディタはもう要らない？】AI駆動開発ターミナルの決定版Orca

28分

6日前

49【Opus 4.8とどう違う？】Claude Fable 5に任せた開発

21分

7月11日

48【裏技】Codexから技術顧問としてGPT-5.5 Proを呼ぶ

20分

7月4日

47【ClaudeCodeのワークフローから考える】エージェントハーネス設計談義

28分

6月27日

46【ターミナルはもう要らない？】Codex App一つで完結する開発

38分

6月26日

45【Cursorを9兆円で買収】点が線になるイーロン・マスクの構想

こんにちは、「AI駆動開発部の日常」へようこそ。このポッドキャストは、日々AI駆動開発を行う、起業家の山本とエンジニアの阿部が、AI駆動開発のリアルを、ゆるく語り合う番組です。【配信サービス】 ▼Spotify https://open.spotify.com/show/5b4x1u0M2f0Kmr1Xnv1Z7r?si=12580ee9ade0414e ▼Youtube https://youtube.com/@ai-nichijo-fm ▼Apple Podcasts https://podcasts.apple.com/jp/podcast/ai%E9%A7%86%E5%8B%95%E9%96%8B%E7%99%BA%E9%83%A8%E3%81%AE%E6%97%A5%E5%B8%B8/id1843990202 ▼amazon music https://music.amazon.co.jp/podcasts/4fd4926b-a654-4dc7-a858-01ff5e0e8c25/ai%E9%A7%86%E5%8B%95%E9%96%8B%E7%99%BA%E9%83%A8%E3%81%AE%E6%97%A5%E5%B8%B8 ▼stand.fm https://stand.fm/channels/68dc82a9036795923c400b4f ▼LISTEN https://listen.style/p/ai-nichijo-fm?xtIZk9qq