今回は、Kimi K2.5を実際にエージェント駆動開発の現場で使ったらどうなるのか、という検証結果について語っております。
Moonshot AIが発表したKimi K2.5は、Agent Swarmやマルチモーダル対応など魅力的な特性を持ち、僕もかなり期待していたモデルです。実際にKimiのアプリでLP制作を試した際の出来栄えが良かったこともあり、阿部さんにOpenCode上のオーケストレーターとして実戦投入してもらいました。ところが、GLM-5と比較したときに見えてきた差が、なかなか興味深い結果でした。
単発のタスクと複合的な分析タスクで評価が大きく分かれるポイントがあり、「ベースモデルとしての優秀さ」と「素で使う実力」の違いについて、Composer 2の話題も交えながらお互い気づきの多い時間となりました。
▼Kimi K2.5
https://www.kimi.com/ai-models/kimi-k2-5
▼OpenCode
https://opencode.ai/