今回は、2026年2月12日にZ.aiがリリースしたGLM-5を使ってみた感想について語っております。
阿部さんはGitHubのプルリクエストに来るAIの自動コードレビューの妥当性評価と実装方針検討を、GLM-5とClaude Opus 4.6、GPT-5.3-Codex Extra Highの3モデルに同時に投げて比較したところ、情報収集やツールユースの巧さが光る場面がある一方で、最終的な判断にブレが出るケースもあったとのことです。
僕の方でもドキュメント更新やPlaywright MCPを使ったE2Eテストを試してみました。もっともらしい嘘(ハルシネーション)をつく傾向があり事実確認には注意が必要ですが、タスクを前に進める「推進力」は非常に優秀でした。特にE2Eテストでは、画面に残っていた不要なエラー文言を自律的に発見して指摘するなど高い実行力を発揮しており、メインモデルとして採用できる可能性も十分に感じられた回になります。
後半では、各LLMに同じプロンプトでLPサイトを生成させる比較の話題でも盛り上がりました。
▼GLM-5
https://z.ai/blog/glm-5
▼各LLMのLPサイト生成比較
https://nikukyu.sitocha.cc/testllm/index.html
【配信サービス】
▼Spotify
https://open.spotify.com/show/5b4x1u0M2f0Kmr1Xnv1Z7r?si=12580ee9ade0414e
▼Youtube
https://youtube.com/@ai-nichijo-fm
▼Apple Podcasts
https://podcasts.apple.com/jp/podcast/ai%E9%A7%86%E5%8B%95%E9%96%8B%E7%99%BA%E9%83%A8%E3%81%AE%E6%97%A5%E5%B8%B8/id1843990202
▼amazon music
https://music.amazon.co.jp/podcasts/4fd4926b-a654-4dc7-a858-01ff5e0e8c25/ai%E9%A7%86%E5%8B%95%E9%96%8B%E7%99%BA%E9%83%A8%E3%81%AE%E6%97%A5%E5%B8%B8
▼stand.fm
https://stand.fm/channels/68dc82a9036795923c400b4f
▼LISTEN
https://listen.style/p/ai-nichijo-fm?xtIZk9qq