中国の月面探査AIが遂に登場！1兆パラメータの「Kimi K2」が革命をもたらす

Moonshot AIが新しいオープンウェイト大規模言語モデル「Kimi K2」を発表

1兆パラメータを誇り、コスト効率が高い

先行モデルを上回るパフォーマンスを確認

MuonsClip最適化ツールによる安定したトレーニング

中国・北京のスタートアップ、Moonshot AIは、オープンウェイトの大規模言語モデル「Kimi K2」を発表しました。
このモデルは1兆パラメータを持ち、現在利用可能な中で最大級のものであり、32億パラメータを同時に起動する設計となっています。
Kimi K2は、基礎モデル（Kimi-K2-Base）と指示調整済みモデル（Kimi-K2-Instruct）の2種類が用意されています。
これらは、研究者や開発者に向けて、カスタマイズや微調整の自由度を提供しています。

Kimi K2は、コード生成や問題解決に特化しており、指示がなくても機能を選択し、結果を評価し、計画を調整できます。
このモデルは、専門家ネットワーク（MoE）アーキテクチャを使用しており、大規模モデルを小規模な「専門家」サブネットワークに分割しています。
これにより、必要な計算リソースを削減し、コスト効率も高くなっています。
コストは、入力トークン1百万あたり約$0.15、出力トークン1百万あたり$2.50です。
これは、他のモデルと比べればるかに安価です。

初期のテストでは、Kimi K2は、コーディングや数学のベンチマークで、プロプライエタリモデルと同等かそれ以上のパフォーマンスを示しています。
たとえば、SWE-Bench Verifiedでは、Kimi K2は65.8%を記録し、GPT-4.1の54.6%を上回っています。
また、数学推論に関しては、Kimi K2が97.4%のスコアを達成しました。

MuonClip最適化ツールにより、Kimi K2のトレーニングは完全に安定して行われています。
このツールは、注意層での「ロジット爆発」を防ぎ、安定した環境でのトレーニングを実現しました。
Kimi K2のリリースは、アメリカの企業や技術にも影響を与えており、中国企業は今後も競争力を強化する必要があります。
Moonshot AIはKimi K2へのアクセスをウェブおよびモバイル製品、APIを通じて提供しています。
「Kimi K2にはいくつかの制限がある」とのことですが、今後の改良に期待が寄せられています。