dlshogiのモデルの強さの簡易比較

2020年から2022年の電竜戦、世界コンピュータ将棋選手権を経て、将棋AI界での覇権がNNUE型のやねうら王からディープラーニング型のdlshogiに移ったように思えます。
さて、そんなdlshogiですが、2年の間に複数のモデルが登場しています。
dr2-exhiが強いというのは知っているけれど、他のモデルはどうなのか?と気になったため、今回簡単に複数モデルのレーティングを調べてみました。

今回調べる各モデルは以下の表にまとめました。

時期一言説明リンク
GCT電竜(2020)2020/11/25第1回の電竜戦(2020)で優勝したモデル Release 世界将棋AI 電竜戦バージョン(「GCT電竜」同梱) · TadaoYamaoka/DeepLearningShogi · GitHub
Qhapaq(2022)2022/5/7Qhapaqさん作成。resnet の 20layersで書籍のデータから学習をしたもの。Release 追加学習用の深層学習評価関数群 · qhapaq-49/qhapaq-bin · GitHub
創りかた本(2021)2021/12/20付録として教師データと学習済モデルがついてくる。【書籍の宣伝】強い将棋ソフトの創りかた – TadaoYamaokaの開発日記
WCSC31(2021)2021/5/52種類のモデルがあり、今回はmodel-0000226kai.onnxを使用Release 第31回世界コンピュータ将棋選手権バージョン · TadaoYamaoka/DeepLearningShogi · GitHub
dr2-exhi(2021)2021/8/16ブロック数が10→15に変化、ライセンスに同意が必要。Release 第2回世界将棋AI電竜戦エキシビジョンバージョン · TadaoYamaoka/DeepLearningShogi · GitHub

今回の調査は簡易的なものであるため、水匠5/やねうら王ver7.61に対する勝率から比較することにしました。

条件
CPU: Ryzen 7 3700X (8スレッドをやねうら王で使用)
GPU: GeForce RTX 3070
搭載メモリ:32GB
同一マシン内で連続対局
それぞれ先後50局ずつ計100局
持ち時間:1手5秒
GUI:ShogiGUI
使用エンジン: やねうら王ver7.61, dlshogi-wcsc32
山岡互角局面集を使用し、33手目から対局開始
レーティングの誤差は上下に25%信頼区間。
千日手・512手到達は引き分けとし、計算時引き分けは0.5勝と計算
レーティング計算には信頼区間計算機 (2016-12-10, LFICS) (techblog.jp)を使わせていただきました。
水匠5設定(デフォルト値からの変更箇所)
USI_Hash:1024MB
MaxMovesToDraw:512
FV_SCALE:24
NetworkDelay:0
NetworkDelay2:0
ResignValue:3000
dlshogi設定(デフォルト値からの変更箇所)
Byoyomi_Margin:0
Eval_Coef:285
Resign_Threshold:20

結果

vs 水匠5/YO763レーティング差誤差(25%信頼区間)
GCT電竜(2020)19-5-76-230+20/-33
Qhapaq(2022)23-4-73-191+18/-29
創りかた本(2021)22-8-70-182+18/-28
WCSC31(2021)47-8-457+21/-21
dr2-exhi(2021)50-12-3842+21/-21

対局条件の都合上厳密な比較とはなりませんが、大雑把に見てdr2-exhi>WCSC31>創りかた本/Qhapaq/GCT電竜という序列になりました。この結果を見るに、水匠5と同等クラスのWCSC31版のdlshogi with GCTが、当時の大会で結果が振るわなかったのが意外でした。また、強い将棋ソフトの創りかた書籍のモデルはGCT電竜と同等以上の強さとの触れ込みでしたが、今回の計測ではその差を見ることはできませんでした。恐らく、直接対決やより対局数を増やすことで、その差ははっきりしてくると予想されます。

追記:QRLでのスクリプト処理での結果はこちら
data generated : 20/8/2022 total games: 500
software rating error games
dr2-exhi 47 +27/-36 100
WCSC31 8 +19/-25 100
SuiSho5 0 +0/-0 500
Qhapaq -195 +34/-30 100
Make -199 +35/-22 100
GCTdenryu1 -229 +24/-34 100

追加分の棋譜
右クリックでダウンロード

コメント

タイトルとURLをコピーしました