※この記事は「将棋 Advent Calendar 2016 – Adventar」の19日目です。

将棋連盟の棋士データベースを使って色々と遊んでみるシリーズ、今回は棋士名に使われている文字を分解してワードクラウド(タグクラウド)を作ってみたいと思います。

棋士名でワードクラウド

出来上がったワードクラウドがこちら。

棋士名ワードクラウド

棋士名に使われている文字を一文字ずつに分解して集計し、その文字が使われている数が多ければ大きく、少なければ小さく表示されるようになっています。

本当は姓名を分けて名前だけでやりたかったのですが、棋士データベースは姓名の区切りが分かるようになっていなかったので断念。そのせいか、やはり大きな文字は名字によく使われる漢字がほとんどを占めたようです。

ちなみにこちらが多かった文字のトップ10。「田」の圧倒的勝利でしたね。

文字 回数
54回
31回
31回
26回
23回
22回
19回
18回
17回
17回

作り方

ワードクラウドの作成にはこちらのライブラリを使わせてもらいました。

こんな php スクリプトを走らせて、棋士データ全部入りの kishi_all.json からどの文字が何回使われているかというワードクラウド用のリストを作りました。

この記事で作ったコードは全てこちらに上げてありますので、ご自由にご覧ください。

この記事を書いた人

ko31

電王戦をきっかけに20年ぶり以上に将棋熱が再燃した、観たり指したりするのが好きなヘボ将棋ファン。
群馬在住繋がりで藤井九段の本で振り飛車勉強中ですが、根っからの三日坊主につき&頭の回転が悪くなかなか棋力が向上しません。将棋ウォーズによく出没しています。
>>詳しいプロフィールはこちら

合わせて読みたい記事