C102に参加された皆様お疲れさまでした。
参加してみてコロナ前の活気が戻っているんじゃないかなあ…と思いました。コミケに行くと、「ああ、自分はこのままでいいんだな」、って思えます。

コミケで本を2冊買ったのですが、そのうちの1冊が「テキストマイニングで探るエロゲー批評の昔と今」です。本書のサンプルと購入できるところは以下のとおりです。
ErogameScapeを作った理由の1つに、このような本が作りたい!というモチベーションがあったのですが、すでにエロゲーをまったくやっていない…というかErogameScapeを作ってから3年後にはエロゲーをやらなくなっているので、2003年までのことしか分からない自分には夢物語でして、ErogameScapeのデータを使って統計本を出して頂けるのは感謝でしかないです。

さて、「テキストマイニングで探るエロゲー批評の昔と今」は2部構成になっています。1部はレビューに関する集計で、メインは各年ごとに、その年に書かれたレビュー数順にゲームが一覧で見られることでしょう。
つばめさんも「ぜひこのランキングを眺めながら同好の士と酒のあてにでもしてください」と書かれていますが、これを見ながらあーだーこーだー話すのは楽しんじゃないでしょうか。
統計って結果を見てどう解釈をするかをあーだーこーだー話すのが楽しいんです、たぶん。自分はそう思います。
ちなみにAIRって、現在、1046件の一言感想が登録されているのですが、2001年には11件、2002年には48件、2003年には122件、2004年には163件の登録になってます。これだけだとまだ3割程度なので、2005年以降現在までで残りの7割の一言感想が登録されたわけで、すごいぞAIR、って思います。

2部はレビューのテキストにでてくる語句をMeCabを使って形態素解析にかけて、どのような言葉が年度ごとに使われているかを分析しています。
MeCabってエロ単語が登録されていないので使えなかった、というのが20年くらい前の自分の認識だったのですが、ちゃんと出来てる!という感想を持ちました。
主成分分析について説明がほとんどないので、思い出すのに時間がかかりましたが、なんとか思い出して、例えば「萌え」という言葉が絶滅危惧種であることが表から分かってすごいなって思います。

本書について、たまのすさんが書いた感想を見つけましたのでURLをはります。
【レビュー?】テキストマイニングで探る エロゲー批評と昔の今【というよりは茶々】

ErogameScapeのデータはどなたでも見られるようになっておりますので、データを使った何かを作成したい!等ございましたら、お気軽に相談ください。
相談いただかなくても大抵エロゲーマーのためのSQLでなんとかなると思いますが…相談頂いた方が早いこともあります、たぶん。