百合マンガの階層型クラスタリングをしたかった
階層型クラスタリングに関する知識が絶望的に足りず、正確な解析ができなかったと思われるのですが、いつか再チャレンジすることがあるかもしれませんので一応記事に残しておきます。
何がやりたかったかを一言で表すと「百合漫画の分類」です。世の中には数多の百合漫画がありますが、それらを一定の基準を設けて分類することができれば何か面白いことが分かるかなと。
とりあえす、下の10作品を対象にしてみました。
- 青い花
- ささめきこと
- オクターヴ
- citrus
- 桜Trick
- あの娘にキスと白百合を(9巻までの内容)
- 月が綺麗ですね(4巻までの内容)
- はなにあらし(2巻までの内容)
- たとえとどかぬ糸だとしても(3巻までの内容)
- 2DK、Gペン、目覚まし時計。(7巻までの内容)
次にこれらの作品について以下の10項目をそれぞれ0・1で判定していきます。条件を満たす場合が1、満たさない場合が0です。一作品に複数カップルが登場する場合はメインと考えられる2人に対象を絞りました。
- 葛藤がある
- 母娘・姉妹・従姉妹のいずれかにあたる(義理を含む)
- 物語開始時点で友人関係にある
- 告白シーンがある
- キスシーンがある
- 肉体関係がある
- 結婚している・する
- 主要な登場人物が学生
- 主要な登場人物に男性がいる
- 結ばれる
その結果が以下の表です。解析の都合上作品名は略させていただきました。また、主観が多分に入っていますので人によって結果は少し異なるかと思います。
未読の方は若干ネタバレの恐れがありますのでご注意ください。
name | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
---|---|---|---|---|---|---|---|---|---|---|
青い花 | 1 | 0 | 0 | 1 | 1 | 1 | 0 | 1 | 1 | 1 |
ささめ | 1 | 0 | 1 | 1 | 1 | 0 | 0 | 1 | 1 | 1 |
オクタ | 1 | 0 | 0 | 1 | 1 | 1 | 0 | 0 | 0 | 1 |
cit | 1 | 1 | 0 | 1 | 1 | 0 | 1 | 1 | 1 | 1 |
桜Tr | 0 | 0 | 1 | 1 | 1 | 0 | 0 | 1 | 0 | 1 |
あの娘 | 0 | 0 | 1 | 1 | 1 | 0 | 0 | 1 | 0 | 1 |
月が綺 | 0 | 0 | 0 | 1 | 1 | 0 | 1 | 0 | 0 | 1 |
はなに | 1 | 0 | 1 | 1 | 0 | 0 | 0 | 1 | 0 | 1 |
たとえ | 1 | 1 | 0 | 1 | 1 | 0 | 0 | 0 | 1 | 0 |
2DK | 1 | 0 | 1 | 1 | 1 | 0 | 0 | 0 | 1 | 1 |
このデータを入力として階層型クラスタリングを行います。私は全く知識がないため下の方の記事を参考というかそのまま利用させていただきました。
その結果が以下の図です。
以下簡単に結果を考察します。
「月が綺麗ですね」が他と最も遠くなっているのは、合法百合夫婦という独特な関係性が影響していると考えられます。
同様に「citrus」と「たとえとどかぬ糸だとしても」が近いのは、義理の家族という関係が共通しているからだと考えられます。ただ、結末が大きく異なりそうなこの2つを近いと判断して良いのかは大いに疑問があります。この辺りは判定項目数が10と少ないことが原因でしょう。
「青い花」と「オクターヴ」はおそらく項目6の影響が大きいですね。
個人的には、「はなにあらし」は「月が綺麗ですね」と近いと判断されると思っていたのですが、同じく高校が舞台で主要な登場人物に男性がいない「桜Trick」と「あの娘にキスと白百合を」が近いと判断されました。
知識ゼロでクラスタリングしましたが、少なくとも10項目で判断する限りはそれなりに妥当な結果になったなと感じました。後は基準をより厳格にし、項目数を50位にすればかなり意味のある分類ができるのではないかと思われます。
それが一番大変なんですが。
最後までお読みいただきありがとうございましたm(_ _)m