単語ベースのフィルタリングの無力

前々から研究結果がまとまったら公開しようと思っていた問題の1つにキッズgooがある。要するに子供向けの検索エンジンで、しかも検索結果に年齢層に応じたふりがなを振ってくれるというおまけ付き。ふりがなはふりがなで同一性保持権あたりがどうなんだろうと疑問に思わなくもないけれど。

でも、何よりもこのサービスが問題なのはフィルタリング機能にある。内部に保持する有害語リストにマッチすると、対象サイトを「教育上よろしくないサイト」と見なして「ごめんね。ページがひょうじできませんでした。」と表示するのだ。

今日、ネットを徘徊していたらキッズgooはじかれサイト同盟なんてのを見つけたので、良い機会だし、未完成だけど、私の実験の中間報告をしてみる。なお、似たような実験で興味深い報告が妖精現実フェアリアルにあった

まず、弾かれそうな単語を1つだけ含むテキストファイルをアップロードして、それが弾かれるかどうか試した。実験対象語は性的マイノリティ関連のサイトでよく使われる用語を恣意的に選んだほか、官能小説用語表現辞典から適当に目に付いたものを採用した。

さて、結果は下記の表の通りである。"S"はフィルターを通過して正常に閲覧できたことを、"F"はフィルターによって撥ねられたことを意味する。

Kids gooによるフィルタリング実験の結果
対象語句結果考察
同性愛F想像通り
性同一性障害Sこれが撥ねられなかったのは幸い
性的Fつまり、"性的少数者"は却下らしい
ゲイFこれは同性愛者の児童にとって問題
レズビアンF
sexualS"性的"は駄目でこれは良いのか?
sexyFこれを禁止するのは分からなくはないが、ちょっと神経質過ぎるでは?
homosexualS
lesbianFしっかりチェックされている。
gayF
GIDS要するに、この辺の言葉は知らないだけなんだろうなと想像してみる
SRSS
GenderSこれを撥ねたらさすがに怒る。通って良かった。
性交F微妙なライン
性転換Sうーん。GID当事者団体は最早あまり使わないし、むしろ官能小説での使用の方が多いと思うのだけれど。ただ、禁止されると"性転換症 Transsexualism"が引っ掛かるという問題はある。
性器Fおいおい……。
性教育S妥当な結果
ジェンダーS妥当な結果
陰茎F想像通りだけれど、少々疑問を感じる
肛門Fやりすぎでしょう。
括約筋S妥当
陰核F……そうですか。
陰唇F
F
ヴァギナF
vaginaSこれだけ通った理由が気になる。
ペニスF通らない……。
クリトリスF
乳頭F
乳房F
陰嚢F
官能小説F妥当な結果
assS通っていいのか?
女芯S
ほとSとりあえず、小学生が古事記へのアクセスを拒否されるという事態は避けられたようです。
さねS
肉真珠Sこんな言葉、アダルトサイトにしか使わないと思いますが、小学生が見ても良いそうです。
淫蜜S
女陰Fそれなのにこれは駄目だそうです。中国哲学の一部が読めません。
朱雀Sいくら何でもそこまでは神経質でなかったようです。
乳首Fこの人たちが何を考えてフィルターを作ったのか分からなくなってきました。
海綿体S
勃起Fまぁ、官能小説での使用である場合が多そうな気がしますし、賛成。
玉袋F
菊座F
まらSいいのか? まあ、伝承文学では使用頻度が多そうなので有り難いですが。
fuck Fとりあえず、"Fuck'n Ass Hole"はちゃんと撥ねてくれる模様。
セックスFジェンダー系のサイトは全滅の恐れが出てきました。
インターセックスF"セックス"が駄目なせいでしょう
インターセクシュアルSこれは良いらしい
半陰陽F訳が分かりません。

結果を見ると次のようなことが分かる。

  • 概して、正式な用語は引っ掛かるが俗語・隠語はチェックが甘い傾向がある
  • データ採取が不十分なので上記には掲載しなかったが、伏せ字に対しては無力なようだ。
  • フィルタリングを通している限りセクシュアルマイノリティの児童が自己に関する的確な情報にアクセスすることは難しい。
  • 少し言葉に注意すれば、フィルタリングに引っ掛からないようなアダルトサイトを制作することは容易である。

えーと、確か前掲の官能小説用語辞典に書いてあったのだと思うのだけれど(実験自体は結構前なので忘れかけている)、日本の官能小説界は戦後の規制の中で発禁処分を受けることが多かったため、伏せ字や間接的な表現、巧みな比喩によってこの主の単語ベースのチェックをすり抜ける方向に発展してきたそうな。とすると、うん。このサービスは次のような効果をもたらすんじゃ無かろうか。

  • 子供を正しい情報から遠ざけ、ポルノサイトへ誘導することによって歪んだ性知識を身につけさせる。
  • 暗黙の抑圧を受けがちな「性的マイノリティである子供」が自己に対する正しい知識を身につける機会を奪い、自己肯定感の健全な発達を妨げる。
  • このサービスがそもそもまともに機能すると期待していない大人たちを楽しませてくれる。

えっとですね。やっぱり、日本語文献に関する限り、やはり単語ベースのコンテンツフィルタリングは無理があると思うのです。本当に子供を有害コンテンツから守ろうとするなら、まめに「有害URLリスト」を更新してくれるような会社と契約して、URLベースのフィルタリングをするのが正しい対応でしょう。

とりあえず、今日も私を笑わせてくれたキッズgooに幸いあれ。