読者です 読者をやめる 読者になる 読者になる

ゆーすけべー日記

はてなBlogってどーなの!?

とあるエロサイトの改修その2

前回の「とある18禁のエロサイト」の改修話の続き。

前回までのあらすじ

通常ではカテゴライズされにくい国内外の「ほぼアダルト専用」動画共有サイトを、AV女優別やタグ別に自動的に分類するサイトがあり、それを改修した。以下の通り。

  • デッドリンクのチェックをして閲覧不可なビデオをサイトから削除するようにした
  • エログなどが集まるBlog検索のみならず、Twitterを情報ソースにした
  • これまで固定だったAV女優リストを、DMMフィードから新規女優を取得するようにした
  • 動画をページに貼り付けるembedタグを見なおした

さらなる施策

上記に加え、さらなる施策を実行することで、ページビュー=PVで換算するとおおよそ「3倍」ものアクセスが増加した。以下に第1回の改修エントリー記事をポストする直前から、昨日までのPVグラフを掲載する。第1回の記事がポストされたのが「4月6日」なのでその時に少しハネて、その後緩やかに、上昇しているのが分かる。

Google Analytics

ではどのような改修を投じたのかを紹介する。

対応サイトを増やす

これは非常に単純で、いくつかある「ほぼアダルト専用」動画共有サイトに対して、本サービスが対応するかどうか?という話である。これまでは

  1. Snaflix
  2. Slutload
  3. Xvideos
  4. Empflix
  5. RedTube
  6. YourFileHost
  7. fc2

の7サイト対応だったところ(現在ではほとんど機能していないサイトも含む)

  • アゲサゲ
  • Tube8

もサポートすることになった。これでより多くの動画がインデックシングされることになる。ちなみにプログラム上、これらのサイト情報はモジュール化されており以下の tree コマンドの結果がそれを表している。

lib/YourAVHost/CLI/Site/
├── ASG.pm
├── Empflix.pm
├── FC2.pm
├── RedTube.pm
├── SlutLoad.pm
├── Tnaflix.pm
├── Tube8.pm
├── XVideos.pm
└── YourFileHost.pm

検索語の工夫

本サービスでは

  1. Blog or Twitter検索から「特定の検索語」で記事やツイートを取得
  2. それを解析して動画共有サイトのURLとメタデータを組み付ける

というのがインデックスの際の主たる機能フローである。この時に使う「特定の検索語」には今まで「動画共有サイトに関係したもの」がひっかかかるように上記で挙げたサイト名などを入れていた。が、しかし、この度、あまりにもド直球なワードである「無料エロ」を追加することで、ピックアップする記事やツイートが異常なほど増え、結果的にも動画の更新頻度が上がった。これは盲点であった。

単調なAV女優名を削除

「つぼみ」は超有名女優であるが「あや」と言われたら誰を想像するだろうか。これまで蓄積されたAV女優名のデータベースには「ひらがな」かつ文字数が2〜3文字の名前が何件かあり、それが誤ったマッチングをしてしまっていた。システムで処理するためある程度の語弊は許容する必要はあるが、あまりにもひどいので、スクリプトを作成し、女優一覧から目立つものを削除した。以下のようなコマンドを削除する女優の人数分、実行した。

$ ./delete_actress.pl あや

これは一見、属人的で手間のかかる作業のように思われるが、下手に自動化すると「つぼみ」までを消しかねないので、ある程度の手作業とした。特に個人的には苦ではない作業であった。

スマホに対応

おそらくこれが一番PVアップに貢献しているであろう項目である。UserAgentを見てスマホ向けのビューを見せるようにようにした。これは各動画共有サイトが徐々にiPhoneやAndroidのモバイル端末に対応してくれているおかげだ。

YourAVHost


以上、効果と共に、とあるエロサイトの改修について第2弾を紹介した。効果が目に見えて分かるもので、とても楽しいので、今後とも改善点があれば、工夫をしていきたい次第である。