新はてブの「テキストマイニングによるコンテンツ編集」機能の予想してみる

11月にはてなブックマークの新バージョンがリリースされるようだ.プレスリリースによると

はてなブックマークの新バージョンは下記の項目を念頭に置き、一から作り上
げてきたものとなります。
- 全文検索機能の搭載
- ソーシャル性・コミュニティ機能の強化
- ユーザーインタフェースの改善
- デザインを刷新
- テキストマイニングによるコンテンツの編集

http://hatena.g.hatena.ne.jp/hatenapress/20081002/1222938598

「ソーシャル性,コミュニティ機能の強化」も非常に楽しみではあるけど,多くの人が気になるのは「テキストマイニングによるコンテンツの編集」という改良点だろう.一見してどんな機能か予想がつかない.

先日リリースされた関連エントリ機能のことを指しているわけではないと思われる.だとしたら,どんな機能か.なんとなく今までの他社を含めたソーシャルブックマークに類を見ない機能なんじゃないかと思われる.

先日公開された関連エントリ機能も一種のテキストマイニングの成果の一部なので,あれがテイストとしては一番近いはず.ああいう全自動でなにか嬉しいことをやってくれる機能なのだろうか.

そもそも,
「テキスト」マイニングによる「コンテンツ」の「編集」
この文面だけでも色々解釈のしようがあるのが面白い.

テキスト(マイニングの対象は何か)

  • a. ブックマーク先ページのタイトルや本文のテキスト情報
  • b. はてなブックマーク内のタグやコメント
  • c. 上記以外の何か(ユーザが書いてるダイアリの内容,とか?)

コンテンツ(テキストマイニングの結果をどこに適用するか)

  • a. ブックマーク先の内容(ページだったり,動画だったり)
  • b. はてなブックマーク内のコンテンツ(タグやコメント)
  • c. 上記以外の何か(ダイアリなどはてな内の別サービス)

編集(誰が何を編集するのか)

  • b. はてなブックマークがバックエンドで自動的に「何か」を編集する
    • 例1:スパムブックマークを自動的に高速,高精度に排除することでホットエントリ入りしないようにする
    • 例2:エントリをカテゴリごとに高精度に分類する(ITニュース,2chネタ,政治,国際など)

組み合わせとしてはb-b-bが「テキストマイニング技術によるスパムブックマークの排除」機能に相当する.b-b-aもいかにもありそう.

他に考えられるのは,a-a-cのような,ブックマーク先ページで何かインタラクションが起こるような仕組みだと思う.b-b-cみたいにはてなブックマーク内でやる可能性もある.c-c-b c-c-cみたいにはてなブックマークを本気でマネタイズしにいく方向もありそうだし,今まで蓄積した膨大なデータを使わない手は無いと思う.まあ広告はアルゴリズム以外の部分も非常に大きく大変そうですが.あとc-c-aみたいに,はてなブックマークのデータをテキストマイニングすることで他のサービス(ハイクやダイアリ)の機能追加,といったこともあり得る.

結論

本命:b-b-a 中堅:a-a-c 大穴:c-c-c, c-c-b と言ったところだと思う.

色々予想してみましたが,はてなのことなので完全に予想外の方面から機能を追加してくる可能性もあって,個人的には良い意味で期待を裏切られたいので上記が全部外れであることを予想しときます.