新はてなブックマークの新機能「テキストマイニングによるコンテンツ編集」とは何だったのか

以前,はてなブックマークの新バージョンに関するプレスリリースが出たときに「テキストマイニングによるコンテンツ編集」という機能がとても気になったので個人的に色々と予想していたのですが,先日の新はてなブックマーク発表会で解答が出たようです

内容を反映したカテゴリ分類でさまざまなジャンルを幅広く網羅

 カテゴリ分類もベイジアンフィルタを利用した学習型分類へリニューアル。ページから本文と思われる部分を抽出し、内容に応じて機械的に分類する仕組みを採用したことで、特定のジャンルに偏ることなく注目ブックマークを表示でき、新聞サイトなど構造がわかりやすいサイトであれば90%近い精度で分類が可能だという。カテゴリは「社会」「政治・経済」「スポーツ・芸能・音楽」「科学・学問」「コンピュータ・IT」「ゲーム・アニメ」「おもしろ」「動画」の8 種類で、それぞれのカテゴリごとに人気エントリーを表示する。

はてなブックマーク新バージョン公開。検索やソーシャル機能強化

以前私がしていた予想でいうところの,

    • 例2:エントリをカテゴリごとに高精度に分類する(ITニュース,2chネタ,政治,国際など)
新はてブの「テキストマイニングによるコンテンツ編集」機能の予想してみる - yanbe.log

これが大体当たった感じですね.

解答が出てから改めて考えると,分類に利用する素性といい,分類結果を適応する箇所といい,既存の機能を拡張・強化するにはごく自然なアプローチだと思うので,なるほどなぁ,というのが今のところの感想です.反面,自分は色々と妄想しすぎてました.