P2P SBMはまだ先の話だと思うけどなあ。面白そうだけど。
はてブの最近の人気エントリーが、あまりの量(とノイズの多さ)に用をなさなくなってしばらくたつ。
はてなは、NLPの先端技術についてはまだまだだと思う。そういうものに価値を見出してないなら仕方ないけど。そういうとこに足を踏み入れていかないとestablishedにはなれない。いやその気はないのか。
ここからは妄想だけど、せっかく個人個人が自分でタグ付けていってるんだから、そのタグ(とスコアの情報)を使って、人気エントリーの時系列をフィルタリングしていけばいいんだよ。畳み込み積分みたいなのをすればスコアが思いっきり出そうじゃん。で、スコアの低いのはカットしていく。十分でしょう*1。
となれば、人気エントリーの被覆率をなるべく高めにするために、今は量をあえて多めに流してるのかな。自動フィルタリングを視野に入れてるなら、期待しちゃうよおれ? あ、つか、自分でやれっていう話か。