2008-05-05

オートタギングAPI を使ってブログのエントリを勝手に分類してみる

BLOGRANGER TG のミニ地図を貼り付けられるブログパーツ
百式さんのブログで紹介しているのを見て、さっそく試してみました。が、残念です。このブログは収集してもらえてないようです。BLOGRANGER TG API というのが提供されているので、このブログパーツと同じようなことはできるかもしれません。
少し過去の話題にさかのぼります。上記のとおり、BLOGRANGER TG のブログパーツで、このブログのミニ地図が表示できなかったので、手始めに BLOGRANGER API の オートタギング API というのを使って、指定したブログのエントリからタグを自動推定して、そのタグごとにエントリを分類して表示するアプリケーションを作ってみました。

↓こんな感じです。タグごとにボックスを表示し、そのボックスの中に関連するエントリをリスト表示します。iGoogle っぽくしてみました。


このアプリケーションの URL は、次のとおりです。q パラメータに RSS や Atom といったブログのフィードの URL を指定してください。
http://developmentor.lrlab.to/blogranger/categorize?q=(feed URL)
次のとおり、いくつか実例を用意しましたので、参考にしてください。このアプリケーションを使うには Google Gears が必要です。前述の URL にアクセスすると、Google Gears のインストールを促すページを表示しますので、そのページの手順にしたがって、Google Gears をインストールしてください。

Google Gears をインストールして、前述の URL にアクセスすると、Google Gears を使ってよいかの許可を求めるダイアログを表示します。そのとき許可してはじめて、このアプリケーションが使えるようになります。

パラメータで指定したブログのフィードの URL から Google AJAX Feed API を使って、新しいエントリの情報を 10件ほど取得します。続けて、そのエントリのタイトルとサマリからオートタギング API を使って、タグを自動推定します。そして、エントリの情報と自動推定したタグを Google Gears のローカルデータベースに格納します。

エントリの情報と自動推定したタグは、ローカルデータベースにどんどん蓄積していきます。新しいエントリがあるかどうかは、このアプリケーションにアクセスしたとき 1度だけチェックします。また、ページ右上の更新リンクをクリックすることでもチェックできます。

ローカルデータベースの内容が多くなってくると、ページの表示が遅く重くなってきます。そのときは、ページ右上の削除リンクをクリックして、ローカルデータベースを空にしてやり直しができます。

タグのボックスとそのエントリのリストは、ローカルデータベースの内容から表示しています。タグのリンクをクリックすると、そのタグを中心とした BLOGRANGER TG の地図を表示します。このタグは、エントリから自動推定したタグと、エントリにもともと付与されていたタグの両方を使っています。エントリのリンクをクリックすると、そのエントリを表示します。

ちょっとバグっぽい印象を持つかもしれませんが、パラメータに指定するブログのフィードの URL を変更しても、ローカルデータベースでは、情報源となったブログを区別しませんので、異なる複数のブログをまとめて分類できちゃったりします。例えば、404 Blog Not Found に続けて [N]ネタフル を表示すると、その両方のエントリをまとめて分類できるということです。

0 件のコメント: