先日ベータ版がリリースされたPlacemakerを試してみました。LocoStickerを作っている者としては非常に気になるサービスです。
Yahoo.com の ID は持っていたので、App ID さえ取ってしまえば Placemaker の利用そのものは非常に簡単でした。APIドキュメントを読んで必要なパラメータを POST するだけです。(この記事の最後にお試し用のフォームを置いてあります)
最低以下の4つを指定すれば日本語の文章からも地名抽出してくれます。
appId=hogehoge inputLanguage=ja-JP documentType=text/plain documentContent=清水寺を観光したdocumentContent の 代わりに documentURL を指定すればウェブ上のコンテンツを対象とさせることもできます。
清水寺は日本中にたくさんあるという話はLocoStickerを説明する際にも良く使う例なんですが、「清水寺を観光した」をPlacemakerに掛けると、京都の清水寺が選ばれます。これは同じ表現で複数の場所の候補がある場合には1つに絞るモードがデフォルトになっているからで、autoDisambiguate=false を指定すればすべての「清水寺」の場所が返ってきます。各候補は confidence という項目を持っており、autoDisambiguate=true の場合には conficence が最大の候補が選ばれるようです。いろいろ試した限りではこの confidence は静的な値のようで、抽出対象となる文章内の地名間の位置関係は autoDisambiguate のロジックでは使われていないみたいです。この点は LocoSticker と Placemaker の違いを特徴付ける大きな要素と言えそうです。
たとえば「明石市の清水寺」の場合、LocoSticker では「明石市」と「清水寺(明石市のもの)」が選ばれますが、Placemaker では「明石市」と「清水寺(京都市のもの)」が選ばれました。 ただし、Placemaker では、フォーカスする場所のヒントを focusWoeId というパラメータで与えることができます(API ドキュメントでは focusWoeid となっていますが、フォーラムの記事によれば i は大文字じゃないと正しく動作しないそうです)。ただ、focusWoeId として「明石市」の WOEID である 1116946 を指定しても「清水寺」は相変わらず京都のままでした。フォーラムで上げられている "Arlington" の例ではうまく行くので、うまく行く場合とうまく行かない場合とがあるみたいです。何に起因しているのかはもうちょっと試してみないと分かりません。
それと、日本語の地名に関して、住所表記については町名レベルまで抽出してくれるようです。例えば「大阪市中央区本町2-5-7」と入力すると「大阪市中央区本町」が返ってきます。(LocoStickerは番地レベルまでです。この例だと「大阪市中央区本町2-5」が返ります。)
ともあれ、まだベータ版でありますし、この先が楽しみでもあり怖くもあるサービスです。






