INFORMATION
テクノロジ
NExTR on Railsを使う
固有表現抽出ツールNExTR on Rails(以下NEXTRRと記述)の簡単な使い方を紹介します。
次回は、Solrと組み合わせて使う方法を紹介します。
- 最初にNEXTRRをダウンロードサイトからダウンロードします。
- ダウンロードしたファイル(nextr-1.0.0.tar.gz)を解凍ツールやtarコマンドで解凍します。
$ tar xvzf nextr-1.0.0.tar.gz
- 解凍してできたファイルをVMWareで起動します。
起動時に「この仮想マシンは使用中の可能性があります。」と表示された場合は、「再度開く」を選択し、「所有権を取得」を選択して先に進みます。
また、起動時に「この仮想マシンは移動またはコピーされた可能性があります。」と表示された場合は、「コピーしました」を選択して先に進みます。 - 起動したらユーザ名:next、パスワード:chasenでログインします。
- ifconfigでIPアドレスを調べます。
$ ifconfig
ネットワークが起動していないと思われる場合、仮想マシンのMACアドレスを調べます。nextr.vmwarevm/nextr.vmxファイルの「ethernet0.generatedAddress = “00:0c:29:xx:xx:xx”」という行を見つけます。そしてNEXTRRにて/etc/udev/rules.d/70-persistent-net.rulesファイルをエディタでオープンします。$ sudo vi /etc/udev/rules.d/70-persistent-net.rules
そして、NAME=”eth0″の行のMACアドレスが違うはずなのでこの行を#でコメントアウトします。そしてその下にMACアドレスが一致するNAME=”eth1″の行があるはずなので、これをeth0に変更して再起動します。$ sudo shutdown -r now
そして再度ログインしてifconfigでIPアドレスを調べます。 - products/nextr-GPL2/text-nextr.htmlファイルをscpコマンド等を使ってローカル環境にコピーします。
$ scp next@<IPアドレス>:products/nextr-GPL2/text-nextr.html text-nextr.html
- ローカル環境にコピーしたtext-nextr.htmlをエディタで開き、”localhost”となっているところをNEXTRRのIPアドレスに書き換えます。
- ブラウザでtext-nextr.htmlを開き、入力ボックスに地名や組織名などの固有名詞を含む文章を入力します。たとえばここでは「自由民主党の谷垣総裁が今朝、新幹線で東京駅に到着しました。」と入れてみます。
- analyzeボタンをクリックするとNEXTRRにリクエストが飛んで、解析結果がXMLで次のように戻ってきます。
<result> <ORGANIZATION>自由民主党</ORGANIZATION> <PERSON>谷垣</PERSON> <GPE>東京</GPE> <STATION>東京駅</STATION> </result>
次回は、Solrと組み合わせて使う方法を紹介します。
関連リンク
INFORMATION
KandaSearch
KandaSearch はクラウド型企業向け検索エンジンサービスです。
オープンAPIでカスタマイズが自由にできます。
セミナー
企業が検索エンジンを選定する際のポイントから、
実際の導入デモをお客様ご自身でご体験!