INFORMATION
テクノロジ
Apache ManifoldCF -セットアップ-
Apache ManifoldCFのセットアップ手順をご説明します。
- 最初に前提となる実行環境を準備します。
- Java 5以上の環境にします。
- Apache Antをセットアップします。ManifoldCFのビルドに使用します。
適当なディレクトリに展開して「そのディレクトリ/bin」を環境変数に設定します。 - PostgreSQL8.4以上をセットアップします。ManifoldCFの管理データベースとして使用します。
- ManifoldCFをセットアップします。
- ManifoldCFをダウンロードします。
- 適当なディレクトリに展開します。ここでは説明の便宜上、/home/mcfディレクトリにダウンロードして展開することとします。
$ cd /home/mcf # ここにダウンロードして... # ダウンロードしたファイルを展開 $ tar xzvf apache-manifoldcf-0.3-incubating-src.tar.gz
- jcifs.jarをダウンロードします。Windows共有サーバのクロールで利用するのに必要なjarファイルです。
- jarファイルをManifoldCFの次の展開先ディレクトリに配置します。
# 名称を変更します $ mv jcifs-1.x.x.jar jcifs.jar # 配置します $ cp jcifs.jar /home/mcf/manifoldcfapache-manifoldcf-0.3-incubating/connectors/jcifs/jcifs
- ビルドを実行します。
$ cd /home/mcf/manifoldcfapache-manifoldcf-0.3-incubating # ビルド $ ant build
- ManifoldCFを実行します。
- ManifoldCFの実行プログラムのディレクトリに移動し、設定ファイル(properties.xml)を編集します。PostgreSQLの接続設定を行います。
$ cd /home/mcf/manifoldcfapache-manifoldcf-0.3-incubating/dist/example # 設定ファイルを編集します $ emacs properties.xml
- 次の一行を削除します。
: <property name="org.apache.manifoldcf.databaseimplementationclass" value="org.apache.manifoldcf.core.database.DBInterfaceDerby"/> :
- ManifoldCFの実行プログラムのディレクトリに移動し、設定ファイル(properties.xml)を編集します。PostgreSQLの接続設定を行います。
- PostgreSQLに関するproperty行を追加します。postgresql.hostname以下のvalueは適宜編集します。
- ManifoldCFの実行プログラムを実行します。
$ java -jar start.jar
- 次のURLにブラウザからアクセスし、ManifoldCFの管理画面が表示できていることを確認します。
http://localhost:8345/mcf-crawler-ui/
- 以上で、ManifoldCFのセットアップと実行が完了です。
<configuration> : <property name="org.apache.manifoldcf.databaseimplementationclass" value="org.apache.manifoldcf.core.database.DBInterfacePostgreSQL"/> <property name="org.apache.manifoldcf.postgresql.hostname" value="127.0.0.1"/> <property name="org.apache.manifoldcf.postgresql.port" value="5432"/> <property name="org.apache.manifoldcf.dbsuperusername" value="postgres"/> <property name="org.apache.manifoldcf.dbsuperuserpassword" value="password"/> <property name="org.apache.manifoldcf.database.name" value="dbname"/> : </configuration>
- Solrをダウンロードし適当なディレクトリに展開します。
- Solrの実行プログラムの定義ファイルを編集します。
$ cd /home/solr/apache-solr-3.4.0/example/solr/conf
- Solrの実行プログラムの定義ファイルを編集します。
- schema.xmlの編集
- schema.xmlを開き、次の箇所で「stored=”false”」を「stored=”true”」に変更します。(ドキュメントのコンテンツが”text”フィールドにインデクシングされるのを目視確認するために暫定的に変更します。)
: <fields> : <field name="text" type="text_general" indexed="true" stored="true" multiValued="true"/> :
- schema.xmlを開き、次の箇所で「stored=”false”」を「stored=”true”」に変更します。(ドキュメントのコンテンツが”text”フィールドにインデクシングされるのを目視確認するために暫定的に変更します。)
- solrconfig.xmlの編集
- 次に、solrconfig.xmlを開き、次の箇所で”uprefix”の値「ignored_」を「attr_」に変更します。(ドキュメントのコンテンツ属性が”attr_”ダイナミックフィールドにインデクシングされるのを目視確認するために暫定的に変更します。)
: <requestHandler name="/update/extract" startup="lazy" class="solr.extraction.ExtractingRequestHandler" > : <str name="uprefix">attr_</str> :
- 次に、solrconfig.xmlを開き、次の箇所で”uprefix”の値「ignored_」を「attr_」に変更します。(ドキュメントのコンテンツ属性が”attr_”ダイナミックフィールドにインデクシングされるのを目視確認するために暫定的に変更します。)
- Solrの実行プログラムを実行します。
$ cd /home/solr/apache-solr-3.4.0/example $ java -jar start.jar
- 次のURLにブラウザからアクセスし、Solrの管理画面が表示できていることを確認します。
http://localhost:8983/solr/admin/
- 以上で、Solrの準備が完了です。
INFORMATION
KandaSearch
KandaSearch はクラウド型企業向け検索エンジンサービスです。
オープンAPIでカスタマイズが自由にできます。
セミナー
企業が検索エンジンを選定する際のポイントから、
実際の導入デモをお客様ご自身でご体験!