2009-09-07から1日間の記事一覧

nutch 1.0のnutch-1.0.warアプリケーションを手動でEclipseのダイナミックウェブプロジェクトに追加する

Eclipseでnutch-1.0という名前のダイナミックウェブプロジェクトを作成する。nutch-1.0.warファイルを適当なディレクトリに解凍する。

bin/nutchコマンドを使わずにクロールを実行する

org.apache.nutch.crawl.Crawlクラスのmainメソッドを呼び出すことで、クロールを実行することができる。Eclipseから実行する場合、mainメソッドの引数渡すパラメータは、デバグ設定の画面から指定できる。 が、ここで問題が!nutch 0.9までは、Crawlクラス…