検索エンジン自作入門 ~手を動かしながら見渡す検索の舞台裏
この本の概要
まいにち使っている検索エンジンがどうやって動いているか,知っていますか?
本書では,小さな検索エンジンを作りながら,ソースコードレベルで検索エンジンのしくみを解説。
Yahoo!Japanの検索エンジン開発チームを経て2008年度上期未踏IT人材発掘・育成事業において高性能分散型検索エンジンの開発によりスーパークリエータに認定された山田浩之氏と,全文検索エンジンSenna/Groongaの開発に携わってきた末永匡氏による,オンリーワンの1冊です。
こんな方におすすめ
- 検索エンジンのしくみや実装に興味のある方
目次
第1章 検索エンジンはいかにして動くのか
1-1 検索エンジンの構成を理解する
- 検索エンジンとは
- 検索エンジンを構成するコンポーネント
- 検索エンジンに関連するコンポーネント
1-2 高速な全文検索を実現するインデックスの仕組み
- 全文検索の2つの方法
- 転置インデックスの仕組み
- 転置インデックスの作り方
- 転置インデックスで用いられる用語
1-3 転置インデックスを深く知る
- 転置インデックス=辞書+転置リスト
- 転置インデックスから単語を探す
- 転置リストに単語の位置情報を加える
- 転置インデックスからフレーズを探す