日本語
 
Help Privacy Policy ポリシー/免責事項
  詳細検索ブラウズ

アイテム詳細

  Better Filtering with Gapped q-Grams

Burkhardt, S., & Kärkkäinen, J. (2001). Better Filtering with Gapped q-Grams. In A., Amir, & G., Landau (Eds.), Proceedings of the 12th Annual Symposium on Combinatorial Pattern Matching (pp. 73-85). Berlin, Germany: Springer.

Item is

基本情報

表示: 非表示:
資料種別: 会議論文

ファイル

表示: ファイル

関連URL

表示:

作成者

表示:
非表示:
 作成者:
Burkhardt, Stefan1, 著者           
Kärkkäinen, Juha1, 著者           
所属:
1Algorithms and Complexity, MPI for Informatics, Max Planck Society, ou_24019              

内容説明

表示:
非表示:
キーワード: -
 要旨: The q-gram filter is a popular filtering method for approximate string matching. It compares substrings of length q (the q-grams) in the pattern and the text to identify the text areas that might contain a match. A generalization of the method is to use gapped q-grams, subsets of q characters in some fixed non-contiguous shape, instead of contiguous substrings. Although mentioned a few times in the literature, this generalization has never been studied in any depth. In ths paper, we report the first results from a study on gapped q-grams. We show that gapped q-grams can provide orders of magnitude faster and/or more efficient filtering than contiguous q-grams. The performance, however, depends on the shape of the q-grams. The best shaoes are rare and often posess no apparen regularity. We show how to recognize good shapes and demonstrate with experiments their advantage over both contiguous and average shapes. We concentrate here on the k mismatches problem, but also outline an approach for extending the results to the more common k differences problem.

資料詳細

表示:
非表示:
言語: eng - English
 日付: 2010-03-022001
 出版の状態: 出版
 ページ: -
 出版情報: -
 目次: -
 査読: -
 識別子(DOI, ISBNなど): eDoc: 518175
URI: http://www.mpi-sb.mpg.de/~stburk/gapped-q.ps
その他: Local-ID: C1256428004B93B8-5165C4C93C02B85DC1256A8F00420FEE-Burkhardt2001
 学位: -

関連イベント

表示:
非表示:
イベント名: Untitled Event
開催地: Jerusalem, Israel
開始日・終了日: 2001

訴訟

表示:

Project information

表示:

出版物 1

表示:
非表示:
出版物名: Proceedings of the 12th Annual Symposium on Combinatorial Pattern Matching
種別: 会議論文集
 著者・編者:
Amir, Amihood, 編集者
Landau, Gadi, 編集者
所属:
-
出版社, 出版地: Berlin, Germany : Springer
ページ: - 巻号: - 通巻号: - 開始・終了ページ: 73 - 85 識別子(ISBN, ISSN, DOIなど): ISBN: 3-540-42271-4

出版物 2

表示:
非表示:
出版物名: Lecture Notes in Computer Science
種別: 連載記事
 著者・編者:
所属:
出版社, 出版地: -
ページ: - 巻号: 2089 通巻号: - 開始・終了ページ: - 識別子(ISBN, ISSN, DOIなど): -