日本語
 
Help Privacy Policy ポリシー/免責事項
  詳細検索ブラウズ

アイテム詳細

登録内容を編集ファイル形式で保存
 
 
ダウンロード電子メール
  Enriching Knowledge Bases with Counting Quantifiers

Mirza, P., Razniewski, S., Darari, F., & Weikum, G. (2018). Enriching Knowledge Bases with Counting Quantifiers. Retrieved from http://arxiv.org/abs/1807.03656.

Item is

基本情報

表示: 非表示:
アイテムのパーマリンク: https://hdl.handle.net/21.11116/0000-0001-E16D-7 版のパーマリンク: https://hdl.handle.net/21.11116/0000-0001-E16E-6
資料種別: 成果報告書

ファイル

表示: ファイル
非表示: ファイル
:
arXiv:1807.03656.pdf (プレプリント), 387KB
ファイルのパーマリンク:
https://hdl.handle.net/21.11116/0000-0001-E16F-5
ファイル名:
arXiv:1807.03656.pdf
説明:
File downloaded from arXiv at 2018-08-06 08:52 The 17th International Semantic Web Conference (ISWC 2018)
OA-Status:
閲覧制限:
公開
MIMEタイプ / チェックサム:
application/pdf / [MD5]
技術的なメタデータ:
著作権日付:
-
著作権情報:
-
CCライセンス:
http://arxiv.org/help/license

関連URL

表示:

作成者

表示:
非表示:
 作成者:
Mirza, Paramita1, 著者           
Razniewski, Simon1, 著者           
Darari, Fariz2, 著者
Weikum, Gerhard1, 著者           
所属:
1Databases and Information Systems, MPI for Informatics, Max Planck Society, ou_24018              
2External Organizations, ou_persistent22              

内容説明

表示:
非表示:
キーワード: Computer Science, Computation and Language, cs.CL
 要旨: Information extraction traditionally focuses on extracting relations between identifiable entities, such as <Monterey, locatedIn, California>. Yet, texts often also contain Counting information, stating that a subject is in a specific relation with a number of objects, without mentioning the objects themselves, for example, "California is divided into 58 counties". Such counting quantifiers can help in a variety of tasks such as query answering or knowledge base curation, but are neglected by prior work. This paper develops the first full-fledged system for extracting counting information from text, called CINEX. We employ distant supervision using fact counts from a knowledge base as training seeds, and develop novel techniques for dealing with several challenges: (i) non-maximal training seeds due to the incompleteness of knowledge bases, (ii) sparse and skewed observations in text sources, and (iii) high diversity of linguistic patterns. Experiments with five human-evaluated relations show that CINEX can achieve 60% average precision for extracting counting information. In a large-scale experiment, we demonstrate the potential for knowledge base enrichment by applying CINEX to 2,474 frequent relations in Wikidata. CINEX can assert the existence of 2.5M facts for 110 distinct relations, which is 28% more than the existing Wikidata facts for these relations.

資料詳細

表示:
非表示:
言語: eng - English
 日付: 2018-07-102018
 出版の状態: オンラインで出版済み
 ページ: 16 p.
 出版情報: -
 目次: -
 査読: -
 識別子(DOI, ISBNなど): arXiv: 1807.03656
URI: http://arxiv.org/abs/1807.03656
BibTex参照ID: Mirza_arXiv:1807.03656
 学位: -

関連イベント

表示:

訴訟

表示:

Project information

表示:

出版物

表示: