Penn-Helsinki Parsedコーパス用検索ソフトウェア
単語を指定して、コーパスから検索をする。その際構文解析された情報を同時に取り出すことができる。POSタグ、単語の集計をすることができる。
The Treebank search is a corpus analytical tool tailored for the Penn-Helsinki Parsed Corpora.
Corpora available:The Penn-Helsinki Parsed Corpus of Middle English, second edition (PPCME2)
The Penn-Helsinki Parsed Corpus of Early Modern English (PPCEME)
The Penn-Helsinki Parsed Corpus of Modern Brisith English (PPCMBE)
The York-Helsinki Parsed Corpus of Old English Poetry
The York-Toronto-Helsinki Parsed Corpus of Old English Prose
The Brooklyn-Geneva-Amsterdam-Helsinki Parsed Corpus of Old English
Functions
Keyword欄に検索したい語や文字列を入力する。
as a word指定は、単語全体の完全一致に場合にヒットする。正規表現チェックボックスは、チェック状態で正規表現を利用可能となる。
POSやSyntactic1-3を指定すると、より条件を厳密に検索する。
Syntactic1-3は、Penn-Parsed CorpusのSyntactic Annotationに相当し、1から順に検索語から近いものを指す。
検索結果の該当行をクリックすると、コーパス検索行が別ウィンドウに表示される。(内部処理の関係で、該当文のID部分がハイライトされる。)
Download
Menu Language | type | Version | Updated |
English | Windows Installer (msi) | 1.3 | 2023/2/24 |
exe file |
Satoru Tsukamoto (College of Humanities and Sciences, Nihon University)