TeebankExtractはPenn-Helsinki Parsed Corpusの検索ソフトCorpusSearchの出力ファイルから検索項目を取り出し整形するソフトウエア。
CorpusSearchの出力が必要であるため、単独では検索できないので注意。
The TreebankExtract is software that extracts retrieved items from outpout a file by CorpusSearch.
N.B. The output of CorpusSearch is required. PPCExctract does not retrieve any search by itself.
The Penn-Helsinki Parsed Corpus of Middle English, second edition (PPCME2)
The Penn-Helsinki Parsed Corpus of Early Modern English (PPCEME)
The Penn-Helsinki Parsed Corpus of Modern Brisith English (PPCMBE)
The York-Helsinki Parsed Corpus of Old English Poetry
The York-Toronto-Helsinki Parsed Corpus of Old English Prose
The Brooklyn-Geneva-Amsterdam-Helsinki Parsed Corpus of Old English
Functions
This software extracts the query results from the output file by CorpusSearch.- CorpusSearchの検索結果ファイルをFileにセットする。
Set up the query result file in File box.- 検索結果は以下のようになっている。
In the query result file, you will see the result format like this:
E.g.238 IP-SUB: 251 VAG, 246 BEP, 252 converging- 出力ファイルははじめにnode情報、続いてqueryコマンドの結果が続く。
This output consists of the node information (e.g. 238 IP-SUB), followed by query results in the query command.
- Node1-4の項目で抽出項目を指定する。
検索結果のnode項目はStructuer項目に配置される。queryコマンドの検索結果の前からの順番のなかで必要な項目をNode1-4に指定する。Node1指定項目でKWIC表示される。
Choose the query result by selecting the number in the combobox.
The first field comes into the Structure column (corresponding to "node" query info). An field selected in Node 1 appeares in Center, with the context in the Left and Right column. The other fields come into Node2, and Node 3, depending on your choice in Node 2-4.- Startボタンにより処理を開始する。
The process starts by clicking Start.- Copyボタンにより、結果をクリップボードにコピーする。
By Copy, the result will be copied into the clipboard.- query:
Example
node: IP*
print_indices: true
query: ([1]BAG|DAG|HAG|VAG hasSister B*)
AND (B* precedes [1]BAG|DAG|HAG|VAG)
AND ([1]BAG|DAG|HAG|VAG idoms .*)
output:
/*
238 IP-SUB: 251 VAG, 246 BEP, 252 converging
*/
(0 (1 IP-MAT (2 NP-SBJ (3 PRO We))
(5 BEP are)
(7 , ,)
...
(238 IP-SUB (239 PP *T*-5)
(241 NP-SBJ (242 Q all) (244 NS things))
(246 BEP are)
(248 ADVP-TMP (249 ADV now))
(251 VAG converging)))
(253 , ,)
Download
Menu Language | type | Version | Updated |
English | Windows Installer (msi) | 1.0 | 2022/2/28 |
exe file |
Satoru Tsukamoto (College of Humanities and Sciences, Nihon University)
日本大学文理学部英文学科 塚本 聡 (Satoru TSUKAMOTO [Nihon University])