corpus
全集 / 言語資料
noun
/ˈkɔːpəs/
意味・解説
言語や文献の研究に使う、自然言語の大規模な集合体。統計分析や言語研究のための文献や資料を集めたもの。
例文
Linguists use a corpus to analyze language patterns.
言語学者は言語パターンを分析するために資料集を使用します。
The corpus contains millions of words from various sources.
その資料集は様々なソースから数百万の単語を含んでいます。
Research teams built a corpus of historical documents.
研究チームは歴史的な文書の資料集を構築しました。
語源
corpusはラテン語corpus「身体・からだ」に由来し、接頭辞よりもcorp-全体で「ひとまとまりの体」を表す語です。そこから文書群を一つの“本文体”と見て「資料集」の意味になり、corpseやcorporalも同じ語根です。
外部辞書で調べる
この単語を英単語クイズで覚えよう