corpus
corpus は英検1級・TOEFL 60・IELTS 5.5レベルの英単語で、「全集 / 言語資料」という意味があります。発音記号は /ˈkɔːpəs/ です。
全集 / 言語資料
解説 Definition
言語や文献の研究に使う、自然言語の大規模な集合体。統計分析や言語研究のための文献や資料を集めたもの。
A corpus is a large collection of written, spoken, or recorded material gathered for study. It is often used in language learning, linguistics, and academic research. In some contexts, it can also mean the complete works of one writer or a group of texts on one subject.
覚え方のコツ Memory Tip
corpusは、単なるcollectionよりも「研究用に集めた大量の実例データ」を指す語として覚えると定着しやすいです。特に言語学では、辞書の説明ではなく実際の英文・会話をまとめた集まりがcorpus。build a corpus, analyze a corpus, a spoken corpus などの形でよく出ます。textsの“集まり全体”を見る語で、1冊の本や作品集ではない点、corpse(死体)とつづりを混同しやすい点にも注意。
Think of corpus as a serious, research-style collection, not just any collection. It is often used for a large body of real examples, especially language data. Try to remember common phrases like "build a corpus" and "analyze a corpus," and do not confuse it with "corpse."
例文
Linguists use a corpus to analyze language patterns.
言語学者は言語パターンを分析するために資料集を使用します。
The corpus contains millions of words from various sources.
その資料集は様々なソースから数百万の単語を含んでいます。
Research teams built a corpus of historical documents.
研究チームは歴史的な文書の資料集を構築しました。
corpus の類義語・関連語
corpus の語源・成り立ち Etymology
corpusはラテン語corpus「身体・からだ」に由来し、接頭辞よりもcorp-全体で「ひとまとまりの体」を表す語です。そこから文書群を一つの“本文体”と見て「資料集」の意味になり、corpseやcorporalも同じ語根です。
"Corpus" comes directly from Latin corpus, meaning "body." The idea later widened from a physical body to any organized whole made of connected parts, such as a body of texts. Related English words include corpse and corporal.
外部辞書で調べる
この単語を英単語クイズで覚えよう