corpora
語料(言語資料集)
解説 Definition
言語研究のために収集された大量のテキストデータの集合体。corpusの複数形。
Corpora is the plural of corpus. In language study and data research, it means organized collections of texts or spoken language used for analysis. The word is mostly used in linguistics, computing, and academic work.
覚え方のコツ Memory Tip
まず corpus と対で覚えるのが最短です。単数が corpus、複数が corpora で、datum→data のような「ラテン語系の不規則複数」の型だと見ると形が残ります。意味は「一つの文章」ではなく、研究のために集めた大量テキストの集合。corpora of spoken English, compare two corpora のように、複数の語料集を並べて扱う場面でよく出ます。corpus linguistics と結び付けると用途まで一緒に思い出せます。corps とはつづりも意味も別なので混同しないこと。
The fastest way is to learn it with `corpus`: one `corpus`, two `corpora`. This is a Latin-style plural pattern, like `datum` and `data`, so the unusual ending becomes easier to accept. In language study, the word usually appears when people compare large collections of texts.
例文
Linguists analyze large corpora to identify patterns in language use.
言語学者は大規模な言語資料集を分析して、言語使用のパターンを特定する。
The research team compiled several corpora of spoken English from different regions.
研究チームは、さまざまな地域の話し言葉の英語を集めた言語資料集を複数編纂した。
Digital corpora have revolutionized the way we study language evolution.
デジタルコーパスは言語の進化を研究する方法に革命をもたらした。
corpora の類義語・関連語
紛らわしい語
corpora の語源・成り立ち Etymology
corpora は corpus のラテン語複数形で、corpus は「身体・全体」を意味します。corporal や incorporate と同じ語根で、ばらばらの文章を一つの「言語の体」として集めたものだと分かると、語料集の意味が腑に落ちます。
`Corpora` is the Latin plural of `corpus`, meaning "body." The same root appears in English words like `corporal` and `incorporate`. The idea behind the later scholarly use is a collection treated as one body of texts, so the sense moved from a physical body to a unified body of language material.
外部辞書で調べる
この単語を英単語クイズで覚えよう