- Source: British National Corpus
British National Corpus (BNC) atau Korpus Nasional Inggris adalah korpus monolingual berupa data atau kumpulan teks berbahasa Inggris yang berjumlah lebih dari 100 juta kata. BNC juga disebut sebagai “bank of English” atau bank data bahasa Inggris yang terdiri atas data lisan dan data tulis, serta dikumpulkan melalui berbagai sumber dan topik.
Sejarah
British National Corpus dibuat pertama kali oleh Penerbit Universitas Oxford pada 1980 hingga awal 1990. Saat ini, proyek ini merupakan kolaborasi beberapa pihak yaitu, Penerbit Universitas Oxford, Longman, Chambers, Universitas Lancaster, dan Perpustakaan Inggris.
Konten
Sumber data BNC berasal dari 90% data tulis dan 10% data lisan. Data tulis diambil dari surat kabar, jurnal penelitian, majalah, dan buku-buku fiksi. Selain itu, data lisan antara lain bersumber dari transkripsi percakapan alami dan transkripsi rekaman acara-acara.
Kegunaan
BNC berfungsi untuk membantu pekerjaan-pekerjaan di bidang linguistik, seperti:
Penyusunan kamus monolingual dan bilingual Dalam penyusunan kamus, BNC berperan untuk membantu pemerolehan data perkembangan bahasa secara alami atau apa adanya. Sampel-sampel kalimatnya digunakan untuk mendukung pembuatan senarai istilah, definisi istilah, contoh lema (entri dalam kamus), penentuan kelas kata, dan kolokasi.
Uji dan evaluasi bahasa Inggris BNC berfungsi untuk membantu evaluasi semantik atau subkategorial dalam bahasa Inggris dalam rangka analisis makna berbasis komputasi.
Penyusunan modul berbahasa Inggris BNC berguna untuk membantu mengetahui frekuensi kalimat dan polanya. Hasilnya menjadi bahan pembelajaran atau sumber referensi dalam produksi modul pembelajaran.
Penelitian linguistik lainnya.
Pemutakhiran
Saat ini, BNC2014 telah dibuat sebagai bentuk pemutakhiran BNC1994. Perbandingan keduanya cukup seimbang dan secara umum memiliki genre atau register yang sama. Pada BNC2014 terdapat tambahan fitur ‘E-language’. Meski begitu, mayoritas proporsi data dari setiap subdivisi korpora memiliki kemiripan.
Referensi
Kata Kunci Pencarian:
- British National Corpus
- Korpus Linguistik dan Hukum
- Konkordansi
- Magna Carta
- Amerika Serikat
- Malaysia
- Ragnall ua Ímair
- Marty Natalegawa
- Inggris
- Sejarah demokrasi
- British National Corpus
- Brown Corpus
- Corpus linguistics
- American National Corpus
- Oxford English Corpus
- Enron Corpus
- Corpus of Contemporary American English
- Xaira
- Internet linguistics
- Habeas corpus