project nusantara adalah sebuah project untuk mengumpulkan dataset dan membangun model machine learning untuk keperluan mendukung pelestarian produk-produk kebudayaan Indonesia, baik aksara, bahasa, maupun produk kebudayaan lainnya. Project ini diinisiasi oleh Sigit Purnomo dan Mas Roni Lantip.
bahasa nusantara adalah kumpulan model yang dibuat dengan spaCy untuk keperluan natural language processing data teks berbagai bahasa yang ada di Indonesia. Sampai saat ini sudah tersedia 2 buah model, yaitu:
- Model spaCy untuk Bahasa Indonesia,
- Model spaCy untuk Bahasa Jawa.