Skip to main content
Pengolahan Bahasa Alami (Natural Language Processing) (Pusat Riset Sains Data dan Informasi - BRIN)
Featured Dataverses

In order to use this feature you must have at least one published dataverse.

Publish Dataverse

Are you sure you want to publish your dataverse? Once you do so it must remain published.

Publish Dataverse

This dataverse cannot be published because the dataverse it is in has not been published.

Delete Dataverse

Are you sure you want to delete your dataverse? You cannot undelete this dataverse.

Advanced Search

1 to 10 of 10 Results
Oct 16, 2024
Kokoy Siti Komariah; Yuyun; Mohammad Teduh Uliniansyah; Dian Isnaeni Nurul Afra; Yaniasih; Radhiyatul Fajri; Siska Pebiana; Nasrullah; Najirah Umar; Abdul Latief Arda; Abdul Jalil; Muhammad Risal; Sitti Zuhriyah; A. Edeth Fuari Anatasya; M. Adnan Nur; Billy Eden William Asrul; Mirfan; Pujianti Wahyuningsih; Supriadi, 2024, "IndoCia 6K - Dataset Korpus Paralel Bahasa Indonesia dan Bahasa Cia-Cia", https://hdl.handle.net/20.500.12690/RIN/6ZSBOQ, RIN Dataverse, V1
Dataset korpus paralel ini berisi pasangan kalimat bahasa Indonesia dan bahasa Cia-Cia
Oct 16, 2024
Nurul Afra, Dian Isnaeni, 2024, "IndoMakassar 9K - Dataset Kalimat Paralel Bahasa Indonesia dan Bahasa Makassar", https://hdl.handle.net/20.500.12690/RIN/AZNE1K, RIN Dataverse, V1, UNF:6:g3ESYip/qdf9lxTGCgxM+w== [fileUNF]
Dataset ini merupakan kumpulan kalimat paralel bahasa Indonesia dan bahasa Makassar sejumlah 9.165 pasang kalimat. Dataset ini bisa digunakan untuk riset-riset terkait pengolahan data bahasa Makassar seperti mesin penerjemah, analisis sentimen, pemodelan topik, dll.
Oct 16, 2024 - Dataset Berita Palsu Bahasa Indonesia Dengan Penelusuran Fakta Berbasis LLM
Wijayanti, Rini, 2024, "Dataset Berita Palsu Bahasa Indonesia Dengan Penelusuran Fakta Berbasis LLM", https://hdl.handle.net/20.500.12690/RIN/7QBRKQ, RIN Dataverse, V1, UNF:6:+NmomlH9kcsIcrgWTddlAg== [fileUNF]
Dataset ini berisi kumpulan berita palsu (hoax) dan berita valid (real) dalam bahasa Indonesia. Data dikumpulkan dari situs pelaporan hoaks serta portal berita online Indonesia. Judul berita dari portal online diparafrase agar memiliki karakteristik serupa dengan klaim pada data...
Oct 12, 2024
Yuyun; Gusnawaty; Uliniansyah, Mohammad Teduh; Gunarso; Latief, Andi Djalal; Sampurno, Tri; Afra, Dian Isnaeni Nurul; Nurfadhilah, Elvira; Hidayati, Nuraisa Novia; Pebiana, Siska; Pammuda; Kaharuddin, Mutahharah Nemin; Rosvita, Ita; Jufri, Nurfaedah; Zahrani; Munawirah; Hazriani, 2024, "InaBugi10K - Dataset Korpus Paralel Bahasa Indonesia - Bahasa Bugis", https://hdl.handle.net/20.500.12690/RIN/WQPYWJ, RIN Dataverse, V1, UNF:6:7jOVv766bHItHIJcvhFnSg== [fileUNF]
Dataset ini berisi kumpulan kalimat paralel bahasa Indonesia dan bahasa Bugis sejumlah 10.296 kalimat. Dataset ini dapat digunakan untuk riset-riset dalam bidang pemrosesan bahasa alami (natural language processing; NLP). Dataset ini telah diuji melalui pengembangan model mesin p...
Oct 12, 2024 - PosTagBugis3K
Yuyun, 2024, "PosTagBugis3K - Dataset PoS Kalimat Bahasa Bugis", https://hdl.handle.net/20.500.12690/RIN/I9CHQS, RIN Dataverse, V2
Dataset ini berisi 3.714 kalimat bahasa Bugis yang setiap katanya sudah dilabeli dengan tag jenis kata. Total jumlah kata adalah 16.713 kata. Dataset ini sangat bermanfaat untuk riset-riset pengolahan bahasa alami (natural language processing; NLP), dan dapat digunakan untuk peng...
Sep 25, 2024
Jarin, Asril; Santosa, Agung; Yaniasih, 2024, "IndoGIS-Commands2JSON: Dataset Perintah Bahasa Indonesia ke Struktur JSON untuk API GIS", https://hdl.handle.net/20.500.12690/RIN/93IVOU, RIN Dataverse, V1
Dataset IndoGIS-Commands2JSON adalah data sintetis yang bersifat "dummy" yang dikoleksikan dengan bantuan ChatGPT dan dirancang untuk melatih dan menguji model bahasa besar (LLM) dalam mengonversi perintah alami dalam Bahasa Indonesia ke dalam struktur JSON yang dapat digunakan o...
Oct 10, 2023
Hidayati, Nuraisa Novia; Riza, Hammam; Gunarso; Mohammad Teduh Uliniansyah; Agung Santosa; Asril; Elvira Nurfadhilah; Radhiyatul Fajri; Andi Djalal Latief; Dian Isnaeni Nurul Afra; Siska Pebiana; Harnum Annisa Prafitia; Junanto Prihantoro; Lyla Ruslana Aini; Yosi Sahreza; Gembong Satrio Wibowanto; Josua Geovani Pinem; Aulia Haritsuddin Karisma Muhammad Subekti; Muhammad Reza Alfin; Agung Septiadi; Siti Shaleha; Jemie Muliadi, 2023, "Dataset Sentimen dari Twitter Mengenai Ibu Kota Negara (IKN)", https://hdl.handle.net/20.500.12690/RIN/AXNT6M, RIN Dataverse, V1, UNF:6:eGsuLpL92MGaNdXRLoQamQ== [fileUNF]
Dataset ini merupakan kumpulan tweet berbahasa Indonesia mengenai IKN. Tweet yang dikumpulkan adalah dalam periode waktu 1 maret 2022 hingga 17 maret 2022. Jumlah total tweet adalah 12.520 tanpa ada duplikat konten, yang telah dilabeli dengan tiga kelas sentimen yaitu positif, ne...
Sep 4, 2023
Hidayati, Nuraisa Novia; Siska Pebiana; Indra Budi; Mohammad Teduh Uliniansyah; Agung Santosa; Asril; Elvira Nurfadhilah; Radhiyatul Fajri; Andi Djalal Latief; Dian Isnaeni Nurul Afra; Gunarso; Siti Shaleha; Tri Sampurno; Yuyun; Hammam Riza; Meganingrum Arista Jiwanggi; Ryan Randy Suryono; Tosan Wiar Ramadhani; M Irfan Raif; Tri Nanda, 2023, "InaFoodSec - Dataset Sentimen Twitter 50K mengenai Layanan Publik pada Bidang Ketahanan Pangan", https://hdl.handle.net/20.500.12690/RIN/GL8QRF, RIN Dataverse, V1, UNF:6:nmDzt5e3OFYV1BeoTPQvNA== [fileUNF]
Dataset ini terdiri dari sekumpulan tweet berbahasa Indonesia yang membahas tentang katahanan pangan untuk biodiversitas. Tweet-tweet yang terhimpun diambil dalam rentang waktu mulai dari 01 Januari 2020 hingga 23 Februari 2023. Jumlah keseluruhan tweet mencapai 50.000 tanpa ada...
Sep 4, 2023
Fajri, Radhiyatul; Indra Budi; Mohammad Teduh Uliniansyah; Agung Santosa; Asril; Elvira Nurfadhilah; Andi Djalal Latief; Dian Isnaeni Nurul Afra; Gunarso; Nuraisa Novia Hidayati; Siska Pebiana; Siti Shaleha; Tri Sampurno; Yuyun; Hammam Riza; Meganingrum Arista Jiwanggi; Ryan Randy Suryono; Tosan Wiar Ramadhani; M Irfan Raif; Tri Nanda, 2023, "InaEnviMag - Dataset Sentimen Twitter 50K mengenai Layanan Publik pada Bidang Pengelolaan Lingkungan", https://hdl.handle.net/20.500.12690/RIN/KZH0T8, RIN Dataverse, V1, UNF:6:feIM2yIUCKMqXZsC+UIsrQ== [fileUNF]
Dataset ini berisi 50.000 data tweet dengan sekitar 21 kata kunci terkait pengelolaan lingkungan dengan rentang waktu pengumpulan Januari 2020 hingga Maret 2023. Data ini telah disaring untuk menghilangkan informasi yang tidak relevan, termasuk konten dalam bahasa asing dan daera...
Add Data

Sign up or log in to create a dataverse or add a dataset.

Share Dataverse

Share this dataverse on your favorite social media networks.

Link Dataverse
Reset Modifications

Are you sure you want to reset the selected metadata fields? If you do this, any customizations (hidden, required, optional) you have done will no longer appear.

Contact RIN Dataverse Support

RIN Dataverse Support

Please fill this out to prove you are not a robot.

+ =