1 to 10 of 11 Results
Oct 16, 2024
Kokoy Siti Komariah; Yuyun; Mohammad Teduh Uliniansyah; Dian Isnaeni Nurul Afra; Yaniasih; Radhiyatul Fajri; Siska Pebiana; Nasrullah; Najirah Umar; Abdul Latief Arda; Abdul Jalil; Muhammad Risal; Sitti Zuhriyah; A. Edeth Fuari Anatasya; M. Adnan Nur; Billy Eden William Asrul; Mirfan; Pujianti Wahyuningsih; Supriadi, 2024, "IndoCia 6K - Dataset Korpus Paralel Bahasa Indonesia dan Bahasa Cia-Cia", https://hdl.handle.net/20.500.12690/RIN/6ZSBOQ, RIN Dataverse, V1
Dataset korpus paralel ini berisi pasangan kalimat bahasa Indonesia dan bahasa Cia-Cia |
Oct 16, 2024
Nurul Afra, Dian Isnaeni, 2024, "IndoMakassar 9K - Dataset Kalimat Paralel Bahasa Indonesia dan Bahasa Makassar", https://hdl.handle.net/20.500.12690/RIN/AZNE1K, RIN Dataverse, V1, UNF:6:g3ESYip/qdf9lxTGCgxM+w== [fileUNF]
Dataset ini merupakan kumpulan kalimat paralel bahasa Indonesia dan bahasa Makassar sejumlah 9.165 pasang kalimat. Dataset ini bisa digunakan untuk riset-riset terkait pengolahan data bahasa Makassar seperti mesin penerjemah, analisis sentimen, pemodelan topik, dll. |
Oct 16, 2024 - Dataset Berita Palsu Bahasa Indonesia Dengan Penelusuran Fakta Berbasis LLM
Wijayanti, Rini, 2024, "Dataset Berita Palsu Bahasa Indonesia Dengan Penelusuran Fakta Berbasis LLM", https://hdl.handle.net/20.500.12690/RIN/7QBRKQ, RIN Dataverse, V1, UNF:6:+NmomlH9kcsIcrgWTddlAg== [fileUNF]
Dataset ini berisi kumpulan berita palsu (hoax) dan berita valid (real) dalam bahasa Indonesia. Data dikumpulkan dari situs pelaporan hoaks serta portal berita online Indonesia. Judul berita dari portal online diparafrase agar memiliki karakteristik serupa dengan klaim pada data... |
Oct 16, 2024
|
Oct 12, 2024
Yuyun; Gusnawaty; Uliniansyah, Mohammad Teduh; Gunarso; Latief, Andi Djalal; Sampurno, Tri; Afra, Dian Isnaeni Nurul; Nurfadhilah, Elvira; Hidayati, Nuraisa Novia; Pebiana, Siska; Pammuda; Kaharuddin, Mutahharah Nemin; Rosvita, Ita; Jufri, Nurfaedah; Zahrani; Munawirah; Hazriani, 2024, "InaBugi10K - Dataset Korpus Paralel Bahasa Indonesia - Bahasa Bugis", https://hdl.handle.net/20.500.12690/RIN/WQPYWJ, RIN Dataverse, V1, UNF:6:7jOVv766bHItHIJcvhFnSg== [fileUNF]
Dataset ini berisi kumpulan kalimat paralel bahasa Indonesia dan bahasa Bugis sejumlah 10.296 kalimat. Dataset ini dapat digunakan untuk riset-riset dalam bidang pemrosesan bahasa alami (natural language processing; NLP). Dataset ini telah diuji melalui pengembangan model mesin p... |
Oct 12, 2024 - PosTagBugis3K
Yuyun, 2024, "PosTagBugis3K - Dataset PoS Kalimat Bahasa Bugis", https://hdl.handle.net/20.500.12690/RIN/I9CHQS, RIN Dataverse, V2
Dataset ini berisi 3.714 kalimat bahasa Bugis yang setiap katanya sudah dilabeli dengan tag jenis kata. Total jumlah kata adalah 16.713 kata. Dataset ini sangat bermanfaat untuk riset-riset pengolahan bahasa alami (natural language processing; NLP), dan dapat digunakan untuk peng... |
Oct 12, 2024
Dataset ini berisi 3.714 kalimat yang setiap katanya sudah dilengkapi dengan label jenis kata (part-of-speech). Jumlah total kata adalah .713 kata. Dataset ini bermanfaat untuk digunakan sebagai bahan riset berbagai proyek dalam bidang pemrosesan bahasa alami (natural language pr... |
Sep 25, 2024
Jarin, Asril; Santosa, Agung; Yaniasih, 2024, "IndoGIS-Commands2JSON: Dataset Perintah Bahasa Indonesia ke Struktur JSON untuk API GIS", https://hdl.handle.net/20.500.12690/RIN/93IVOU, RIN Dataverse, V1
Dataset IndoGIS-Commands2JSON adalah data sintetis yang bersifat "dummy" yang dikoleksikan dengan bantuan ChatGPT dan dirancang untuk melatih dan menguji model bahasa besar (LLM) dalam mengonversi perintah alami dalam Bahasa Indonesia ke dalam struktur JSON yang dapat digunakan o... |
Oct 10, 2023
Hidayati, Nuraisa Novia; Riza, Hammam; Gunarso; Mohammad Teduh Uliniansyah; Agung Santosa; Asril; Elvira Nurfadhilah; Radhiyatul Fajri; Andi Djalal Latief; Dian Isnaeni Nurul Afra; Siska Pebiana; Harnum Annisa Prafitia; Junanto Prihantoro; Lyla Ruslana Aini; Yosi Sahreza; Gembong Satrio Wibowanto; Josua Geovani Pinem; Aulia Haritsuddin Karisma Muhammad Subekti; Muhammad Reza Alfin; Agung Septiadi; Siti Shaleha; Jemie Muliadi, 2023, "Dataset Sentimen dari Twitter Mengenai Ibu Kota Negara (IKN)", https://hdl.handle.net/20.500.12690/RIN/AXNT6M, RIN Dataverse, V1, UNF:6:eGsuLpL92MGaNdXRLoQamQ== [fileUNF]
Dataset ini merupakan kumpulan tweet berbahasa Indonesia mengenai IKN. Tweet yang dikumpulkan adalah dalam periode waktu 1 maret 2022 hingga 17 maret 2022. Jumlah total tweet adalah 12.520 tanpa ada duplikat konten, yang telah dilabeli dengan tiga kelas sentimen yaitu positif, ne... |
Sep 4, 2023
Hidayati, Nuraisa Novia; Siska Pebiana; Indra Budi; Mohammad Teduh Uliniansyah; Agung Santosa; Asril; Elvira Nurfadhilah; Radhiyatul Fajri; Andi Djalal Latief; Dian Isnaeni Nurul Afra; Gunarso; Siti Shaleha; Tri Sampurno; Yuyun; Hammam Riza; Meganingrum Arista Jiwanggi; Ryan Randy Suryono; Tosan Wiar Ramadhani; M Irfan Raif; Tri Nanda, 2023, "InaFoodSec - Dataset Sentimen Twitter 50K mengenai Layanan Publik pada Bidang Ketahanan Pangan", https://hdl.handle.net/20.500.12690/RIN/GL8QRF, RIN Dataverse, V1, UNF:6:nmDzt5e3OFYV1BeoTPQvNA== [fileUNF]
Dataset ini terdiri dari sekumpulan tweet berbahasa Indonesia yang membahas tentang katahanan pangan untuk biodiversitas. Tweet-tweet yang terhimpun diambil dalam rentang waktu mulai dari 01 Januari 2020 hingga 23 Februari 2023. Jumlah keseluruhan tweet mencapai 50.000 tanpa ada... |