1 to 10 of 4,693 Results
Oct 16, 2024 - Pengolahan Bahasa Alami (Natural Language Processing)
Kokoy Siti Komariah; Yuyun; Mohammad Teduh Uliniansyah; Dian Isnaeni Nurul Afra; Yaniasih; Radhiyatul Fajri; Siska Pebiana; Nasrullah; Najirah Umar; Abdul Latief Arda; Abdul Jalil; Muhammad Risal; Sitti Zuhriyah; A. Edeth Fuari Anatasya; M. Adnan Nur; Billy Eden William Asrul; Mirfan; Pujianti Wahyuningsih; Supriadi, 2024, "IndoCia 6K - Dataset Korpus Paralel Bahasa Indonesia dan Bahasa Cia-Cia", https://hdl.handle.net/20.500.12690/RIN/6ZSBOQ, RIN Dataverse, V1
Dataset korpus paralel ini berisi pasangan kalimat bahasa Indonesia dan bahasa Cia-Cia |
Plain Text - 380.5 KB -
MD5: f76cb9bdcb5eb7b33a8dca4f1b2bd1ea
Dataset kalimat paralel bahasa Indonesia dan bahasa Cia-cia |
Oct 16, 2024 - Pengolahan Bahasa Alami (Natural Language Processing)
Nurul Afra, Dian Isnaeni, 2024, "IndoMakassar 9K - Dataset Kalimat Paralel Bahasa Indonesia dan Bahasa Makassar", https://hdl.handle.net/20.500.12690/RIN/AZNE1K, RIN Dataverse, V1, UNF:6:g3ESYip/qdf9lxTGCgxM+w== [fileUNF]
Dataset ini merupakan kumpulan kalimat paralel bahasa Indonesia dan bahasa Makassar sejumlah 9.165 pasang kalimat. Dataset ini bisa digunakan untuk riset-riset terkait pengolahan data bahasa Makassar seperti mesin penerjemah, analisis sentimen, pemodelan topik, dll. |
Unknown - 278.9 KB -
MD5: 954c5dfe89e025075d2d9ee97706340f
Kalimat bahasa Indonesia (format Moses) |
video/x-matroska - 272.1 KB -
MD5: effe8a6b737dbf86171cc1e9f07a065e
Kalimat bahasa Makassar (format Moses) |
Tabular Data - 648.7 KB - 3 Variables, 9165 Observations - UNF:6:g3ESYip/qdf9lxTGCgxM+w==
Kalimat paralel bahasa Makassar dan bahasa Indonesia (format .xlsx) |
Oct 16, 2024 - Dataset Berita Palsu Bahasa Indonesia Dengan Penelusuran Fakta Berbasis LLM
Wijayanti, Rini, 2024, "Dataset Berita Palsu Bahasa Indonesia Dengan Penelusuran Fakta Berbasis LLM", https://hdl.handle.net/20.500.12690/RIN/7QBRKQ, RIN Dataverse, V1, UNF:6:+NmomlH9kcsIcrgWTddlAg== [fileUNF]
Dataset ini berisi kumpulan berita palsu (hoax) dan berita valid (real) dalam bahasa Indonesia. Data dikumpulkan dari situs pelaporan hoaks serta portal berita online Indonesia. Judul berita dari portal online diparafrase agar memiliki karakteristik serupa dengan klaim pada data... |
Tabular Data - 2.7 MB - 14 Variables, 506 Observations - UNF:6:HtgNTRjC1OKxv2fd9UL7GQ==
|
Tabular Data - 37.6 MB - 13 Variables, 6241 Observations - UNF:6:Lq7dMvzGqEOY0TmdN/0ILg==
|
Oct 12, 2024 - Pengolahan Bahasa Alami (Natural Language Processing)
Yuyun; Gusnawaty; Uliniansyah, Mohammad Teduh; Gunarso; Latief, Andi Djalal; Sampurno, Tri; Afra, Dian Isnaeni Nurul; Nurfadhilah, Elvira; Hidayati, Nuraisa Novia; Pebiana, Siska; Pammuda; Kaharuddin, Mutahharah Nemin; Rosvita, Ita; Jufri, Nurfaedah; Zahrani; Munawirah; Hazriani, 2024, "InaBugi10K - Dataset Korpus Paralel Bahasa Indonesia - Bahasa Bugis", https://hdl.handle.net/20.500.12690/RIN/WQPYWJ, RIN Dataverse, V1, UNF:6:7jOVv766bHItHIJcvhFnSg== [fileUNF]
Dataset ini berisi kumpulan kalimat paralel bahasa Indonesia dan bahasa Bugis sejumlah 10.296 kalimat. Dataset ini dapat digunakan untuk riset-riset dalam bidang pemrosesan bahasa alami (natural language processing; NLP). Dataset ini telah diuji melalui pengembangan model mesin p... |