Skip to main content
Pengolahan Bahasa Alami (Natural Language Processing) (Pusat Riset Sains Data dan Informasi - BRIN)
Featured Dataverses

In order to use this feature you must have at least one published dataverse.

Publish Dataverse

Are you sure you want to publish your dataverse? Once you do so it must remain published.

Publish Dataverse

This dataverse cannot be published because the dataverse it is in has not been published.

Delete Dataverse

Are you sure you want to delete your dataverse? You cannot undelete this dataverse.

Advanced Search

11 to 20 of 27 Results
Oct 12, 2024
Yuyun; Gusnawaty; Uliniansyah, Mohammad Teduh; Gunarso; Latief, Andi Djalal; Sampurno, Tri; Afra, Dian Isnaeni Nurul; Nurfadhilah, Elvira; Hidayati, Nuraisa Novia; Pebiana, Siska; Pammuda; Kaharuddin, Mutahharah Nemin; Rosvita, Ita; Jufri, Nurfaedah; Zahrani; Munawirah; Hazriani, 2024, "InaBugi10K - Dataset Korpus Paralel Bahasa Indonesia - Bahasa Bugis", https://hdl.handle.net/20.500.12690/RIN/WQPYWJ, RIN Dataverse, V1, UNF:6:7jOVv766bHItHIJcvhFnSg== [fileUNF]
Dataset ini berisi kumpulan kalimat paralel bahasa Indonesia dan bahasa Bugis sejumlah 10.296 kalimat. Dataset ini dapat digunakan untuk riset-riset dalam bidang pemrosesan bahasa alami (natural language processing; NLP). Dataset ini telah diuji melalui pengembangan model mesin p...
Tabular Data - 607.9 KB - 2 Variables, 10296 Observations - UNF:6:7jOVv766bHItHIJcvhFnSg==
Oct 12, 2024 - PosTagBugis3K
Yuyun, 2024, "PosTagBugis3K - Dataset PoS Kalimat Bahasa Bugis", https://hdl.handle.net/20.500.12690/RIN/I9CHQS, RIN Dataverse, V2
Dataset ini berisi 3.714 kalimat bahasa Bugis yang setiap katanya sudah dilabeli dengan tag jenis kata. Total jumlah kata adalah 16.713 kata. Dataset ini sangat bermanfaat untuk riset-riset pengolahan bahasa alami (natural language processing; NLP), dan dapat digunakan untuk peng...
Plain Text - 167.1 KB - MD5: 81fe5c4f520270ad14b04ef637946465
PosTagBugis3K(PRSDI BRIN)
Oct 12, 2024
Dataset ini berisi 3.714 kalimat yang setiap katanya sudah dilengkapi dengan label jenis kata (part-of-speech). Jumlah total kata adalah .713 kata. Dataset ini bermanfaat untuk digunakan sebagai bahan riset berbagai proyek dalam bidang pemrosesan bahasa alami (natural language pr...
Sep 25, 2024
Jarin, Asril; Santosa, Agung; Yaniasih, 2024, "IndoGIS-Commands2JSON: Dataset Perintah Bahasa Indonesia ke Struktur JSON untuk API GIS", https://hdl.handle.net/20.500.12690/RIN/93IVOU, RIN Dataverse, V1
Dataset IndoGIS-Commands2JSON adalah data sintetis yang bersifat "dummy" yang dikoleksikan dengan bantuan ChatGPT dan dirancang untuk melatih dan menguji model bahasa besar (LLM) dalam mengonversi perintah alami dalam Bahasa Indonesia ke dalam struktur JSON yang dapat digunakan o...
Unknown - 259.7 KB - MD5: e7892ceeb30eb4bce593307e1038393e
File IndoGIS_Commands2JSON.jsonl berisi 1,041 pasangan perintah dalam Bahasa Indonesia dan struktur JSON yang sesuai untuk operasi API GIS. Dataset ini mencakup 104 kategori perintah GIS dan disusun dalam format JSON Lines (JSONL), ideal untuk melatih model AI dalam pemetaan peri...
Oct 10, 2023
Hidayati, Nuraisa Novia; Riza, Hammam; Gunarso; Mohammad Teduh Uliniansyah; Agung Santosa; Asril; Elvira Nurfadhilah; Radhiyatul Fajri; Andi Djalal Latief; Dian Isnaeni Nurul Afra; Siska Pebiana; Harnum Annisa Prafitia; Junanto Prihantoro; Lyla Ruslana Aini; Yosi Sahreza; Gembong Satrio Wibowanto; Josua Geovani Pinem; Aulia Haritsuddin Karisma Muhammad Subekti; Muhammad Reza Alfin; Agung Septiadi; Siti Shaleha; Jemie Muliadi, 2023, "Dataset Sentimen dari Twitter Mengenai Ibu Kota Negara (IKN)", https://hdl.handle.net/20.500.12690/RIN/AXNT6M, RIN Dataverse, V1, UNF:6:eGsuLpL92MGaNdXRLoQamQ== [fileUNF]
Dataset ini merupakan kumpulan tweet berbahasa Indonesia mengenai IKN. Tweet yang dikumpulkan adalah dalam periode waktu 1 maret 2022 hingga 17 maret 2022. Jumlah total tweet adalah 12.520 tanpa ada duplikat konten, yang telah dilabeli dengan tiga kelas sentimen yaitu positif, ne...
Tabular Data - 326.5 KB - 2 Variables, 2504 Observations - UNF:6:X1Cq98J59dvTTlz8bfiewg==
data development
Tabular Data - 330.1 KB - 2 Variables, 2504 Observations - UNF:6:puRI4QhZ5q8vn2vgXUAIJg==
data testing
Add Data

Sign up or log in to create a dataverse or add a dataset.

Share Dataverse

Share this dataverse on your favorite social media networks.

Link Dataverse
Reset Modifications

Are you sure you want to reset the selected metadata fields? If you do this, any customizations (hidden, required, optional) you have done will no longer appear.

Contact RIN Dataverse Support

RIN Dataverse Support

Please fill this out to prove you are not a robot.

+ =