Gratis
DESKRIPSI LAYANAN | Nama Kelompok Riset/Fungsi Kegiatan : Natural Language Processing/Pemrosesan Bahasa Alami Deskripsi Kegiatan Kelompok Riset/Fungsi Kegiatan : 1. PrediaBeat adalah sebuah proyek riset dan pengembangan sistem cerdas yang memadukan AI chatbot, nutritional…
- Pusat Riset Sains Data dan Informasi
- KST Cisitu (Samaun Samadikun)
Nama Kelompok Riset/Fungsi Kegiatan : Natural Language Processing/Pemrosesan Bahasa Alami
Deskripsi Kegiatan Kelompok Riset/Fungsi Kegiatan :
1. PrediaBeat adalah sebuah proyek riset dan pengembangan sistem cerdas yang memadukan AI chatbot, nutritional informatics, dan personalized recommendation systems untuk mendampingi individu dengan kondisi prediabetes. Sistem ini dirancang untuk memberikan rekomendasi makanan yang sesuai profil pengguna, memonitor pola makan, dan memberikan edukasi nutrisi secara adaptif. Dalam program MBKM ini, mahasiswa akan terjun langsung ke dalam kegiatan riset yang terdiri dari: mengolah data nutrisi, membangun model AI generatif dan prediktif, merancang alur percakapan, hingga mengembangkan prototipe chatbot yang dapat digunakan oleh masyarakat luas. Proyek ini merupakan bagian dari roadmap riset Food Computing for Health yang dikembangkan oleh BRIN.
2. Mengembangkan Mesin Penerjemah.
3. Melakukan kegiatan riset yang menyangkut pengolahan bahasa alami, yaitu masukan sistem berupa teks dan fitur multimodalitas yang relevan untuk klasifikasi dan AI generatif.
Tipe Magang : Magang Riset Tugas Akhir
Topik Kegiatan/Riset :
1. Pengembangan Prediabeat: Sistem Rekomendasi Personal Berbasis Chatbot sebagai Pendamping Nutrisi untuk Penderita Prediabetes. (Dr. Kokoy Siti Komariah, S.Kom., M.T., M.Eng./ kokoy.siti.komariah@brin.go.id)
2. (1.) Mengembangkan model mesin terjemahan, (2.) Mengembangkan model transkirpsi audio, dan (3.) Mengembangkan model Part of Speech (POS) tag untuk pemrosesan bahasa-bahasa dengan sumber daya terbatas. (Dr. Eng. Ir. Yuyun, MT./ yuyu010@brin.go.id)
3. Pengembangan Sistem Kustomisasi LLM untuk meningkatkan akurasi Whisper ASR. (Dr. Dipl.Ing (FH) Asril, M.Sc. / asri003@brin.go.id)
4. Large Language Models; Topik Riset: Pembangunan Framework RAG Berbasis Knowledge Graph untuk Tanya-Jawab Hukum Keamanan Laut di Indonesia. (Iftitahu Ni'mah, S.Kom., MIT/ ifti001@brin.go.id)
5. Kustomisasi Model Bahasa Besar (LLM) untuk Meningkatkan Kinerja Pengenalan Ucapan Otomatis (ASR) melalui Teknik-teknik Fusi pada ucapan Indonesia (Case spesifik, Domain spesifik, dan Bahasa Daerah) (Dr. Dipl.Ing (FH) Asril, M.Sc. / asri003@brin.go.id)
6. Pengembangan Retrieval Augmented Generation dengan fokus pada proses chunking, pemrosesan data tabel dan graf untuk chatbot medis. (Lyla Ruslana Aini, S.Kom./ lyla001@brin.go.id)
7. Pengembangan Chatbot berbasis LLMs untuk Konsultasi Kerjasama Penelitian Daerah (Dr. Nuryani, S.Kom., M.T./ nury012@brin.go.id)
8. Pengembangan Sistem Evaluasi dan Keamanan Chatbot AI untuk Kesehatan Mental Berbasis Agentic Framework (Iftitahu Ni'mah, S.Kom., MIT/ ifti001@brin.go.id)
9. Pengembangan Sistem Retrieval-Augmented Generation (RAG) dan Large Language Model (LLM) Berbasis Dokumen Hukum (Iftitahu Ni'mah, S.Kom., MIT/ ifti001@brin.go.id)
Ruang Lingkup Topik Kegiatan/Riset :
Topik 1.
1. Pengumpulan & Pengolahan Data Nutrisi
* Mengumpulkan data makanan Indonesia (nutrisi, komposisi, porsi, kategori).
* Menyusun database makanan sesuai kebutuhan LLM dan model rekomendasi.
* Pra-pemrosesan data: pembersihan, normalisasi, feature engineering dasar.
2. Pengembangan Sistem Rekomendasi
* Membangun model rekomendasi makanan berbasis: – Rule-based – Machine learning – LLM-assisted reasoning
* Pengujian akurasi dan relevansi rekomendasi untuk pengguna prediabetes.
3. Pengembangan Chatbot Cerdas PrediaBeat
* Mendesain alur percakapan (conversation flow) untuk edukasi nutrisi.
* Mengintegrasikan LLM (misalnya Ollama, GPT, atau local LLM lain) dengan sistem rekomendasi.
* Implementasi RAG (Retrieval-Augmented Generation) untuk memastikan chatbot memberikan jawaban berbasis data nutrisi yang benar.
4. Pengenalan Pola & Analitik Pengguna
* Mengembangkan model prediksi berbasis data perilaku pengguna (misal pola makan).
* Membuat mekanisme personalisasi profil risk level prediabetes.
5. Pengembangan UI/UX Prototipe PrediaBeat
* Merancang tampilan antarmuka untuk chatbot dan halaman rekomendasi.
* Membuat prototipe dengan framework pilihan (Streamlit, React, Flutter, dsb).
6. Dokumentasi Ilmiah
* Menyusun laporan penelitian, Karya Tulis Ilmiah, atau draft paper.
* Kontribusi terhadap publikasi ilmiah dan presentasi hasil riset.
Output yang Diharapkan
* Dataset makanan terstruktur dan terdokumentasi.
* Model rekomendasi makanan berbasis aturan, ML, atau hybrid.
* Chatbot PrediaBeat versi prototipe.
* Laporan penelitian / KTI.
* Kontribusi pada publikasi nasional/internasional (opsional).
Topik 2.
Melakukan anotasi dan Cleaning dataset, melakukan visualiasi , modeling data dan mengembangkan prototype
Topik 3.
(1) Studi tentang teknik fusi LLM dan ASR;
(2) Mengembangkan dataset ASR untuk eksperimentasi;
(3) Eksperimentasi teknik fusi LLM dan ASR;
(4) Penulisan Artikel Ilmiah untuk Publikasi Internasional
Topik 4.
Membangun kerangka sistem tanya jawab berbasis LLMs yang bersifat open source dan dapat dijelaskan secara objektif dan bertanggung jawab. Ruang Lingkup Topik Riset: (1) menyusun dan mengolah data tanya jawab berbasis dokumen hukum untuk evaluasi framework; (2) membangun framework RAG berbasis open source LLMs; (3) Evaluasi framework RAG berbasis open source LLMs.
Topik 5.
Pengembangan Inovasi AI untuk membantu Human Machine/Computer Interaction secara multi modal (teks dan ucapan) yang dapat diaplikasikan di berbagai aplikasi dari sektor industri dan layanan publik.
Topik 6.
Melakukan studi literatur mengenai teknik RAG terkini, evaluasi dan implementasinya dalam domain medis, melakukan premrosesan data RAG dan mengimplementasikan teknik-teknik yang dapat mengoptimalkan kinerja RAG untuk Chatbot Medis domain hemodialisa.
Topik 7.
1) studi literatur pengembangan chatbot berbasis LLMs, 2) pengembangan dataset, 3) pengembangan aplikasi chatbot berbasis LLM, 4) penulisan publikasi ilmiah
Topik 8.
Ruang Lingkup Topik Kegiatan/Riset:
- Studi literatur terkait penggunaan chatbot AI dalam domain kesehatan mental, termasuk aspek etika, keamanan, dan risiko penggunaan.
- Identifikasi potensi risiko pada chatbot kesehatan mental (misalnya misinformasi, respons tidak empatik, bias, dan saran berbahaya).
- Perancangan agentic framework untuk evaluasi respons chatbot kesehatan mental secara berlapis (multi-agent evaluation).
- Pengembangan metrik evaluasi khusus domain kesehatan mental, seperti empati, sensitivitas konteks, keamanan respons, dan kepatuhan terhadap pedoman kesehatan.
- Implementasi modul guardrails untuk mencegah respons yang berpotensi membahayakan pengguna (misalnya terkait krisis psikologis atau self-harm).
- Pengembangan evaluation agent berbasis AI-as-a-judge untuk menilai kualitas dan keamanan respons chatbot.
- Simulasi skenario interaksi pengguna dalam konteks kesehatan mental untuk menguji ketahanan dan keamanan chatbot.
- Integrasi sistem evaluasi dan keamanan ke dalam pipeline chatbot secara real-time.
- Evaluasi kinerja sistem dalam meningkatkan kualitas respons, keamanan, dan keandalan chatbot kesehatan mental.
- Analisis aspek etika, privasi, dan batasan penggunaan AI dalam konteks kesehatan mental.
Topik 9.
Ruang Lingkup Topik Kegiatan/Riset:
- Pengumpulan dan kurasi dokumen hukum (peraturan perundang-undangan, putusan pengadilan, kontrak, dan dokumen legal lainnya).
- Pra-pemrosesan teks dokumen hukum, termasuk ekstraksi, pembersihan, segmentasi, dan anotasi metadata.
- Perancangan dan implementasi sistem retrieval berbasis vektor (vector database) untuk pencarian dokumen yang relevan.
- Pengembangan arsitektur Retrieval-Augmented Generation (RAG) untuk meningkatkan kualitas jawaban berbasis konteks dokumen hukum.
- Integrasi Large Language Model (LLM) untuk tugas tanya jawab (question answering) dan analisis teks hukum.
- Evaluasi kinerja sistem dalam menjawab pertanyaan berbasis dokumen hukum, termasuk pengujian akurasi, relevansi, dan kemampuan reasoning.
- Pengembangan skenario penggunaan seperti pencarian pasal, analisis kasus hukum, dan sistem asistensi hukum berbasis AI.
- Analisis tantangan dan keterbatasan dalam penerapan LLM pada domain hukum, termasuk aspek interpretasi, bias, dan keandalan.
Program Studi/Jurusan Pendidikan :
Topik 1 : S1 / D4 Teknik Informatika, Ilmu Komputer, Sains Data, Sistem Informasi
Topik 2 : S1 / D4 Teknik Informatika, Ilmu Komputer, Kecerdasan Buatan, Sistem Informasi, Rekayasa Perangkat Lunak (RPL), Data Science,
Topik 3 : S1 / D4 Teknik/Ilmu Komputer, Informatika, Sistem Informasi, Data Science, Kecerdasan Artifisial/Buatan
Topik 4 : S1 / D4 Teknik Informatika, Teknik Komputer
Topik 5 : S1 / D4 Teknik/Ilmu Informatika, Kecerdasan Buatan atau Kecerdasan Artifisial, Teknik Komputer, Data Science, Sistem Informasi
Topik 6 : S1 / D4 Informatika, Komputer, Kecerdasan Artificial, Data Science
Topik 7 : S1 / D4 Teknik Informatika, Ilmu Komputer
Topik 8 : S1 / D4 Teknik Informatika/Teknik Komputer/Sistem Informasi/Teknologi Informasi/Data Science/Artificial Intelligence/Natural Language Processing
Topik 9 : S1 / D4 Teknik Informatika/Teknik Komputer/Sistem Informasi/Teknologi Informasi/Data Science/Artificial Intelligence/Natural Language Processing
Kuota Pembimbing S1/D4 :
Topik 1, 3, 5, 6, 7, 8, 9 : 2 Orang/Topik
Topik 2 : 3 Orang
Topik 4 : 1 Orang
Lokasi Magang BRIN :
Topik 1, 2, 4, 7, 8, 9 : KST Cisitu (Samaun Samadikun)
Topik 3, 5 : KST Cibinong (Soekarno)
Topik 6 : KST Serpong (Bacharuddin Jusuf Habibie)
Syarat Pengajuan:
Deskripsi Kegiatan Kelompok Riset/Fungsi Kegiatan :
1. PrediaBeat adalah sebuah proyek riset dan pengembangan sistem cerdas yang memadukan AI chatbot, nutritional informatics, dan personalized recommendation systems untuk mendampingi individu dengan kondisi prediabetes. Sistem ini dirancang untuk memberikan rekomendasi makanan yang sesuai profil pengguna, memonitor pola makan, dan memberikan edukasi nutrisi secara adaptif. Dalam program MBKM ini, mahasiswa akan terjun langsung ke dalam kegiatan riset yang terdiri dari: mengolah data nutrisi, membangun model AI generatif dan prediktif, merancang alur percakapan, hingga mengembangkan prototipe chatbot yang dapat digunakan oleh masyarakat luas. Proyek ini merupakan bagian dari roadmap riset Food Computing for Health yang dikembangkan oleh BRIN.
2. Mengembangkan Mesin Penerjemah.
3. Melakukan kegiatan riset yang menyangkut pengolahan bahasa alami, yaitu masukan sistem berupa teks dan fitur multimodalitas yang relevan untuk klasifikasi dan AI generatif.
Tipe Magang : Magang Riset Tugas Akhir
Topik Kegiatan/Riset :
1. Pengembangan Prediabeat: Sistem Rekomendasi Personal Berbasis Chatbot sebagai Pendamping Nutrisi untuk Penderita Prediabetes. (Dr. Kokoy Siti Komariah, S.Kom., M.T., M.Eng./ kokoy.siti.komariah@brin.go.id)
2. (1.) Mengembangkan model mesin terjemahan, (2.) Mengembangkan model transkirpsi audio, dan (3.) Mengembangkan model Part of Speech (POS) tag untuk pemrosesan bahasa-bahasa dengan sumber daya terbatas. (Dr. Eng. Ir. Yuyun, MT./ yuyu010@brin.go.id)
3. Pengembangan Sistem Kustomisasi LLM untuk meningkatkan akurasi Whisper ASR. (Dr. Dipl.Ing (FH) Asril, M.Sc. / asri003@brin.go.id)
4. Large Language Models; Topik Riset: Pembangunan Framework RAG Berbasis Knowledge Graph untuk Tanya-Jawab Hukum Keamanan Laut di Indonesia. (Iftitahu Ni'mah, S.Kom., MIT/ ifti001@brin.go.id)
5. Kustomisasi Model Bahasa Besar (LLM) untuk Meningkatkan Kinerja Pengenalan Ucapan Otomatis (ASR) melalui Teknik-teknik Fusi pada ucapan Indonesia (Case spesifik, Domain spesifik, dan Bahasa Daerah) (Dr. Dipl.Ing (FH) Asril, M.Sc. / asri003@brin.go.id)
6. Pengembangan Retrieval Augmented Generation dengan fokus pada proses chunking, pemrosesan data tabel dan graf untuk chatbot medis. (Lyla Ruslana Aini, S.Kom./ lyla001@brin.go.id)
7. Pengembangan Chatbot berbasis LLMs untuk Konsultasi Kerjasama Penelitian Daerah (Dr. Nuryani, S.Kom., M.T./ nury012@brin.go.id)
8. Pengembangan Sistem Evaluasi dan Keamanan Chatbot AI untuk Kesehatan Mental Berbasis Agentic Framework (Iftitahu Ni'mah, S.Kom., MIT/ ifti001@brin.go.id)
9. Pengembangan Sistem Retrieval-Augmented Generation (RAG) dan Large Language Model (LLM) Berbasis Dokumen Hukum (Iftitahu Ni'mah, S.Kom., MIT/ ifti001@brin.go.id)
Ruang Lingkup Topik Kegiatan/Riset :
Topik 1.
1. Pengumpulan & Pengolahan Data Nutrisi
* Mengumpulkan data makanan Indonesia (nutrisi, komposisi, porsi, kategori).
* Menyusun database makanan sesuai kebutuhan LLM dan model rekomendasi.
* Pra-pemrosesan data: pembersihan, normalisasi, feature engineering dasar.
2. Pengembangan Sistem Rekomendasi
* Membangun model rekomendasi makanan berbasis: – Rule-based – Machine learning – LLM-assisted reasoning
* Pengujian akurasi dan relevansi rekomendasi untuk pengguna prediabetes.
3. Pengembangan Chatbot Cerdas PrediaBeat
* Mendesain alur percakapan (conversation flow) untuk edukasi nutrisi.
* Mengintegrasikan LLM (misalnya Ollama, GPT, atau local LLM lain) dengan sistem rekomendasi.
* Implementasi RAG (Retrieval-Augmented Generation) untuk memastikan chatbot memberikan jawaban berbasis data nutrisi yang benar.
4. Pengenalan Pola & Analitik Pengguna
* Mengembangkan model prediksi berbasis data perilaku pengguna (misal pola makan).
* Membuat mekanisme personalisasi profil risk level prediabetes.
5. Pengembangan UI/UX Prototipe PrediaBeat
* Merancang tampilan antarmuka untuk chatbot dan halaman rekomendasi.
* Membuat prototipe dengan framework pilihan (Streamlit, React, Flutter, dsb).
6. Dokumentasi Ilmiah
* Menyusun laporan penelitian, Karya Tulis Ilmiah, atau draft paper.
* Kontribusi terhadap publikasi ilmiah dan presentasi hasil riset.
Output yang Diharapkan
* Dataset makanan terstruktur dan terdokumentasi.
* Model rekomendasi makanan berbasis aturan, ML, atau hybrid.
* Chatbot PrediaBeat versi prototipe.
* Laporan penelitian / KTI.
* Kontribusi pada publikasi nasional/internasional (opsional).
Topik 2.
Melakukan anotasi dan Cleaning dataset, melakukan visualiasi , modeling data dan mengembangkan prototype
Topik 3.
(1) Studi tentang teknik fusi LLM dan ASR;
(2) Mengembangkan dataset ASR untuk eksperimentasi;
(3) Eksperimentasi teknik fusi LLM dan ASR;
(4) Penulisan Artikel Ilmiah untuk Publikasi Internasional
Topik 4.
Membangun kerangka sistem tanya jawab berbasis LLMs yang bersifat open source dan dapat dijelaskan secara objektif dan bertanggung jawab. Ruang Lingkup Topik Riset: (1) menyusun dan mengolah data tanya jawab berbasis dokumen hukum untuk evaluasi framework; (2) membangun framework RAG berbasis open source LLMs; (3) Evaluasi framework RAG berbasis open source LLMs.
Topik 5.
Pengembangan Inovasi AI untuk membantu Human Machine/Computer Interaction secara multi modal (teks dan ucapan) yang dapat diaplikasikan di berbagai aplikasi dari sektor industri dan layanan publik.
Topik 6.
Melakukan studi literatur mengenai teknik RAG terkini, evaluasi dan implementasinya dalam domain medis, melakukan premrosesan data RAG dan mengimplementasikan teknik-teknik yang dapat mengoptimalkan kinerja RAG untuk Chatbot Medis domain hemodialisa.
Topik 7.
1) studi literatur pengembangan chatbot berbasis LLMs, 2) pengembangan dataset, 3) pengembangan aplikasi chatbot berbasis LLM, 4) penulisan publikasi ilmiah
Topik 8.
Ruang Lingkup Topik Kegiatan/Riset:
- Studi literatur terkait penggunaan chatbot AI dalam domain kesehatan mental, termasuk aspek etika, keamanan, dan risiko penggunaan.
- Identifikasi potensi risiko pada chatbot kesehatan mental (misalnya misinformasi, respons tidak empatik, bias, dan saran berbahaya).
- Perancangan agentic framework untuk evaluasi respons chatbot kesehatan mental secara berlapis (multi-agent evaluation).
- Pengembangan metrik evaluasi khusus domain kesehatan mental, seperti empati, sensitivitas konteks, keamanan respons, dan kepatuhan terhadap pedoman kesehatan.
- Implementasi modul guardrails untuk mencegah respons yang berpotensi membahayakan pengguna (misalnya terkait krisis psikologis atau self-harm).
- Pengembangan evaluation agent berbasis AI-as-a-judge untuk menilai kualitas dan keamanan respons chatbot.
- Simulasi skenario interaksi pengguna dalam konteks kesehatan mental untuk menguji ketahanan dan keamanan chatbot.
- Integrasi sistem evaluasi dan keamanan ke dalam pipeline chatbot secara real-time.
- Evaluasi kinerja sistem dalam meningkatkan kualitas respons, keamanan, dan keandalan chatbot kesehatan mental.
- Analisis aspek etika, privasi, dan batasan penggunaan AI dalam konteks kesehatan mental.
Topik 9.
Ruang Lingkup Topik Kegiatan/Riset:
- Pengumpulan dan kurasi dokumen hukum (peraturan perundang-undangan, putusan pengadilan, kontrak, dan dokumen legal lainnya).
- Pra-pemrosesan teks dokumen hukum, termasuk ekstraksi, pembersihan, segmentasi, dan anotasi metadata.
- Perancangan dan implementasi sistem retrieval berbasis vektor (vector database) untuk pencarian dokumen yang relevan.
- Pengembangan arsitektur Retrieval-Augmented Generation (RAG) untuk meningkatkan kualitas jawaban berbasis konteks dokumen hukum.
- Integrasi Large Language Model (LLM) untuk tugas tanya jawab (question answering) dan analisis teks hukum.
- Evaluasi kinerja sistem dalam menjawab pertanyaan berbasis dokumen hukum, termasuk pengujian akurasi, relevansi, dan kemampuan reasoning.
- Pengembangan skenario penggunaan seperti pencarian pasal, analisis kasus hukum, dan sistem asistensi hukum berbasis AI.
- Analisis tantangan dan keterbatasan dalam penerapan LLM pada domain hukum, termasuk aspek interpretasi, bias, dan keandalan.
Program Studi/Jurusan Pendidikan :
Topik 1 : S1 / D4 Teknik Informatika, Ilmu Komputer, Sains Data, Sistem Informasi
Topik 2 : S1 / D4 Teknik Informatika, Ilmu Komputer, Kecerdasan Buatan, Sistem Informasi, Rekayasa Perangkat Lunak (RPL), Data Science,
Topik 3 : S1 / D4 Teknik/Ilmu Komputer, Informatika, Sistem Informasi, Data Science, Kecerdasan Artifisial/Buatan
Topik 4 : S1 / D4 Teknik Informatika, Teknik Komputer
Topik 5 : S1 / D4 Teknik/Ilmu Informatika, Kecerdasan Buatan atau Kecerdasan Artifisial, Teknik Komputer, Data Science, Sistem Informasi
Topik 6 : S1 / D4 Informatika, Komputer, Kecerdasan Artificial, Data Science
Topik 7 : S1 / D4 Teknik Informatika, Ilmu Komputer
Topik 8 : S1 / D4 Teknik Informatika/Teknik Komputer/Sistem Informasi/Teknologi Informasi/Data Science/Artificial Intelligence/Natural Language Processing
Topik 9 : S1 / D4 Teknik Informatika/Teknik Komputer/Sistem Informasi/Teknologi Informasi/Data Science/Artificial Intelligence/Natural Language Processing
Kuota Pembimbing S1/D4 :
Topik 1, 3, 5, 6, 7, 8, 9 : 2 Orang/Topik
Topik 2 : 3 Orang
Topik 4 : 1 Orang
Lokasi Magang BRIN :
Topik 1, 2, 4, 7, 8, 9 : KST Cisitu (Samaun Samadikun)
Topik 3, 5 : KST Cibinong (Soekarno)
Topik 6 : KST Serpong (Bacharuddin Jusuf Habibie)
Syarat Pengajuan:
- File Data Foto
- File Data Transkrip
- File Proposal
- Daftar Riwayat Hidup
- Surat Pengantar
- Surat Pernyataan
- File Dukung Lainnya






![MBKM - Riset Ekotoksikologi [Biosensor] - KST Cibinong](https://elsatur.brin.go.id/public/uploads/layanan_file/8968/gambar_layanan_16620.jpg)
![MBKM - Riset Ekotoksikologi [Biosensor] - KST Cibinong](https://elsatur.brin.go.id/public/uploads/layanan_file/8968/gambar_layanan_16621.jpg)
![Magang/PraktekKerja/Riset-[Remediasi Pencemaran] -KST Samaun Samadikun-Bandung](https://elsatur.brin.go.id/public/uploads/layanan_file/7570/gambar_layanan_13316.jpg)
![Magang/PraktekKerja/Riset-[Remediasi Pencemaran] -KST Samaun Samadikun-Bandung](https://elsatur.brin.go.id/public/uploads/layanan_file/7570/gambar_layanan_13317.jpg)







