Sitemap

A list of all the posts and pages found on the site. For you robots out there is an XML version available for digesting as well.

Pages

About me

Posts

portfolio

SkinGorithm: know what you need!

Published:

SkinGorithm is an application that helps users in their skincare journey. With this app users can understand more about the skincare function, pros, and cons based on the ingredients, providing a facial skin reviewer that allows user to know their facial condition, alarm feature to remind the users of their skincare daily usage, and the most important thing they can see their progress in their skincare journey!

All About Einstein: An LLM-Powered Exploration of Albert Einstein

Published:

All About Einstein is a question-answering application focused on Albert Einstein. Utilizing the knowledge base extracted from the Britannica Albert Einstein encyclopedia, this project employs and the FLAN-T5 LLM model from Hugging Face. The user-friendly interface, designed using Streamlit, and the application’s pipeline is constructed using the Langchain framework, enabling users to pose a wide range of questions related to Albert Einstein’s life and work.

PDFs to Bot: Empowering Chatbots with Custom PDFs Knowledge Using LLM

Published:

PDFs to Bot is a chatbot question answering application designed to empower users with customized knowledge extracted from uploaded PDF documents. Leveraging the capabilities of free embedding and the LLM from Hugging Face, specifically the instructor text embeddings and the FLAN-T5 LLM model. The user-friendly interface is built using Streamlit, ensuring a seamless and intuitive experience. Powered by the Langchain framework, PDFs to Bot delivers tailored responses and enhances document accessibility, making it a versatile tool for various knowledge-driven applications.

publications

Penerapan Analisis Korespondensi Untuk Memetakan Provinsi-Provinsi di Indonesia Berdasarkan Jumlah Tenaga Kesehatan

Published in Seminar Nasional Statistika X, 2021

Abstract
Tenaga kesehatan memiliki peran penting dalam pemenuhan hak asasi manusia, yang sebagaimana dijelaskan berdasarkan UU No. 36 Tahun 2014 Tentang Tenaga Kesehatan bahwa pemerintah wajib untuk melakukan perencanaan, pengadaan serta pendayagunaan tenaga kesehatan di Indonesia. Hal ini dinilai tidak merata bahkan hingga ke pelosok Negeri. Peneliti ingin melihat sebaran mengenai jumlah fasilitas tenaga kesehatan berdasarkan provinsi di Indonesia. Data yang digunakan peneliti adalah data sekunder yang diolah oleh Sekretariat Badan Pengembangan dan Pemberdayaan Sumber Daya Manusia Kesehatan yang bersumber dari Kemenkes RI pada Tahun 2021. Metode analisis yang digunakan merupakan analisis korespondensi untuk eksplorasi data dari sebuah tabel kontingensi yang bertujuan untuk melihat ada tidaknya hubungan antara variabel secara visual, dan digunakan untuk melihat kedekatan suatu kategori pada satu peubah terhadap kategori peubah lainnya. Sebelum dilakukannya analisis data, terlebih dahulu dilakukannya uji independensi yang menyatakan hasil bahwa terdapat hubungan antara jumlah tenaga kesehatan dengan tiap-tiap Provinsi di Indonesia. Analisis data yang digunakan adalah analisis statistika deskriptif, analisis profil baris dan kolom, analisis nilai proporsi inersia baris dan kolom, serta grafik korespondensi. Nilai inersia yang didapatkan pada dimensi dua adalah 0.77 dan berdasarkan grafik korespondensi bidan merupakan jumlah tenaga kesehatan yang paling banyak tersebar di sebagian besar Provinsi di Indonesia, dan jumlah tenaga kesehatan yang paling sedikit tersebar di sebagian besar provinsi di Indonesia adalah dokter gigi.

Analisis Klaster Hirarki untuk Mengelompokan Provinsi di Indonesia berdasarkan Indikator Kesejahteraan Rakyat

Published in Seminar Nasional Statistika X, 2021

Abstract
Indonesia adalah salah satu negara berkembang dengan tingkat keberagaman yang tinggi. Keberagaman antar provinsi di Indonesia menyebabkan tingkat kesejahteraan yang berbeda-beda dan tidak merata. Hal inilah yang menjadi masalah yang sangat serius karena pemerintah tidak mampu mengklasifikasikan permasalahan yang ada untuk kesejahteraan yang lebih merata. Dampak yang disebabkan ialah kebijakan pemerintah yang sering salah sasaran dalam membantu masyarakat. Penelitian ini bertujuan untuk mengelompokan provinsi di Indonesia menggunakan Analisis Klaster Hirarki berdasarkan indikator kesejahteraan rakyat, yaitu persentase penduduk yang memiliki jaminan kesehatan, status kepemilikan bangunan tempat tinggal yang ditempati, sumber air utama yang digunakan rumah tangga, sumber penerangan utama, bahan bakar utama yang digunakan untuk memasak, serta memiliki komputer ditempat tinggal masing-masing. Penelitian ini menggunakan data sekunder berupa data cross section 34 Provinsi di Indonesia pada tahun 2019. Hasil dari penelitian ini menunjukan bahwa metode cluster centroid merupakan metode yang terbaik dengan nilai korelasi cophenetic sebesar 0.9094806. Metode cluster hirarki centroid menghasilkan 6 kelompok, yaitu kelompok dengan tingkat kesejahteraan rakyat tinggi sebanyak 1 provinsi dan kelompok dengan tingkat kesejahteraan rakyat rendah sebanyak 5 provinsi.

Pemetaan Kabupaten/ Kota di Jawa Barat Berdasarkan Jenis Usaha Pertanian Menggunakan Analisis Korespondensi

Published in Seminar Nasional Statistika X, 2021

Abstract
Sektor pertanian merupakan salah satu sektor utama yang berperan sangat penting pada perekonomian nasional. Jenis usaha pertanian merupakan salah satu bagian dari sektor pertanian yang cukup signifikan berpengaruh terhadap ekonomi daerah tersebut, kembali lagi tergantung bagaimana cara daerah itu dapat memberdayakan jenis usaha pertanian tersebut. Hal ini menarik peneliti dimana kami ingin melihat sebaran jenis usaha pertanian berdasarkan kota/kabupaten di Provinsi Jawa Barat. Data yang digunakan dalam penelitian kali ini merupakan data sekunder yang didapat dari Survei Pertanian Antar Sensus tahun 2018. Dengan mengaplikasikan analisis korespondensi, dapat dieksplorasi data jenis usaha pertanian dan dilihat ada tidaknya hubungan antar variabel secara visual (peta presepsi), juga dapat digunakan untuk melihat kedekatan (kemiripan) suatu vaiabel dengan variabel lainnya. Sebelum dilakukan analisis korespondensi pada data, terlebih dahulu dilakukan uji chi-square untuk melihat independensi antar variabel, dari uji chi-square menyatakan bahwa terdapat hubungan yang signifikan dari variabel jenis usaha pertanian dan kabupaten/kota di Provinsi Jawa Barat. Berdasarkan hasil analisis korespondensi pada data Jumlah Jenis Usaha Pertanian di Provinsi Jawa Barat dihasilkan nilai inersia untuk pemetaan menggunakan dua dimensi sebesar 71%, dan untuk nilai inersia pada pemetaan menggunakan tiga dimensi sebesar 81%. Didapatkan juga dari hasil analisis korespondensi, jika ditinjau dari variabel jenis usaha pertanian terbagi menjadi enam kelompok berdasarkan kedekatan jaraknya, sedangkan jika ditinjau dari variabel kota/kabupaten di Provinsi Jawa Barat terbagi menjadi empat kelompok berdasarkan kedekatan jaraknya. Dari penelitian ini dapat dimanfaatkan untuk dilakukan pengawasan dan pemberdayaan terhadap jenis usaha pertanian dari berbagai kota/kabupaten, sehingga pemerintah dapat mengendalikan jenis usaha pertanian tersebut agar tetap bertahan, dan bisa menjadi senjata ekonomi yang menguntungkan bagi daerah tersebut, selain itu pemerintah juga dapat menyesuaikan perumusan kebijakan serta tindakan -tindakan berdasarkan jenis unggulan pada kota/kabupaten tersebut.

Aplikasi ARCH/GARCH dalam Prediksi Harga Saham PT Kimia Farma (Persero) Tbk

Published in Seminar Nasional Statistika X, 2021

Abstract
ARIMA merupakan salah satu metode dalam melakukan peramalan pada data yang berbentuk time series. Namun, adanya pelanggaran asumsi pada pemodelan ARIMA membuat pemodelan atau peramalan tersebut tidak lagi valid, misalnya saja pada pelanggaran terkait heteroskedastisitas. Maka, untuk memodelkan volatilitas dari data tersebut diperlukan adanya pemodelan menggunakan ARCHGARCH agar pelanggaran asumsi heteroskedastisitas pada ARIMA tidak menjadi penghalang untuk tetap melanjutkan analisis. Data terkait saham PT. Kimia Farma Tbk. yang diambil pada periode Juli 2016 hingga Juni 2021, akan dijadikan sebagai media dalam pengaplikasian metode ARCH-GARCH dalam kasus saham. Hasil penelitian menunjukkan bahwa setelah didapatkan model ARIMA yang cocok, maka didapatkan residual yang selanjutnya akan diuji heteroskedastisitasnya dengan menggunakan uji Lagrange Multiplier (LM). Diperoleh hasil bahwa model ARCH (0,1) merupakan model yang tepat untuk meramalkan data historis saham PT. Kimia Farma Tbk. Menggunakan model ARCH (0,1) akan dilakukan peramalan hingga akhir tahun, yakni bulan Juli – Desember 2021. Sehingga bisa memberikan gambaran serta informasi terkait kondisi saham PT. Kimia Farma Tbk. yang membantu para calon investor.

Perbandingan Algoritma Naïve Bayes, K-NN, dan SVM dalam Pengklasifikasian Sentimen Media Sosial

Published in Seminar Nasional Statistika X, 2021

Abstract
Berdasarkan data yang didapat dari wearesosial.com pengguna media sosial di dunia pada Januari 2021 mencapai 4.1 miliar jiwa, angka ini bertumbuh sebesar 13.2% dibandingkan periode yang sama pada tahun sebelumnya. Menurut kementriean informasi dan teknologi, setiap harinya masyarakat Indonesia menghabiskan setidaknya 3.5 jam untuk berselancar di media sosial. Revolusi Industri 4.0 memaksa semua kegiatan terdigitalisasi, media sosial juga merupakan bentuk digitalisasi dari interaksi sosial manusia. Perkembangan teknologi berefek kepada maraknya kemunculan media sosial baru, hal ini menarik perhatian peneliti dimana kami ingin membantu pengguna media sosial untuk mengklasifikasi apakah media sosial tersebut cenderung positif atau negatif berdasarkan sentiment ulasan aplikasi tersebut, oleh karenanya analisis sentimen kami lakukan guna mengetahui kecenderungan tanggapan masyarakat terhadap aplikasi-aplikasi media sosial. Metode yang digunakan dalam penelitian ini adalah algoritma Naïve Bayes Classifier, K-Nearest Neighbor dan Support Vector Machine. Algoritma ini dapat mengklasifikasikan data atau kalimat sehingga menjadi suatu informasi. Data yang digunakan sebanyak 2000 data didapat dengan teknik web scrapping ulasan sepuluh aplikasi media sosial paling populer di dunia dari Google Playstore. Dari penelitian ini diketahui bahwa algoritma Naïve Bayes Classifier memiliki nilai akurasi lebih tinggi sebesar 79.8% dibandingkan algoritma K-Nearest Neighbor sebesar 50.23% dan Support Vector Machine sebesar 75.29%, sehingga algoritma Naïve Bayes Classifier lebih tepat digunakan untuk mengklasifikasi ulasan aplikasi media sosial.

A Comparison of Support Vector Machine and Naïve Bayes Classifier in Binary Sentiment Reviews for PeduliLindungi Application

Published in IEEE, 2022

Abstract
COVID-19 statistics in Indonesia show more than 4.2 million active confirmed cases with more than 140 thousand deaths. The Indonesian government has made several policies to reduce the number of COVID-19 cases, one of them is by implementing the PeduliLindungi application. The government has socialized and recommended this application as an effort to fulfill the tracking, tracing, and fencing program. Various kinds of responses appear in the community to this application, therefore sentiment analysis is needed to find out public trends so that the government can evaluate the policies that have been made. This study aims to determine the best model from the comparison of the Naïve Bayes algorithm and the Support Vector Machine, besides that this study will also see whether a simpler model such as Naive Bayes is still good in handling binary sentiment for PeduliLindungi data reviews. The data was obtained by web scraping from the PeduliLindungi application review on the Google Play Store. The Naïve Bayes accuracy value is 81%, smaller than the Support Vector Machine which has an accuracy of 84%, although the Support Vector Machine is the best model we have, Naive Bayes itself can still be used to handle binary sentiment data because the difference in accuracy values is not too far.

Lung and Infection CT-Scan-Based Segmentation with 3D UNet Architecture and Its Modification

Published in MDPI Healthcare, 2023

Abstract
COVID-19 is the disease that has spread over the world since December 2019. This disease has a negative impact on individuals, governments, and even the global economy, which has caused the WHO to declare COVID-19 as a PHEIC (Public Health Emergency of International Concern). Until now, there has been no medicine that can completely cure COVID-19. Therefore, to prevent the spread and reduce the negative impact of COVID-19, an accurate and fast test is needed. The use of chest radiography imaging technology, such as CXR and CT-scan, plays a significant role in the diagnosis of COVID-19. In this study, CT-scan segmentation will be carried out using the 3D version of the most recommended segmentation algorithm for bio-medical images, namely 3D UNet, and three other architectures from the 3D UNet modifications, namely 3D ResUNet, 3D VGGUNet, and 3D DenseUNet. These four architectures will be used in two cases of segmentation: binary-class segmentation, where each architecture will segment the lung area from a CT scan; and multi-class segmentation, where each architecture will segment the lung and infection area from a CT scan. Before entering the model, the dataset is preprocessed first by applying a minmax scaler to scale the pixel value to a range of zero to one, and the CLAHE method is also applied to eliminate intensity in homogeneity and noise from the data. Of the four models tested in this study, surprisingly, the original 3D UNet produced the most satisfactory results compared to the other three architectures, although it requires more iterations to obtain the maximum results. For the binary-class segmentation case, 3D UNet produced IoU scores, Dice scores, and accuracy of 94.32%, 97.05%, and 99.37%, respectively. For the case of multi-class segmentation, 3D UNet produced IoU scores, Dice scores, and accuracy of 81.58%, 88.61%, and 98.78%, respectively. The use of 3D segmentation architecture will be very helpful for medical personnel because, apart from helping the process of diagnosing someone with COVID-19, they can also find out the severity of the disease through 3D infection projections.

Enhancing 3D Lung Infection Segmentation with 2D U-Shaped Deep Learning Variants

Published in MDPI Applied Sciences, 2023

Abstract
Accurate lung segmentation plays a vital role in generating 3D projections of lung infections, which contribute to the diagnosis and treatment planning of various lung diseases, including cases like COVID-19. This study capitalizes on the capabilities of deep learning techniques to reconstruct 3D lung projections from CT-scans. In this pursuit, we employ well-established 2D architectural frameworks like UNet, LinkNet, Attention UNet, UNet 3+, and TransUNet. The dataset used comprises 20 3D CT-scans from COVID-19 patients, resulting in over 2900 raw 2D slices. Following preprocessing, the dataset is refined to encompass 2560 2D slices tailored for modeling. Preprocessing procedures involve mask refinement, image resizing, contrast limited adaptive histogram equalization (CLAHE), and image augmentation to enhance the data quality and diversity. Evaluation metrics, including Intersection over Union (IoU) and dice scores, are used to assess the models’ performance. Among the models tested, Attention UNet stands out, demonstrating the highest performance. Its key trait of harnessing attention mechanisms enhances its ability to focus on crucial features. This translates to exceptional results, with an IoU score of 85.36% and dice score of 91.49%. These findings provide valuable insights into guiding the selection of an appropriate architecture tailored to specific requirements, considering factors such as segmentation accuracy and computational resources, in the context of 3D lung projection reconstruction.

talks

teaching

Database Teaching Assistant

Undergraduate course, Universitas Padjadjaran, Statistics Department, 2021

In the 2020/2021 academic year, I served as ateaching assistant for a Database practicum class tailored to freshman statistics students. Guiding these budding statisticians, I facilitated interactive sessions to explore the intricacies of database management. Through hands-on exercises, I empowered them to apply database principles to real-world statistical analysis. This experience ignited their passion for data-driven insights and equipped them with valuable technical skills for their academic and professional journeys.

Multivariate Data Analysis 1 Teaching Assistant

Undergraduate course, Universitas Padjadjaran, Statistics Department, 2021

In the 2021/2022 academic year, I served as a teaching assistant for the Multivariate Data Analysis 1 practicum class, designed to guide sophomore statistics students in unlocking insights from complex datasets. Through interactive sessions and hands-on exercises, I facilitated their exploration of techniques like PCA and cluster analysis, fostering both technical proficiency and critical thinking skills. My role aimed to empower students with the ability to navigate intricate data landscapes and glean meaningful patterns from multidimensional datasets.

Computer Programming Teaching Assistant

Undergraduate course, Universitas Padjadjaran, Statistics Department, 2021

In the 2021/2022 academic year, I served as a teaching assistant for the programming class. Through interactive sessions and practical exercises, I guided freshman students in demystifying programming concepts and honing their skills in Python coding. My role aimed to empower students to leverage programming as a tool to enhance their statistical analysis capabilities, bridging theory with real-world application.