
Buku ini berisikan materi tentang konsep data multivariat yang mana banyak ditemui dalam banyak kasus yang melibatkan ilmu statistika. Bahasan dalam buku ini ditekankan pada penggunaan perangkat lunak The Unscrambler X untuk membantu dalam analisis data multivariat. Materi yang disajikan dalam buku ini adalah analisis data dengan metode principal component analysis untuk klasifikasi atau mendeteksi pencilan, analisis regresi dengan metode principal component regression dan partial least square regression. Contoh kasus yang disajikan adalah data spektrum yang dihasilkan dari instrument FTNIR serta metode pengukuran laboratorium standar untuk validasinya. Metode regresi non-linier seperti support vector regression dan metode klasifikasi lain seperti least square discriminant analysis akan dibahas di volume buku selanjutnya.
Tentang Penulis

Dr. Ing. Agus Arip Munawar, S.TP., M.Sc.
Website: http://fsd.unsyiah.ac.id/aamunawar/
Email: aamunawar@unsyiah.ac.id
Order Buku
Bab 1 PENDAHULUAN
Secara sederhana, analisa multivariat (MVA) merupakan seperangkat teknik dan metode statistik yang digunakan untuk analisis data yang berisi lebih dari satu variabel dan melibatkan banyak varian dalam waktu yang bersamaan. Metode MVA banyak diterapkan terutama untuk menangani data dengan ukuran matriks yang besar. Dalam MVA, kita dapat menemukan hubungan antar variabel, variasi bersama dan hubungan internal lainnya dalam matriks data. Sebagai contoh, menentukan hubungan regresi antara satu atau lebih variabel terikat (Y) dengan variabel bebas (X) yang banyak. Beberapa metode dalam analisa multivariat yang sering dilakukan misalnya adalah metode Principal Component Analysis (PCA) yang dapat mengekstrak data, membuat klasifikasi berdasarkan kesamaan atau ketidaksamaan antar sampel.
Selain itu, metode lain seperti principal component regression (PCR), multiple linear regression (MLR) atau partial least square regression (PLSR) juga banyak ditemui dalam penggunaan metode MVA untuk memecahkan masalah regresi dan korelasi [4], [5]. Ketiga metode regresi ini akan dibahas lebih detail pada Bab regresi. Dalam analisa data multivariat ataupun analisa statistik lainnya, kita biasanya dibantu dengan keberadaan perangkat lunak untuk analisa statistik seperti Minitab, Matlab, SPSS, SAS, Statistica, SigmaStat, CAMO The Unscrambler ataupun perangkat lunak lainnya yang secara spesifik diperuntukan menangani data multivariat. Namun demikian, pada buku ini, akan lebih ditekankan pada analisa MVA dengan menggunakan perangkat lunak CAMO The Unscrambler X.
Bab 2 MEMULAI PROJEK
Ketika pertama kali dijalankan, tampilan antarmuka The Unscrambler terlihat seperti pada Gambar 1. Untuk autentikasi, kita dapat melakukan konfigurasi dan pengaturan ketika awal perangkat lunak ini dijalankan. Namun jika tidak, kita dapat mengosongkan ini dan langsung lanjut ke menu utama dari Unscrambler X dengan menekan Login. Perangkat lunak The Unscrambler secara fitur lebih diperuntukan untuk menangani data spektrum yang dihasilkan dari instrument seperti near infrared reflectance spectroscopy (NIRS), laser spectroscopy, magnetic resonance, Fourier transform NIRS, dan instrument spectroscopy lainnya.
Bahasan lanjut pada buku ini akan dijelaskan beberapa metode umum dan paling sering diterapkan untuk analisa data spectroscopy yang digunakan untuk prediksi dan klasifikasi. Teori singkat akan dijelaskan untuk setiap metode analisa data yang digunakan. Selain itu, prosedur analisa data serta interpretasi grafik hasil dari analisa tersebut juga akan dijelaskan secara komprehensif. Contoh data yang akan dianalisa dalam buku ini secara keseluruhan merupakan data spektrum yang dihasilkan dari penelitian-penelitian yang telah kami lakukan berkaitan dengan penerapan atau aplikasi dari teknologi spectroscopy.
Bab 3 DATA DAN TRANSFORMASI
Pada bagian ini, akan dijelaskan mengenai langkah awal dalam analisa data multivariat untuk menghasilkan model prediksi ataupun klasifikasi berdasarkan data spectroscopy. Namun demikian, langkah-langkah ini juga dapat diberlakukan pada data lain yang memang bersifat multivariat. Sebelum masuk pada langkah analisa data multivariat dengan The Unscrambler X, ada baiknya kami mulai dengan contoh kasus yang akan kita gunakan. Kita akan mengambil data spektrum dari buah mangga sebagai contoh data yang akan kita analisa sampai menghasilkan model.
Kita mulai bahasan ini dengan penyajian data dari hasil penelitian berupa aplikasi teknologi NIRS untuk prediksi kadar padatan terlarut (SSC), vitamin C dan total acidity (TA) dari buah mangga [6]. Secara singkat, Teknologi NIRS merupakan teknik atau metode yang menggunakan radiasi sinar inframerah dekat (near infrared) untuk menganalisa komposisi kimia dari bahan organik tanpa pengujian prosedur laboratorium yang rumit dan memakan banyak waktu. Informasi kandungan kimia ini didapatkan berdasarkan reaksi dari bahan biologik setelah diberi radiasi sinar NIR. Sinar inframerah dekat berada pada kisaran panjang gelombang 780 nm sampai 2500 nm.
Bab 4 PRINCIPAL COMPONENT ANALYSIS
Principal component analysis atau disingkat PCA adalah metode pemodelan bilinear yang memberikan gambaran umum tentang informasi utama yang terkandung dalam tabel multidimensi. PCA juga dikenal sebagai metode proyeksi, karena mengambil informasi yang dibawa oleh variabel asli dan memproyeksikannya ke sejumlah kecil variabel laten yang disebut Principal Component (PC). Setiap PC menjelaskan keseluruhan informasi yang terkandung dalam data asli (explained variace) dan PC pertama berisi sumber informasi terbesar dalam kumpulan data. Setiap PC berikutnya memuat, secara berurutan dan lebih sedikit informasi daripada yang sebelumnya. Dengan analisis PCA, sampel penting dan variabel terkait, dapat diungkapkan pengelompokan sampel tertentu, apakah itu berdasarkan persamaan atau perbedaan yang ada pada sampel-sampel tersebut.
Metode PCA memerlukan pemahaman yang kuat karena merupakan metode yang sangat berguna dalam penggunaannya, tetapi juga, PCA merupakan dasar dari banyak metode lain yang digunakan dalam The Unscrambler X termasuk Principal Component Regression (PCR), Partial Least Squares (PLS) regression, dan Multivariate Curve Resolution (MCR). Dalam klasifikasinya, informasi baru dapat diproyeksikan ke model PCA tunggal menggunakan metode proyeksi, atau ke beberapa model secara bersamaan dengan menggunakan metode klasifikasi yang dikenal sebagai Soft Independent Modeling of Class Analogy (SIMCA).
Bab 5 PRINCIPAL COMPONENT REGRESSION
Principal Component Regression (PCR) merupakan suatu metode regresi untuk menghubungkan variasi dalam variabel respons (variabel-Y) dengan variasi beberapa prediktor (variabel-X), dengan tujuan penjelas atau prediksi. PCR adalah prosedur dua langkah yang pertama menguraikan X-matrix oleh metode PCA, kemudian menggabungkannya dengan model berbasis metode multiple linear regression (MLR) dengan menggunakan skor PC, bukan variabel X asli sebagai prediktornya. Sebelum membaca bagian ini lebih lanjut, pembaca disarankan untuk memahami prinsip umum dari regresi dan metode Principal Component Analysis (PCA) yang telah diulas lebih detail di bagian sebelumnya.
Pada data matriks yang telah kita miliki sebelumnya, metode PCR dapat diakses pada menu Task, Analyze, Principal Component Regression. Lalu akan muncul dialog Box dari menu utama PCR seperti terlihat pada gambar di bawah ini. Pada tab Input Model, pertama-tama pilih X-matrix yang akan dianalisis dalam bingkai Predictors. Pilih rentang baris dan kolom yang telah ditentukan sebelumnya di kotak Rows dan Cols, atau klik tombol Define untuk melakukan pemilihan secara manual dalam dialog Define Range.
PCR adalah teknik analisis regresi multivariat, oleh karena itu dalam The Unscrambler diperlukan minimal tiga sampel (baris) dan dua variabel (kolom) untuk hadir dalam kumpulan data, untuk menyelesaikan perhitungan.
BAB 6 PARTIAL LEAST SQUARE REGRESSION
Selain metode PCR, salah satu metode regresi lain yang umum digunakan dalam analisa data multivariat adalah metode partial least square (PLS) regression. Sebagian kuadrat atau proyeksi pada struktur model laten kedua X-dan Y-matriks secara simultan digunakan untuk menemukan variabel laten di X yang terbaik agar dapat memprediksi variabel laten di Y. Komponen PLS ini mirip dengan komponen utama (PC) di metode PCR, tetapi mereka disebut sebagai faktor. PLS memaksimalkan kovarians antara X dan Y.
Parsial least squares regression kadangkala disebut sebagai proyeksi pada struktur laten atau hanya PLS, dimana model ini digunakan untuk menemukan variabel laten atau tersembunyi di X yang akan memprediksi variabel laten di Y. Komponen PLS ini mirip dengan komponen utama akan tetapi, disebut sebagai faktor.
Hal yang diperlu dingat disini ialah model yang bagus akan dihasilkan dari data yang bagus. Jika data X atau Y tidak mewakili dari kondisi yang akan datang atau data tersebut dikumpulkan di bawah kondisi yang buruk, maka hasil dari model PLSR mungkin tidak berguna. Seperti PCA dan PCR, hasil regresi PLS memberikan output grafis yang sama dan diagnostik, namun dalam kasus PLSR, beberapa alat diagnostik tersedia yang lebih menarik dan kuat. Berikut ini ringkasan mengenai alat tersebut.