Sharing TA ah…

Sore ini rencananya mau mulai ngerjain TA, tapi dah bosen, jadilah menulis blog hahaha :D. Disini saya mau berbagi soal TA saya “Text Summarization”. Kebetulan untuk text summarization ada banyak tool yang bebas di-download, modul-modul pada umumnya yang dibutuhkan itu untuk aplikasi natural language processing antara lain:

1. POS tagger, contohnya: Brill Tagger. Part-of-speech (POS) tagger bertujuan untuk memberi jabatan (POS) aturan grammar pada string/kata. Kalau dalam bahasa Inggris mis.:Noun Phrase, Verb Phrase, Preposition, Adj. dll.

2. Parser, contohnya: Collin parser, Charniak parser dll. Parser bertujuan untuk membangun parse tree yaitu bentuk tree dari suatu string/kalimat. Kalau pernah tahu CFG, akarnya itu simbol terminal (LHS) sedangkan anak-anaknya simbol non-terminal (RHS). Node-node yang membentuk pohon berupa POS, sedangkan daunnya itu kata-kata.

3. Natural language generator, contohnya: Nitrogen, Carmel, Tiburon dll (www.isi.edu. Tool ini berguna untuk mereduksi tree sehingga memudahkan untuk komputasi, disediakan pula penghitung skornya untuk PCFG, word bigram dll yang biasanya didapat dari hasil training.

Saya sangat bersyukur karena ternyata di luar sana banyak orang-orang pintar yang telah membuatkan tool untuk keperluan TA saya hahaha :D. Tadinya dah mikir kayaknya ga mungkin bisa dikerjain kalau semua modulnya bikin dari awal. Saya sangat berharap kalau topik NLP menjadi interest di kalangan mahasiswa Informatika, soalnya sampai saat ini topik TA yang bertajuk NLP masih merupakan hal yang jarang. Padahal NLP itu menarik banget (promosi :p), selama ini orang-orang pintar di luar udah banyak yang bikin aplikasi NLP sesuai dengan bahasa native mereka (Spanyol, Prancis, Cina, Jepang, Inggris) tapi dari Indonesia belum ada sama sekali. Walaupun TA saya sendiri masih pake bhs. Inggris sih :p. Tapi moga-moga ada yang tertarik untuk mengembangkan TA saya untuk bahasa Indonesia. Menurut saya prospek NLP sangat menjanjikan, banyak kebutuhan manusia di bidang teknologi informasi yang bisa diakomodasi oleh aplikasi NLP. Misalnya summarization untuk suatu text book, atau artikel berita online. Orang kan males tuh kalau harus baca dulu semuanya, dengan summarization diharapkan informasi yang diberikan representatif dan mewakili dokumen aslinya. Jadi, tertarik dengan NLP?:p

Musibah di pagi hari

Pagi-pagi langsung dapet musibah, hape kecopetan!! Ya Allah, banyak dosa kali ya ampe dikasih cobaan gitu….(ampuni dosa-dosaku ya Allah). Tapi moga2 dikasih penggantinya yang lebih baik…amiinn dan orang yang nyopet dapet balesan dari Allah…amiinn.

Ceritanya tadi di angkot ada 1 orang yang agak mencurigakan di depan, tapi berhubung waspada mode lagi off ya jadi gw menganggap tuh orang emang aneh aja, jadi tas di pangkuan gw luput dari pandangan, kayaknya orang sebelah gw (dengan penampilan mahasiswa) yg nyopet terus orang yg depan pengalih perhatian, tampaknya modus copet yang belum gw waspadai (soalnya selama ini dah beberapa kali lolos dari aksi pencopetan :p).

Moga-moga hal ini jadi pelajaran berharga buat yang lain, selalu waspada no matter when and what.

Pagi dunia…

Mumpung masih pagi nulis blog ah……

Akhirnya….presentasi proposal juga….di tengah-tengah aktivitas yang hectic dan tidak ada hentinya, akhirnya Allah memberi jalan untuk proposal TA :D.

Saya sekarang kebetulan lagi dapet kerjaan dan salah satu modulnya itu masang Googlemap di website client. Pertama sih agak serem, tapi pas nyoba2 eh ternyata lumayan mudah tinggal memanfaatkan fasilitas dari API nya Googlemap aja. Terus selain itu disuruh pake Joomla-wah denger namanya aja baru 2 kali :p- sejenis CMS. Ternyata skill kita itu bakal lebih banyak diasah di dunia luar, selama ini saya bagaikan katak dalam tempurung (he he…) hanya mengenal mata kuliah IF yang memang cuma dasarnya aja dan selebihnya kita belajar sendiri. Hal ini baru dirasakan sekarang-sekarang dimana saat kita tahu lebih banyak justru makin sedikit yang kita tahu. Yah self-learning adalah satu2nya tool untuk mengasah skill kita baik interpersonal maupun teknis. Tapi jangan berkecil hati karena dunia ini adalah life university, jangan pernah berhenti belajar sampai ke liang kubur (iih serem amat…). Keep up your spirit!! Dah ah nulisnya mau mulai ngerjain tugas (lagi) -_-!

Bukan keledai

Setelah melalui 2 minggu yang santai dan tenang, kita langsung dihadapkan pada yg namanya UTS. Rencananya sih 1 minggu sebelum masuk belajar buat nyiapin UTS, tapi ternyata kenyataan berkata lain, lagi-lagi kita dihadapkan dengan yang namanya ‘godaan’. Ternyata ramadhan sebulan kemaren kurang menggembleng ha ha ha…, dampak ramadhan seolah hilang begitu nyentuh lebaran. Kita disuguhi hidangan dan kue yang enak2, belum lagi dapet amplop dari ortu plus paman atau uwa. Euforia lebaran ternyata berlarut-larut hingga hari Minggu kemarin H-1 UTS dan parahnya belum belajar sama skali….T_T. Akhirnya….mengulang kesalahan yg sama yah manusia memang bukan keledai. Ternyata melawan hawa nafsu itu suesahnya minta ampyun, adakah diantara pembaca yg berhasil?Bagi tipsnya ya…

Menjelang lebaran

4 hari lagi lebaran, ga kerasa banget waktu tuh cepet bgt berlalu. Beda ama temen2 yg lain yg pd mudik, sy sih lebaran di rumah aja. Gmn ama persiapan lebaran? Dah mulai nyiapin baju lebaran ama belanja kue buat lebaran ntar? Atau masih ribet ama mudik, boro2 ngurusin baju baru oleh2 titipan org sekampung aja blm dibeli >_<  he he. Sy sih malah nyantai, palingan agak sibuk soalnya pembantu mudik. Pengalaman puasa tahun ini…..mm nothing special hiks…banyak target yg gak kecapai, knp ya?padahal kan sayang bgt kesempatan baik setahun sekali kyk bulan Ramadhan dilewatkan dgn biasa aja. Tapi yah lagi2 keterbatasan sy sbg manusia (pembenaran :p), moga2 Allah masih melihat niat & usaha (walau gak seberapa he he). Moga2 temen2 yg lain masih lebih beruntung dr saya, suatu kenikmatan klo kita masih dikasih kesempatan buat menjalani Ramadhan di tahun ini atau tahun berikutnya.

“The Secret”

“From a thought become something”

Ada yang dah pernah denger atau baca “The Secret”?Klo blm coba baca deh, buku ini inspiring banget. Awalnya tau buku ini dari adikku yg abis nonton Oprah, katanya buku ini dah ngubah hidup banyak orang. Karena penasaran ya udah deh beli trus baru baca separonya, en bener bgt ni buku emang inspiring dan ngasih cara pandang baru ttg hidup dan semesta. Katanya org2 besar seperti Socrates, Einstein bahkan Jack Canfield tau soal The Secret ini dan mereka menerapkan The Secret pd hidup mereka.

Sedikit cerita aja soal buku ini, katanya di alam semesta ini ada hukum yang kuat dan pasti yaitu The Law of Attraction (hukum tarik-menarik), cara kerja hukum ini pasti seperti halnya hukum gravitasi. Katanya pula manusia adalah pemancar sinyal terkuat di alam, manusia memberikan sinyal frekuensi dari pikiran mereka dan alam semesta akan menangkap frekuensi itu dan memberikan respon berupa frekuensi yang sama. Kekuatan terbesar di alam adalah pikiran (pd awalnya sih sy nyangka ini cuma sugesti), hal ini sudah terbukti melalui penelitian fisika kuantum (di buku ini banyak bgt para ahli dari berbagai bidang yang berbicara). Begini contoh aplikasi The Secret: Jika kita berpikir mengenai hal2 baik dan positif maka hal2 itu yang akan datang pada kita, dan sebaliknya. Ketika berpikir jangan menggunakan kata negasi seperti tidak, jangan, tidak mau dsb. karena semesta hanya akan merespon pada kata yang menjadi fokus pikiran misalnya “saya tidak mau terlambat” maka semesta hanya akan merespon “saya terlambat” dan malah memberikan kejadian/hal2 yg membuat kita makin terlambat. Selain pikiran yg baik diperlukan jg perasaan yg baik, hal terakhir yaitu menerima-yaitu anggaplah diri kita sudah menerima hal tsb dgn kata lain use your imagination. Gunakan visualisasi bahwa kita sedang menerima hal yg kita pikirkan, dan gunakan dimensi waktu saat ini jangan masa depan. Kita tidak perlu memikirkan bagaimana semesta bekerja, namun pikirkan saja hasil akhirnya. Katanya pula mintalah pada semesta dan jangan khawatir kamu akan kehabisan (dengan kata lain berdo’alah maka Allah akan menjawab do’amu ^^).

The Secret ini bisa diaplikasikan ke semua aspek kehidupan: keuangan, kesehatan, hubungan relasi.  Ada juga contoh cerita sukses orang2 yang telah menerapkan The Secret ini. Lebih detilnya silahkan baca bukunya atau kunjungi sitenya (saya jg dah nyoba dikit en berhasil loh :p). Selamat membaca!

Nganggur

Karena lagi ga ada kerjaan sambil nunggu kuliah, jadinya nulis di blog deh. Mau ngerjain TA, haduh lagi-lagi berat banget, apalagi sebelumnya draft proposal dah dibikin, tapi ternyata nasib berkata lain, pembimbing utamaku Pak Widi tiba-tiba nyuruh eksplor metode lain (yah pak knp gak dr kemaren2 pas saya usulin topik T_T) terpaksa deh mulai dari nol lagi. Tapi mood ga boleh turun, tetep smangat!!

Mau tau soal Text Summarization?

Text summarization adalah salah satu cabang dari information extraction, metode ini meringkas dokumen teks digital secara otomatis. Metode ini merupakan cara efektif untuk mendapat informasi dari data digital yang dewasa ini semakin membludak. Pasti kita malas klo harus baca keseluruhan dokumen untuk mendapat ide utama dari dokumen itu. Semua pekerjaan yang monoton itu akan dilakukan oleh text summarizer dan hasilnya hanya setengah atau sepertiga dari dokumen aslinya (ada juga yg berupa keyword). Ada 2 pendekatan dalam text summarization ini, NLP (Natural Language Processing) dan IR (Information Retrieval), sebagian besar digunakan IR karena kecepatan komputasinya dibandingkan NLP, lagipula perkembangan NLP belum begitu pesat dan signifikan. IR lebih banyak menggunakan statistik sedangkan NLP menggunakan analisis semantik. Ada 2 cara dalam meringkas yaitu abstraction dan extraction, abstraction dilakukan oleh manusia untuk menggabungkan konsep, mis. apel, jeruk, mangga, jambu ->buah-buahan, sedangkan extraction hanya mereduksi jumlah kata mis. hanya mengambil kata yang penting saja. Saat ini lebih banyak dilakukan extraction karena kemudahannya dibandingkan abstraction (biasanya menggunakan WordNet).

Di Indonesia sendiri topik ini belum mendapat perhatian, sedangkan di Amerika topik ini sudah mulai ramai jadi bahan penelitian sejak tahun 50-an. Contoh aplikasinya sudah bervariasi dari single-document sampai multi-document, domain-independent sampai domain-dependent, dan sudah pula yang dapat diterapkan pada multi-language document contohnya SUMMARIST. Saat ini topik ini masih jadi bahan penelitian dan akan terus-menerus mengalami perbaikan, antara lain dengan menggabungkan beberapa metode IR dan NLP juga machine learning.

Saya pikir topik ini menarik dan mungkin bisa menjadi inspirasi bagi para pembaca. Saya sendiri mengambil topik ini untuk Tugas Akhir dan saya mengambil pendekatan IR dengan metode sentence compression, yaitu mereduksi panjang kalimat.

Hello world!

Blog ku di wordpress.com :p