Tag

, , ,

Sore ini rencananya mau mulai ngerjain TA, tapi dah bosen, jadilah menulis blog hahaha :D. Disini saya mau berbagi soal TA saya “Text Summarization”. Kebetulan untuk text summarization ada banyak tool yang bebas di-download, modul-modul pada umumnya yang dibutuhkan itu untuk aplikasi natural language processing antara lain:

1. POS tagger, contohnya: Brill Tagger. Part-of-speech (POS) tagger bertujuan untuk memberi jabatan (POS) aturan grammar pada string/kata. Kalau dalam bahasa Inggris mis.:Noun Phrase, Verb Phrase, Preposition, Adj. dll.

2. Parser, contohnya: Collin parser, Charniak parser dll. Parser bertujuan untuk membangun parse tree yaitu bentuk tree dari suatu string/kalimat. Kalau pernah tahu CFG, akarnya itu simbol terminal (LHS) sedangkan anak-anaknya simbol non-terminal (RHS). Node-node yang membentuk pohon berupa POS, sedangkan daunnya itu kata-kata.

3. Natural language generator, contohnya: Nitrogen, Carmel, Tiburon dll (www.isi.edu. Tool ini berguna untuk mereduksi tree sehingga memudahkan untuk komputasi, disediakan pula penghitung skornya untuk PCFG, word bigram dll yang biasanya didapat dari hasil training.

Saya sangat bersyukur karena ternyata di luar sana banyak orang-orang pintar yang telah membuatkan tool untuk keperluan TA saya hahaha :D. Tadinya dah mikir kayaknya ga mungkin bisa dikerjain kalau semua modulnya bikin dari awal. Saya sangat berharap kalau topik NLP menjadi interest di kalangan mahasiswa Informatika, soalnya sampai saat ini topik TA yang bertajuk NLP masih merupakan hal yang jarang. Padahal NLP itu menarik banget (promosi :p), selama ini orang-orang pintar di luar udah banyak yang bikin aplikasi NLP sesuai dengan bahasa native mereka (Spanyol, Prancis, Cina, Jepang, Inggris) tapi dari Indonesia belum ada sama sekali. Walaupun TA saya sendiri masih pake bhs. Inggris sih :p. Tapi moga-moga ada yang tertarik untuk mengembangkan TA saya untuk bahasa Indonesia. Menurut saya prospek NLP sangat menjanjikan, banyak kebutuhan manusia di bidang teknologi informasi yang bisa diakomodasi oleh aplikasi NLP. Misalnya summarization untuk suatu text book, atau artikel berita online. Orang kan males tuh kalau harus baca dulu semuanya, dengan summarization diharapkan informasi yang diberikan representatif dan mewakili dokumen aslinya. Jadi, tertarik dengan NLP?:p

Iklan