Sharing TA ah…

Sore ini rencananya mau mulai ngerjain TA, tapi dah bosen, jadilah menulis blog hahaha😀. Disini saya mau berbagi soal TA saya “Text Summarization”. Kebetulan untuk text summarization ada banyak tool yang bebas di-download, modul-modul pada umumnya yang dibutuhkan itu untuk aplikasi natural language processing antara lain:

1. POS tagger, contohnya: Brill Tagger. Part-of-speech (POS) tagger bertujuan untuk memberi jabatan (POS) aturan grammar pada string/kata. Kalau dalam bahasa Inggris mis.:Noun Phrase, Verb Phrase, Preposition, Adj. dll.

2. Parser, contohnya: Collin parser, Charniak parser dll. Parser bertujuan untuk membangun parse tree yaitu bentuk tree dari suatu string/kalimat. Kalau pernah tahu CFG, akarnya itu simbol terminal (LHS) sedangkan anak-anaknya simbol non-terminal (RHS). Node-node yang membentuk pohon berupa POS, sedangkan daunnya itu kata-kata.

3. Natural language generator, contohnya: Nitrogen, Carmel, Tiburon dll (www.isi.edu. Tool ini berguna untuk mereduksi tree sehingga memudahkan untuk komputasi, disediakan pula penghitung skornya untuk PCFG, word bigram dll yang biasanya didapat dari hasil training.

Saya sangat bersyukur karena ternyata di luar sana banyak orang-orang pintar yang telah membuatkan tool untuk keperluan TA saya hahaha😀. Tadinya dah mikir kayaknya ga mungkin bisa dikerjain kalau semua modulnya bikin dari awal. Saya sangat berharap kalau topik NLP menjadi interest di kalangan mahasiswa Informatika, soalnya sampai saat ini topik TA yang bertajuk NLP masih merupakan hal yang jarang. Padahal NLP itu menarik banget (promosi :p), selama ini orang-orang pintar di luar udah banyak yang bikin aplikasi NLP sesuai dengan bahasa native mereka (Spanyol, Prancis, Cina, Jepang, Inggris) tapi dari Indonesia belum ada sama sekali. Walaupun TA saya sendiri masih pake bhs. Inggris sih :p. Tapi moga-moga ada yang tertarik untuk mengembangkan TA saya untuk bahasa Indonesia. Menurut saya prospek NLP sangat menjanjikan, banyak kebutuhan manusia di bidang teknologi informasi yang bisa diakomodasi oleh aplikasi NLP. Misalnya summarization untuk suatu text book, atau artikel berita online. Orang kan males tuh kalau harus baca dulu semuanya, dengan summarization diharapkan informasi yang diberikan representatif dan mewakili dokumen aslinya. Jadi, tertarik dengan NLP?:p

8 Komentar

Filed under Pengalaman

8 responses to “Sharing TA ah…

  1. ray0fsunshine

    allow mbak mia,
    sy trtarik dg NLP, sebenernya sih karena skripsi sy ada nyangkutnya dg NLP, he2…
    aduuh panjang ceritanya…
    pokoknya butuh pengetahuan tentang POS bahasa indonesia, sy dpt penelitian BPPT tentang POS Bhs Indonesia
    tapi yaa dokumentasinya gak lengkap soalnya udah jadul bgt…
    punya referensi lain gak mbak???
    trus gini
    untuk buat POS yg kita butuhin adalah (bener gak mbak??) :
    1. kamus elektronik bahasa indonesia
    2. himpunan tag-set bahasa indonesia
    untuk kamus elektronik ada yg namanya KEBI (punya BPPT) url : nlp.aia.bppt.go.id/kebi/ (udah ilang).
    trus himpunan tag-set bahasa indonesia ada dari
    Technical Report Indonesian Basic Dictionary CICC (saya googling gak dapet2)
    gimana??

    trimakasih atas bantuannya

    best regards

  2. miakamayani

    @rafOfsunshine: buat POS Indonesia itu setau saya blm ada yg bikin, tapi klo mau berarti harus bikin sendiri utk label POS tag nya bisa liat di aturan tata bhs indo. Utk bikin POS Indonesia betul yg dibutuhin itu kamus ama himpunan tag set. Berhubung TA saya NLP di bhs Inggris saya blm eksplor NLP utk bhs Indo. Maaf gak bisa bantu banyak. :p

  3. mita

    ass.. teh ini mita if 05..
    hehe pingin merespons promosi teteh😀
    insya ALLAH .. TA sy berjudul parser bahasa indonesia
    yup…biar sy yang mulai perkembangan buat NLP bahasa kita…
    hehehe

    ntar boleh minta bantuanny yak…..

  4. miakamayani

    @mita: wah welcome to the club :D….insya Allah saya bantu sebisanya silahkan loh..:)

  5. hartono

    kk, saya lagi tertarik buat TA juga tentang text summarizing gitu… Boleh minta referensinya gak? Saya cari2 di internet, malah bikin bingung… Mohon bantuannya kk…

    • miakamayani

      @hartono: wah wah manggilnya kk,,jd serasa tua hihi. Saya pake metode ‘sentence compression’, coba aja cari pake keyword itu. Pendekatannya saya pake Noisy-Channel Model

  6. hartono

    wahhhh… makasih neh atas bantuan petunjuknya… setidaknya sekarang ada pencerahan neh… o iya, boleh minta email ato ym gak??? biar gampang komunikasinya… kalo boleh, kirim ke alamat email saya aja ya…

  7. Makasih atas sharingx, slam knal mbk mia🙂

Tinggalkan Balasan

Isikan data di bawah atau klik salah satu ikon untuk log in:

Logo WordPress.com

You are commenting using your WordPress.com account. Logout / Ubah )

Gambar Twitter

You are commenting using your Twitter account. Logout / Ubah )

Foto Facebook

You are commenting using your Facebook account. Logout / Ubah )

Foto Google+

You are commenting using your Google+ account. Logout / Ubah )

Connecting to %s