Mau tau soal Text Summarization?

Text summarization adalah salah satu cabang dari information extraction, metode ini meringkas dokumen teks digital secara otomatis. Metode ini merupakan cara efektif untuk mendapat informasi dari data digital yang dewasa ini semakin membludak. Pasti kita malas klo harus baca keseluruhan dokumen untuk mendapat ide utama dari dokumen itu. Semua pekerjaan yang monoton itu akan dilakukan oleh text summarizer dan hasilnya hanya setengah atau sepertiga dari dokumen aslinya (ada juga yg berupa keyword). Ada 2 pendekatan dalam text summarization ini, NLP (Natural Language Processing) dan IR (Information Retrieval), sebagian besar digunakan IR karena kecepatan komputasinya dibandingkan NLP, lagipula perkembangan NLP belum begitu pesat dan signifikan. IR lebih banyak menggunakan statistik sedangkan NLP menggunakan analisis semantik. Ada 2 cara dalam meringkas yaitu abstraction dan extraction, abstraction dilakukan oleh manusia untuk menggabungkan konsep, mis. apel, jeruk, mangga, jambu ->buah-buahan, sedangkan extraction hanya mereduksi jumlah kata mis. hanya mengambil kata yang penting saja. Saat ini lebih banyak dilakukan extraction karena kemudahannya dibandingkan abstraction (biasanya menggunakan WordNet).

Di Indonesia sendiri topik ini belum mendapat perhatian, sedangkan di Amerika topik ini sudah mulai ramai jadi bahan penelitian sejak tahun 50-an. Contoh aplikasinya sudah bervariasi dari single-document sampai multi-document, domain-independent sampai domain-dependent, dan sudah pula yang dapat diterapkan pada multi-language document contohnya SUMMARIST. Saat ini topik ini masih jadi bahan penelitian dan akan terus-menerus mengalami perbaikan, antara lain dengan menggabungkan beberapa metode IR dan NLP juga machine learning.

Saya pikir topik ini menarik dan mungkin bisa menjadi inspirasi bagi para pembaca. Saya sendiri mengambil topik ini untuk Tugas Akhir dan saya mengambil pendekatan IR dengan metode sentence compression, yaitu mereduksi panjang kalimat.

13 Komentar

Filed under Pengetahuan

13 responses to “Mau tau soal Text Summarization?

  1. gile.. wew… text summarization…
    caio… caio… ^_^

  2. pusing ah. semangat mi!😀

    hehe emang laf, tp mo digimanain lagi TA T_T

  3. kenapa nggak digabung aja metode statistik dengan semantik?

    metode statistik digunakan untuk membangkitkan kombinasi, metode semantik sebagai validator..

    atau sebaliknya,

    metode semantik digunakan untuk menganalisis kalimat dan memberikan pembobotan thd lexicon yang muncul di dalam kalimat. lalu kumpulan kalimat ini dikompresi secara statistik

  4. menarik🙂
    sepertinya kita bisa diskusi lebih banyak karena tesis saya juga topiknya summarization text, tapi hasil keluaran saya bukan dalam bentuk text juga tapi dalam bentuk graph (knowledge graph)
    saat ini saya masih explore tentang summarization text, bisa share paper”nya ?
    Thq

    • khodijah

      salam kenal,
      meskipun telat, masih belum basikan ikut nimbrung, saat ini sy lagi tertarik dg topik knowledge graph, bisa kasih saran u dptkan publikasi aplikasi knowledge graph? tks

      • miakamayani

        @khodijah: salam kenal juga🙂,,kebetulan saya blm pernah eksplor mengenai knowledge graph, maaf g bs bantu🙂

  5. yani

    Assalamu’alaikum mbak Mia!
    saya mahasiswi yang semester depan bakal buat skripsi. pas buka2 site, eh loat tentang text summarization and pas baca bog mbak, saya makin tertark. kalo boleh minta tolong, saya minta references yang mbak pakai buat nyeesaiin projek itu. kalo boleh juga minta no hp nya, biar kalo saya mau nanya2 lebih gampang n cepat.
    moho bales ke alamat email saya ya mbak… n thanks.
    Wassalam🙂

  6. hai mia… salam kenal…
    ei kalo tahapan text summarizationnya gimana yah?
    dari dokumen² tsb diapain dolo…

  7. miakamayani

    @Dony Ariyanto: halo juga salam kenal,,sebelumnya dokumen harus di-preprocess dulu sehingga menghasilkan format teks yang memudahkan untuk diproses lebih lanjut, mis. plain teks atau berupa koleksi kata-kata yang sudah dikategorikan dan diberi properti khusus. Tahap selanjutnya sangat tergantung dari metode yang dipilih: statistik atau AI.

  8. hartono

    alo mia…
    Boleh minta bahan referensinya apa aja gak? saya tertarik dengan text summarization juga… Mohon bantuannya.. Kalo boleh, sekalian minta email ato YM nya ya….
    Saya dah baca mengenai sentence compression dari prosiding nya james clarke, tp masi ada beberapa yg sulit dimengerti… Kalo boleh, saya mao minta bantuan mia…
    Balas ke email saya ya… Trims…

  9. thanks for information….

    great post… amazing

    please visit myblog…

  10. Sungguh sangat menginspirasi…

Tinggalkan Balasan

Isikan data di bawah atau klik salah satu ikon untuk log in:

Logo WordPress.com

You are commenting using your WordPress.com account. Logout / Ubah )

Gambar Twitter

You are commenting using your Twitter account. Logout / Ubah )

Foto Facebook

You are commenting using your Facebook account. Logout / Ubah )

Foto Google+

You are commenting using your Google+ account. Logout / Ubah )

Connecting to %s