Text summarization adalah salah satu cabang dari information extraction, metode ini meringkas dokumen teks digital secara otomatis. Metode ini merupakan cara efektif untuk mendapat informasi dari data digital yang dewasa ini semakin membludak. Pasti kita malas klo harus baca keseluruhan dokumen untuk mendapat ide utama dari dokumen itu. Semua pekerjaan yang monoton itu akan dilakukan oleh text summarizer dan hasilnya hanya setengah atau sepertiga dari dokumen aslinya (ada juga yg berupa keyword). Ada 2 pendekatan dalam text summarization ini, NLP (Natural Language Processing) dan IR (Information Retrieval), sebagian besar digunakan IR karena kecepatan komputasinya dibandingkan NLP, lagipula perkembangan NLP belum begitu pesat dan signifikan. IR lebih banyak menggunakan statistik sedangkan NLP menggunakan analisis semantik. Ada 2 cara dalam meringkas yaitu abstraction dan extraction, abstraction dilakukan oleh manusia untuk menggabungkan konsep, mis. apel, jeruk, mangga, jambu ->buah-buahan, sedangkan extraction hanya mereduksi jumlah kata mis. hanya mengambil kata yang penting saja. Saat ini lebih banyak dilakukan extraction karena kemudahannya dibandingkan abstraction (biasanya menggunakan WordNet).
Di Indonesia sendiri topik ini belum mendapat perhatian, sedangkan di Amerika topik ini sudah mulai ramai jadi bahan penelitian sejak tahun 50-an. Contoh aplikasinya sudah bervariasi dari single-document sampai multi-document, domain-independent sampai domain-dependent, dan sudah pula yang dapat diterapkan pada multi-language document contohnya SUMMARIST. Saat ini topik ini masih jadi bahan penelitian dan akan terus-menerus mengalami perbaikan, antara lain dengan menggabungkan beberapa metode IR dan NLP juga machine learning.
Saya pikir topik ini menarik dan mungkin bisa menjadi inspirasi bagi para pembaca. Saya sendiri mengambil topik ini untuk Tugas Akhir dan saya mengambil pendekatan IR dengan metode sentence compression, yaitu mereduksi panjang kalimat.
anggriawan said:
gile.. wew… text summarization…
caio… caio… ^_^
rani! said:
pusing ah. semangat mi! π
hehe emang laf, tp mo digimanain lagi TA T_T
pebbie said:
kenapa nggak digabung aja metode statistik dengan semantik?
metode statistik digunakan untuk membangkitkan kombinasi, metode semantik sebagai validator..
atau sebaliknya,
metode semantik digunakan untuk menganalisis kalimat dan memberikan pembobotan thd lexicon yang muncul di dalam kalimat. lalu kumpulan kalimat ini dikompresi secara statistik
thomaszae said:
menarik π
sepertinya kita bisa diskusi lebih banyak karena tesis saya juga topiknya summarization text, tapi hasil keluaran saya bukan dalam bentuk text juga tapi dalam bentuk graph (knowledge graph)
saat ini saya masih explore tentang summarization text, bisa share paper”nya ?
Thq
khodijah said:
salam kenal,
meskipun telat, masih belum basikan ikut nimbrung, saat ini sy lagi tertarik dg topik knowledge graph, bisa kasih saran u dptkan publikasi aplikasi knowledge graph? tks
miakamayani said:
@khodijah: salam kenal juga :),,kebetulan saya blm pernah eksplor mengenai knowledge graph, maaf g bs bantu π
yani said:
Assalamu’alaikum mbak Mia!
saya mahasiswi yang semester depan bakal buat skripsi. pas buka2 site, eh loat tentang text summarization and pas baca bog mbak, saya makin tertark. kalo boleh minta tolong, saya minta references yang mbak pakai buat nyeesaiin projek itu. kalo boleh juga minta no hp nya, biar kalo saya mau nanya2 lebih gampang n cepat.
moho bales ke alamat email saya ya mbak… n thanks.
Wassalam π
Dony Ariyanto said:
hai mia… salam kenal…
ei kalo tahapan text summarizationnya gimana yah?
dari dokumenΒ² tsb diapain dolo…
miakamayani said:
@Dony Ariyanto: halo juga salam kenal,,sebelumnya dokumen harus di-preprocess dulu sehingga menghasilkan format teks yang memudahkan untuk diproses lebih lanjut, mis. plain teks atau berupa koleksi kata-kata yang sudah dikategorikan dan diberi properti khusus. Tahap selanjutnya sangat tergantung dari metode yang dipilih: statistik atau AI.
hartono said:
alo mia…
Boleh minta bahan referensinya apa aja gak? saya tertarik dengan text summarization juga… Mohon bantuannya.. Kalo boleh, sekalian minta email ato YM nya ya….
Saya dah baca mengenai sentence compression dari prosiding nya james clarke, tp masi ada beberapa yg sulit dimengerti… Kalo boleh, saya mao minta bantuan mia…
Balas ke email saya ya… Trims…
deden said:
thanks for information….
great post… amazing
please visit myblog…
miakamayani said:
thanks for visiting my blog π
MdarulM said:
Sungguh sangat menginspirasi…
Firda Maryana said:
assalamualaikum wr wb. kak kalau boleh tanya, algoritma apa ya yang palng mudah untuk membuat text summarization? kebetulan tugas akhir saya juga berkaitan dengan text summarization. terimakasih sebelumnya π