Mau tau soal Text Summarization?

Tag

information extraction, text summarization

Text summarization adalah salah satu cabang dari information extraction, metode ini meringkas dokumen teks digital secara otomatis. Metode ini merupakan cara efektif untuk mendapat informasi dari data digital yang dewasa ini semakin membludak. Pasti kita malas klo harus baca keseluruhan dokumen untuk mendapat ide utama dari dokumen itu. Semua pekerjaan yang monoton itu akan dilakukan oleh text summarizer dan hasilnya hanya setengah atau sepertiga dari dokumen aslinya (ada juga yg berupa keyword). Ada 2 pendekatan dalam text summarization ini, NLP (Natural Language Processing) dan IR (Information Retrieval), sebagian besar digunakan IR karena kecepatan komputasinya dibandingkan NLP, lagipula perkembangan NLP belum begitu pesat dan signifikan. IR lebih banyak menggunakan statistik sedangkan NLP menggunakan analisis semantik. Ada 2 cara dalam meringkas yaitu abstraction dan extraction, abstraction dilakukan oleh manusia untuk menggabungkan konsep, mis. apel, jeruk, mangga, jambu ->buah-buahan, sedangkan extraction hanya mereduksi jumlah kata mis. hanya mengambil kata yang penting saja. Saat ini lebih banyak dilakukan extraction karena kemudahannya dibandingkan abstraction (biasanya menggunakan WordNet).

Di Indonesia sendiri topik ini belum mendapat perhatian, sedangkan di Amerika topik ini sudah mulai ramai jadi bahan penelitian sejak tahun 50-an. Contoh aplikasinya sudah bervariasi dari single-document sampai multi-document, domain-independent sampai domain-dependent, dan sudah pula yang dapat diterapkan pada multi-language document contohnya SUMMARIST. Saat ini topik ini masih jadi bahan penelitian dan akan terus-menerus mengalami perbaikan, antara lain dengan menggabungkan beberapa metode IR dan NLP juga machine learning.

Saya pikir topik ini menarik dan mungkin bisa menjadi inspirasi bagi para pembaca. Saya sendiri mengambil topik ini untuk Tugas Akhir dan saya mengambil pendekatan IR dengan metode sentence compression, yaitu mereduksi panjang kalimat.

14 thoughts on “Mau tau soal Text Summarization?”

anggriawan said:

Oktober 3, 2007 pukul 7:55 am

gile.. wew… text summarization…
caio… caio… ^_^

Balas
rani! said:

Oktober 4, 2007 pukul 6:31 am

pusing ah. semangat mi! 😀

hehe emang laf, tp mo digimanain lagi TA T_T

Balas
pebbie said:

Oktober 4, 2007 pukul 6:59 am

kenapa nggak digabung aja metode statistik dengan semantik?

metode statistik digunakan untuk membangkitkan kombinasi, metode semantik sebagai validator..

atau sebaliknya,

metode semantik digunakan untuk menganalisis kalimat dan memberikan pembobotan thd lexicon yang muncul di dalam kalimat. lalu kumpulan kalimat ini dikompresi secara statistik

Balas
thomaszae said:

April 7, 2008 pukul 2:35 am

menarik 🙂
sepertinya kita bisa diskusi lebih banyak karena tesis saya juga topiknya summarization text, tapi hasil keluaran saya bukan dalam bentuk text juga tapi dalam bentuk graph (knowledge graph)
saat ini saya masih explore tentang summarization text, bisa share paper”nya ?
Thq

Balas
- khodijah said:
  
  November 19, 2009 pukul 6:13 am
  
  salam kenal,
  meskipun telat, masih belum basikan ikut nimbrung, saat ini sy lagi tertarik dg topik knowledge graph, bisa kasih saran u dptkan publikasi aplikasi knowledge graph? tks
  
  Balas
  - miakamayani said:
    
    Mei 22, 2010 pukul 11:31 am
    
    @khodijah: salam kenal juga :),,kebetulan saya blm pernah eksplor mengenai knowledge graph, maaf g bs bantu 🙂
yani said:

November 10, 2008 pukul 5:01 am

Assalamu’alaikum mbak Mia!
saya mahasiswi yang semester depan bakal buat skripsi. pas buka2 site, eh loat tentang text summarization and pas baca bog mbak, saya makin tertark. kalo boleh minta tolong, saya minta references yang mbak pakai buat nyeesaiin projek itu. kalo boleh juga minta no hp nya, biar kalo saya mau nanya2 lebih gampang n cepat.
moho bales ke alamat email saya ya mbak… n thanks.
Wassalam 🙂

Balas
Dony Ariyanto said:

Desember 24, 2008 pukul 1:16 pm

hai mia… salam kenal…
ei kalo tahapan text summarizationnya gimana yah?
dari dokumen² tsb diapain dolo…

Balas
miakamayani said:

Januari 6, 2009 pukul 4:28 am

@Dony Ariyanto: halo juga salam kenal,,sebelumnya dokumen harus di-preprocess dulu sehingga menghasilkan format teks yang memudahkan untuk diproses lebih lanjut, mis. plain teks atau berupa koleksi kata-kata yang sudah dikategorikan dan diberi properti khusus. Tahap selanjutnya sangat tergantung dari metode yang dipilih: statistik atau AI.

Balas
hartono said:

Januari 6, 2009 pukul 8:04 am

alo mia…
Boleh minta bahan referensinya apa aja gak? saya tertarik dengan text summarization juga… Mohon bantuannya.. Kalo boleh, sekalian minta email ato YM nya ya….
Saya dah baca mengenai sentence compression dari prosiding nya james clarke, tp masi ada beberapa yg sulit dimengerti… Kalo boleh, saya mao minta bantuan mia…
Balas ke email saya ya… Trims…

Balas
deden said:

Juni 10, 2010 pukul 9:22 am

thanks for information….

great post… amazing

please visit myblog…

Balas
- miakamayani said:
  
  Juni 11, 2010 pukul 5:30 am
  
  thanks for visiting my blog 🙂
  
  Balas
MdarulM said:

Agustus 12, 2011 pukul 8:46 am

Sungguh sangat menginspirasi…

Balas
Firda Maryana said:

Desember 3, 2015 pukul 1:22 pm

assalamualaikum wr wb. kak kalau boleh tanya, algoritma apa ya yang palng mudah untuk membuat text summarization? kebetulan tugas akhir saya juga berkaitan dengan text summarization. terimakasih sebelumnya 🙂

Balas

	miakamayani pada Manfaat Vitamin E
	miakamayani pada Beasiswa Unggulan Kemendiknas
	novi karika pada Beasiswa Unggulan Kemendiknas
	Firda Maryana pada Mau tau soal Text Summari…
	Nurul Aini pada Beasiswa Unggulan Kemendiknas

Mia’s Weblog

~ coretan saya

Mau tau soal Text Summarization?

14 thoughts on “Mau tau soal Text Summarization?”

Tinggalkan komentar Batalkan balasan

Bagikan ini:

Terkait

14 thoughts on “Mau tau soal Text Summarization?”

Tinggalkan komentar Batalkan balasan