Rabu, 12 Juni 2013

Menggunakan Perl dan Regular Expressions untuk Proses Html File

Seperti penulis konten web banyak, selama beberapa tahun terakhir ini aku mendapat banyak kesempatan ketika saya diPerlukan untuk membersihkan sekelompok HTML file yang telah dihasilkan oleh pengolah kata atau paket penerbitan. Awalnya, saya digunakan untuk membersihkan file secara manual, membuka satu per satu, dan membuat set yang sama atas perubahan kepada masing-masing. Ini bekerja baik bila Anda hanya memiliki beberapa file untuk memperbaiki, tetapi bila Anda memiliki ratusan atau bahkan ribuan untuk melakukan, Anda dapat dengan cepat akan melihat minggu atau bahkan bulan bekerja. Beberapa tahun lalu seseorang menempatkan saya pada ide menggunakan ekspresi reguler Perl dan untuk melakukan ini 'membersihkan' proses. Mengapa menulis sebuah artikel tentang ekspresi reguler Perl dan saya mendengar Anda berkata. Nah, itu titik yang baik. Setelah semua web penuh dengan tutorial di Perl dan ekspresi reguler. Apa yang saya temukan meskipun, adalah bahwa ketika saya mencoba untuk mencari tahu bagaimana saya dapat memproses file HTML, saya menemukan sulit untuk menemukan tutorial yang memenuhi kriteria saya. Saya tidak mengatakan mereka tidak ada, aku tidak bisa menemukan mereka. Tentu, aku bisa menemukan tutorial yang menjelaskan segala sesuatu yang saya perlu tahu tentang kalimat biasa, dan aku bisa menemukan banyak tutorial tentang bagaimana program dalam Perl, dan bahkan bagaimana menggunakan kalimat biasa dalam script Perl. Apa yang saya tidak bisa menemukan meskipun, adalah tutorial yang menjelaskan bagaimana untuk membuka satu atau lebih HTML atau file teks, membuat update ke file-file menggunakan ekspresi reguler, dan kemudian menyimpan dan menutup file.
Goal Ketika mengkonversi dokumen ke gawang HTML selalu untuk mencapai konversi mulus dari dokumen sumber (misalnya, dokumen pengolah kata) untuk HTML. Hal terakhir yang Anda butuhkan adalah untuk penulis konten Anda akan menghabiskan berjam-jam, atau bahkan berhari-hari, memperbaiki kode HTML tidak rapi setelah itu telah dikonversi.
Banyak aplikasi menawarkan alat yang sangat baik untuk mengkonversi dokumen ke HTML dan, dalam kombinasi dengan sebuah style sheet yang dirancang dengan baik cascading (CSS), seringkali dapat menghasilkan hasil yang sempurna. Kadang-kadang meskipun, ada sedikit dari kode HTML yang agak berantakan, biasanya disebabkan oleh penulis tidak menerapkan tag paragraf atau gaya dengan benar dalam dokumen sumber.
Mengapa Perl?
Alasan mengapa Perl adalah suatu Bahasa yang baik untuk digunakan untuk tugas ini adalah karena itu sangat baik pada pengolahan file teks, yang membiarkan wajah itu, adalah semua file HTML. Perl juga standar de facto untuk penggunaan kalimat biasa, yang dapat Anda gunakan untuk mencari, dan mengganti / mengubah, potongan teks atau kode dalam file.
Apa itu Perl?
Perl (Ekstraksi Praktis dan Bahasa Laporan) adalah sebuah bahasa Pemrograman tujuan umum, yang berarti dapat digunakan untuk melakukan apa pun bahwa setiap bahasa pemrograman lainnya dapat dilakukan. Karena itu, Perl sangat baik dalam melakukan hal-hal tertentu, dan tidak begitu baik pada orang lain. Meskipun Anda bisa melakukannya, Anda tidak akan biasanya mengembangkan antarmuka pengguna dalam Perl seperti itu akan jauh lebih mudah untuk menggunakan bahasa seperti Visual Basic untuk melakukan hal ini. Apa Perl benar-benar baik, adalah pengolahan teks. Hal ini membuat pilihan yang cocok untuk memanipulasi file HTML.
Apa yang dimaksud dengan Regular Expression?
Sebuah ekspresi reguler adalah sebuah string yang menjelaskan atau cocok dengan set string, menurut aturan sintaks tertentu. Ekspresi reguler tidak unik untuk Perl - banyak bahasa, termasuk JavaScript dan PHP dapat menggunakan mereka - tetapi mereka lebih baik menangani Perl daripada bahasa lain.

Tidak ada komentar:

Posting Komentar