Semalt, web gözlemek gurallarynyň synag netijelerini berýär

Web ulanyjy gurallaryny ulanmak islänlerinde, her bir ulanyjy iki wariant bilen ýüzbe-ýüz bolýar. Eithera-da tekjeden daşarky web gyryjy ýa-da ýörite gyryjy ulanýarlar. Customörite gyryjy has oňat warianty bolsa-da, köp adam gymmatlygy sebäpli ondan ýüz öwürýär. Gural, işiňize we islegleriňize laýyk işlenip düzülmeli, şonuň üçin köp iş gerek.

Beýleki bir tarapdan, tekjäniň daşyndaky web gyryjylary gaty umumy, sebäbi umumy web gözlemek işleri üçin niýetlenendir. Adatça käbir web gözlemek taslamalarynda has gowy we beýlekilerde gödek işler edýärler. Dogry saýlamaga kömek etmek üçin käbir web gyryjylary düýpli web gyrmak synaglaryna sezewar edildi we netijeler aşakda görkezildi.

Synag ölçegleri

Web gyryjylary aşakdaky umumy maglumatlary çykarmak meselelerinde synag edildi. Tablisa hasabatlaryny, tekst sanawlaryny we giriş formalaryny ýok etmek ukyby boýunça synag edildi. Mundan başga-da, web gyryjylary AJAX-da gurlan dinamiki web sahypalaryndan maglumatlary çykarmak ukyby boýunça synag edildi. Bu, köplenç köp web gyryjylary üçin iň kyn meseleleriň biridir. Captcha-ny dolandyrmak ukyby hem synagdan geçirildi. Ahyrynda, blok düzülişini dolandyrmak ukyby boýunça synag edildi.

Synag netijeleri

Synagdan geçen web gyryş gurallary Content Grabber, Visual Web Ripper, Helium Scraper, Screen Scraper, OutWit Hub, Mozenda, WebSundew Extractor, Web Content Extractor we Easy Web Extractor.

Netijeler, Content Grabber-iň synagdan geçen ýerlerde ajaýyp ýerine ýetirendigi sebäpli iň gowudygyny görkezdi. Şeýlelik bilen, iň ýokary ortaça baha aldy. Şeýle hem, ähli web gyryş gurallarynyň giriş formalaryny gyryp, AJAX bilen gurlan web sahypalaryndan maglumatlary gyryp bilendigi hem syn edildi. Şeýlelik bilen, web gyryjy gerek bolsa, şu sebäplerden birini saýlap bilersiňiz. Olaryň hemmesi iki ugurda-da gaty gowy çykyş etdiler.

“Content Grabber” -iň ýerine ýetirişinde indiki “Visual Web Ripper”. Thehli ugurlarda gowy çykyş etdi, ýöne Content Grabber ýaly däl, şonuň üçin ortaça 4,5 bal gazandy. Indiki web guraly “Helium Scraper”. Onuň öndürijiligi Visual Web Ripper-iňki ýaly diýen ýaly. “Helium Scraper” bilen ýeke-täk mesele, blok düzülişini dolandyrmakda pes öndürijiligi.

Synag netijelerine görä, bu tertipde ýerine ýetirilen web gyryş gurallary: Mazmuny Grabber, Visual Web Ripper, Gelium Scraper, Screen Scraper, OutWit Hub, Mozenda, WebSundew Extractor, Web Content Extractor we Easy Web Extractor .

Netije

Aboveokarda seljerilen synag netijelerini göz öňünde tutup, Content Grabber ähli synag kategoriýalarynda 5 reýting aldy. Diýmek, iň gowusy. Muny hem synap görmeli bolmagyňyz mümkin. Gynansagam, iki sany web gyryjy dürli sebäplere görä synagdan çykdy. Web Data Extractor we WebHarvy döredijiler önümlerini synagdan çykardylar.

Synaga gatnaşmaýandygyna garamazdan, ikisi hakda birnäçe zat öwrenildi. WebHarvy, gowy formatlanan sahypalardan maglumatlary gyrmak üçin niýetlenendir, Web Data Extractor diňe e-poçta, URL-ler we ş.m. ýygnamak üçin niýetlenendir.