Semalt: Jurnalistlar uchun beshta ajoyib matnni skrapalash uchun ariza

Jurnalist doimiy ravishda ma'lumot to'playdi, yozadi va tarqatadi. U asosan umumiy muammolarga, siyosiy muammolarga yoki tabiiy ofatlarga e'tibor qaratadi. Aksariyat jurnalistlar o'yin-kulgi dunyosidagi yangiliklarni yoritadilar, boshqalari o'yin va sport haqida gapirishadi. Jurnalist bir vaqtning o'zida bir nechta matnni qirqish vazifasini bajarishi kerak; u nafaqat ma'lumotlarni chiqaribgina qolmay, balki uning aniqligi va qonuniyligini ham ta'minlaydi. Ba'zan jurnalistlar o'zlarini xavf ostiga qo'yib, ko'proq o'quvchilarni jalb qilish uchun yangiliklar maqolalarini yozadilar. Agar siz jurnalist bo'lishni istasangiz va dasturlashning asosiy ko'nikmalariga ega bo'lmasangiz, ishingizni yakunlash uchun quyidagi dasturlardan foydalanishingiz mumkin.
1. Scraper:
Scraper eng yaxshi va foydali matn va rasmlarni qirqish xizmatlaridan biridir. U foydalanish uchun qulay va foydalanuvchilarga qulay interfeys bilan ta'minlangan. Scraper yordamida jurnalistlar bir vaqtning o'zida bir nechta veb-sahifalarni nishonga olishlari va to'liq yoki qisman saytlardan ma'lumotlarni olishlari mumkin. Scraper mashinani o'rganish texnologiyasi bilan mashhur va CNN, BBC va boshqa shunga o'xshash yangiliklar veb-saytlaridan oddiy matnni chiqaradi. Keyin ushbu ma'lumotlarni Google Docs, CSV yoki JSON fayllariga eksport qilishingiz mumkin. Bu matnlarning sifatini baholash uchun XPath-dan foydalanadi.
2. Outubit Hub:
Outwit Hub ham jurnalistlar, ham boshqa dasturchilar uchun javob beradi. Ushbu dasturdan foyda olish uchun Python, C ++ yoki Ruby-ni o'rganishingiz shart emas. Bu asosan Firefox kengaytmasi va siz uchun matnli fayllar, PDF, HTML hujjatlari va rasmlarni qirqadi. Outwit Hub aniq natijalarni beradi va turli veb-saytlarni qulay ravishda indekslash uchun ishlatilishi mumkin.
3. Scraperwiki:

Siz Vikipediya sahifalari, onlayn jurnallar, yangiliklar veb-saytlari va elektron tijorat saytlaridan ma'lumotlarni olish uchun Scraperwiki-dan foydalanishingiz mumkin. Bu darhol xatosiz natijalarni ta'minlaydigan brauzerga asoslangan dastur. Agar sizda kodlash bo'yicha biron bir bilimingiz bo'lmasa, Scraperwiki siz uchun to'g'ri tanlovdir. Ushbu xizmat yordamida jurnalistlar bir necha soniya ichida butun saytni qirib tashlab, ma'lumotlarni qattiq disklariga yuklab olishlari mumkin. Scraperwiki-ning klassik versiyasi dastur ishlab chiqaruvchilari, freelancerlar va veb-ustalar uchun javob beradi.
4. Import.io:
Import.io - bu Internetdagi eng yaxshi va eng foydali matn skrining xizmatlaridan biri. Bu jurnalistlarga dolzarb mavzularni qidirishga, ma'lumotlarni aniq ajratib olishga va bir necha daqiqa ichida o'z veb-saytlarida e'lon qilishga yordam beradi. Import.io yordamida siz ikkala matn va JPG fayllarini qirib tashlashingiz mumkin. O'rnatilgan va faollashtirilgandan so'ng, ushbu vosita bir vaqtning o'zida ikki mingtagacha matnli skrining loyihalarini amalga oshiradi. Bu berilgan URL-lardan tarkib olish uchun juda yaxshi ish va sizga hech qanday muammosiz ma'lumotlarni tahlil qilish imkonini beradi.
5. Kimono laboratoriyalari:
Xuddi Import.io singari, Kimono Labs ko'plab saytlarni nishonga oladi. Bu Internetda to'liq hajmli matn kazıyıcı va veb-slayder vazifasini bajaradi. Siz shunchaki ma'lumot olishni istagan URL-manzilni eslatishingiz kerak va Kimono Laboratoriyalari bir necha daqiqadan so'ng kerakli natijalarni olishadi. Mashinada o'qitish texnologiyasi bilan mashhur va jurnalistlar uchun mos mavzularni topish uchun Internetni qidiradi. Siz rasm va matnli fayllarni Google Docs-ga saqlashingiz yoki ularni to'g'ridan-to'g'ri kompyuteringizga yuklab olishingiz mumkin.