Back to Question Center
0

Семалт: Как да използвате платформа за извличане на

1 answers:

Има толкова много уроци за DIY през интернет. Ако трябва само да извлечете малко количество данни, уроците могат да ви помогнат. Но ако трябва да извличате голям обем данни редовно, тогава трябва да наемете опитна фирма за третиране на уеб страници от трета страна. Crawlboard е един от доставчиците на такива услуги и много хора го използват за задачата си за изтриване на уеб страници - eskimo ice augars. Платформата е много ефективна. Така че, той се препоръчва за хора, които се нуждаят от редовно изстъргване на голямо количество данни.

Освен ефективността, той е лесен за използване. Простите стъпки, необходими за използване на платформата, са описани тук.

Стъпка 1:

Отидете на CrawlBoard уеб страницата за отстраняване на заявки, като кликнете върху тази връзка. Попълнете регистрационния формуляр по подходящ начин. Има полета за първото име, фамилия, имейл адрес на фирмата и роля в работата. Когато сте готови, трябва само да кликнете върху бутона за регистрация. Автоматична поща ще бъде изпратена на имейл адреса, който сте посочили за потвърждение. Отворете имейла и кликнете върху връзката за потвърждение, за да активирате новия си CrawlBoard профил.

Стъпка 2:

Основната цел на тази стъпка е да добавите сайт, който да обхожда, но първо трябва да създадете група от сайтове. Sitegroup е група от сайтове със сходна структура. Това е за хора, които обикновено се нуждаят от изстъргване на данни от няколко сайта наведнъж.

За да създадете група от сайтове, кликнете върху връзката "Създаване на нова sitegroup". Той се намира от дясната страна на полето за избор на Sitegroup. След това вече можете да добавяте всички сайтове, които принадлежат към групата от сайтове, едно след друго, като кликнете върху връзката Добавяне, намираща се в горния десен ъгъл на страницата. След това изберете сайтовете един по един.

Стъпка 3:

Отидете в прозореца за създаване на сайтове, за да предоставите предпочитано уникално име за вашата група от сайтове. Не забравяйте, че всички сайтове в дадена група трябва да имат една и съща структура, в противен случай е възможно да не получите точно съдържание.

За да разберете значението на sitegroup, вземете например сайтове с обяви за работа. Ако зададената задача е да изтриете работни места от табла за работа, тогава ще трябва да създадете група от сайтове, която да съответства на функцията, а всички сайтове в групата сайтове ще бъдат сайтове с обяви за работа.

Стъпка 4:

Съгласно задължителните полета на този екран, трябва да изберете честотата на извличане на данни, формата на доставка и начина на доставка. Честотите на извличане на данни са ежедневни, седмични, месечни и обичайни.

За формата за доставка можете да избирате между XML, JSON и CSV. И за начина на доставка, трябва да изберете между FTP, Dropbox, Amazon S3 и REST API.

Стъпка 5:

Екранът е предназначен за допълнителна информация. Потребителите трябва да описват по-нататък своята задача за изтриване на уеб страници. Въпреки че е по избор, е важно да се включи допълнителна информация, тъй като колкото повече описвате задачата си, толкова повече доставчикът на услуги ще разбере точно това, което искате, и това ще доведе до по-добър резултат.

Можете също да поискате някои услуги с добавена стойност на този екран. Някои от тях са "Хоствано индексиране", "Сливане на файлове", "Изтегляне на изображения" и "Изпратена доставка".

Стъпка 6:

Тук трябва само да кликнете върху бутона "Изпращане за проверка на приложимостта". Целта е доставчикът на услуги да провери дали задачата ви е осъществима. Ще получите имейл, който ще ви информира дали задачата ви е осъществима или не. Ако е така, сега можете да отидете и да извършите плащане. След като плащането Ви бъде потвърдено, екипът на CrawlBoard ще се появи в действие.

След като сте платили, трябва само да изчакате емисиите си във формат, посочен от вас, чрез предпочитания от вас начин на показване.

December 22, 2017