Semalt: Выдаленне дадзеных з дапамогай убудовы Google Chrome

Калі для пошуку ў сетцы вы карыстаецеся браўзэрам Google Chrome, для атрымання дадзеных з вашых любімых вэб-старонак ёсць убудова для браўзэра. Google Chrome Scraper - гэта праграмнае забеспячэнне, якое выкарыстоўваецца для атрымання дадзеных як з дынамічных, так і з статычных сайтаў. Гэты убудова для Chrome дазволіць вам саскрэбіць ўпадабанае змесціва вэб-старонкі і захаваць яго ў дакументах Google.
Вэб-скрабок Google Chrome
Google Chrome Web Scraper - гэта пашырэнне аглядальніка, якое здабывае дадзеныя з сайтаў і старонак. З гэтым пашырэннем вам не трэба сотні работнікаў, каб капіраваць і ўстаўляць змесціва з сайтаў цэлы дзень. Пасля ўстаноўкі ў браўзэры Chrome усё, што вам трэба зрабіць, гэта выбраць мэтавае ўтрыманне і дазволіць вэб-скрабкам зрабіць усё астатняе.
Калі ў вас няма ведаў па кадаванні, гэта лепшы вэб-скрабок для разгляду. Google Chrome Scraper рэкамендуецца як для дробных, так і для маштабных выскрабанняў. Ён складаецца з каштоўнай інфармацыі і дадзеных, якія могуць быць ператвораны ў дадзеныя канкурэнтнай разведкі. Дзякуючы гэтаму пашырэнню ўсе вашы мэтавыя выявы і каталогі могуць быць лёгка здабыты і экспартаваны ў CouchDB або электронныя табліцы.
Кіраўніцтва, як пачаць працаваць
Скраблінг вэб-старонак з убудовай для браўзэра - гэта самастойная задача, якую можна хутка выканаць на ПК. Вось канчатковае кіраўніцтва, якое дапаможа вам пачаць:

- Запусціце браўзэр Google Chrome і націсніце "Chrome Web Store".
- Адкрыйце пашырэнні браўзэра і знайдзіце "Скрапер".
- Націсніце на "Дадаць у Chrome" варыянт, які адлюстроўваецца на экране
- Адкрыйце вэб-сайт або вэб-старонку, каб яе саскрэсці, і вылучыце дадзеныя, якія трэба атрымаць. Пстрыкніце правай кнопкай мышы на элеменце і націсніце «Скрап падобны».
- На экране з'явіцца кансоль скрабка. Звярніце ўвагу, што кансоль вэб-скрэпера складаецца з здабытых дадзеных.
- На гэтым этапе вы можаце вырашыць, дзе захаваць выскаблівае змесціва. Напрыклад, вы можаце захаваць змесціва ў дакументах Google, націснуўшы на кнопку "Захаваць у дакументах Google".
Звярніце ўвагу, што "скрабок" - гэта аўтаматызаваны сцэнар, які здабывае карысныя дадзеныя з дынамічных вэб-старонак і сайтаў. У адрозненне ад іншых інструментаў для выскрабання ў Інтэрнэце, Google Chrome можа таксама саскрэбіць дадзеныя, згенераваныя JavaScript. Іншыя задачы, выкананыя ўбудовам Chrome scraper, ўключаюць:
- Націсканне на кнопкі змесціва для загрузкі дадзеных;
- Націсканне на кнопкі раздзелкі, якія загружаюць інфармацыю пры дапамозе AJAX;
- Пракручванне вэб-старонак, каб загрузіць больш змесціва;
- У чаканні загрузкі дынамічнага змесціва на вэб-старонку;
Пасля выскрабання дадзеных з вэб-старонкі вы можаце загрузіць дадзеныя ў фармаце, падзеленым коскай (CSV), альбо захаваць іх у CouchDB. З дапамогай Google Chrome Web Scraper вам не прыйдзецца працаваць над выманнем дадзеных, стварэннем плана альбо экспартам.