Semalt: Выдаленне дадзеных з дапамогай убудовы Google Chrome

Калі для пошуку ў сетцы вы карыстаецеся браўзэрам Google Chrome, для атрымання дадзеных з вашых любімых вэб-старонак ёсць убудова для браўзэра. Google Chrome Scraper - гэта праграмнае забеспячэнне, якое выкарыстоўваецца для атрымання дадзеных як з дынамічных, так і з статычных сайтаў. Гэты убудова для Chrome дазволіць вам саскрэбіць ўпадабанае змесціва вэб-старонкі і захаваць яго ў дакументах Google.

Вэб-скрабок Google Chrome

Google Chrome Web Scraper - гэта пашырэнне аглядальніка, якое здабывае дадзеныя з сайтаў і старонак. З гэтым пашырэннем вам не трэба сотні работнікаў, каб капіраваць і ўстаўляць змесціва з сайтаў цэлы дзень. Пасля ўстаноўкі ў браўзэры Chrome усё, што вам трэба зрабіць, гэта выбраць мэтавае ўтрыманне і дазволіць вэб-скрабкам зрабіць усё астатняе.

Калі ў вас няма ведаў па кадаванні, гэта лепшы вэб-скрабок для разгляду. Google Chrome Scraper рэкамендуецца як для дробных, так і для маштабных выскрабанняў. Ён складаецца з каштоўнай інфармацыі і дадзеных, якія могуць быць ператвораны ў дадзеныя канкурэнтнай разведкі. Дзякуючы гэтаму пашырэнню ўсе вашы мэтавыя выявы і каталогі могуць быць лёгка здабыты і экспартаваны ў CouchDB або электронныя табліцы.

Кіраўніцтва, як пачаць працаваць

Скраблінг вэб-старонак з убудовай для браўзэра - гэта самастойная задача, якую можна хутка выканаць на ПК. Вось канчатковае кіраўніцтва, якое дапаможа вам пачаць:

  • Запусціце браўзэр Google Chrome і націсніце "Chrome Web Store".
  • Адкрыйце пашырэнні браўзэра і знайдзіце "Скрапер".
  • Націсніце на "Дадаць у Chrome" варыянт, які адлюстроўваецца на экране
  • Адкрыйце вэб-сайт або вэб-старонку, каб яе саскрэсці, і вылучыце дадзеныя, якія трэба атрымаць. Пстрыкніце правай кнопкай мышы на элеменце і націсніце «Скрап падобны».
  • На экране з'явіцца кансоль скрабка. Звярніце ўвагу, што кансоль вэб-скрэпера складаецца з здабытых дадзеных.
  • На гэтым этапе вы можаце вырашыць, дзе захаваць выскаблівае змесціва. Напрыклад, вы можаце захаваць змесціва ў дакументах Google, націснуўшы на кнопку "Захаваць у дакументах Google".

Звярніце ўвагу, што "скрабок" - гэта аўтаматызаваны сцэнар, які здабывае карысныя дадзеныя з дынамічных вэб-старонак і сайтаў. У адрозненне ад іншых інструментаў для выскрабання ў Інтэрнэце, Google Chrome можа таксама саскрэбіць дадзеныя, згенераваныя JavaScript. Іншыя задачы, выкананыя ўбудовам Chrome scraper, ўключаюць:

  • Націсканне на кнопкі змесціва для загрузкі дадзеных;
  • Націсканне на кнопкі раздзелкі, якія загружаюць інфармацыю пры дапамозе AJAX;
  • Пракручванне вэб-старонак, каб загрузіць больш змесціва;
  • У чаканні загрузкі дынамічнага змесціва на вэб-старонку;

Пасля выскрабання дадзеных з вэб-старонкі вы можаце загрузіць дадзеныя ў фармаце, падзеленым коскай (CSV), альбо захаваць іх у CouchDB. З дапамогай Google Chrome Web Scraper вам не прыйдзецца працаваць над выманнем дадзеных, стварэннем плана альбо экспартам.

mass gmail