Користите Екцел као алат за копирање података са Веба

Веб(Web) стругање је чин издвајања података, информација или слика са веб локације помоћу аутоматизоване методе. Замислите(Think) то као потпуно аутоматско копирање и лепљење.

Или пишемо или користимо апликацију да бисмо отишли ​​на веб локације на које желимо и направили копију одређених ствари које желимо са тих веб локација. То је много прецизније од преузимања целе веб локације(downloading an entire website) .

Као и сваки други алат, веб стругање се може користити за добро или за зло. Неки од бољих разлога за брисање веб локација били би рангирање у претраживачу на основу његовог садржаја, куповине у поређењу са ценама или праћења информација о берзи. Можете га чак користити као својеврсно истраживачко средство.

Како могу да сцрапе веб странице помоћу програма Екцел(Excel) ?

Веровали или не, Екцел(Excel) већ дуже време има могућност да издваја податке са веб локација, барем од Екцел-а 2003(Excel 2003) . Само што је веб стругање нешто о чему већина људи не размишља, а камоли да користи програм за табеларне прорачуне за обављање посла. Али то је изненађујуће лако и моћно. Хајде да научимо како се то ради тако што ћемо направити колекцију Мицрософт Оффице(Microsoft Office) пречица на тастатури.

Пронађите сајтове које желите да сцрапете

Прва ствар коју ћемо урадити је да пронађемо одређене веб странице са којих желимо да добијемо информације. Идемо до извора и претражимо на https://support.office.com/ . Користићемо термин за претрагу „често коришћене пречице“. Можемо га учинити конкретнијим коришћењем назива одређене апликације, као што су Оутлоок(Outlook) , Екцел(Excel) , Ворд(Word) итд. Можда би било добро да обележите страницу са резултатима како бисмо се тамо могли лако вратити.

Кликните(Click) на резултат претраге „Пречице на тастатури у програму Екцел(Excel) за Виндовс“. Када сте на тој страници, пронађите листу верзија програма Екцел(Excel) и кликните на Новије верзије(Newer Versions) . Сада радимо са најновијим и најбољим.

Могли бисмо да се вратимо на нашу страницу са резултатима претраге и отворимо резултате за све остале Оффице(Office) апликације у њиховим картицама и обележимо их. То је добра идеја, чак и за ову вежбу. Овде би се већина људи зауставила у прикупљању Оффице(Office) пречица, али не и ми. Ставићемо их у Екцел(Excel) тако да можемо да радимо шта год желимо са њима, кад год желимо.

Отворите Екцел и Сцрапе

Отворите Екцел(Excel) и покрените нову радну свеску. Сачувајте радну свеску као Оффице пречице(Office Shortcuts) . Ако имате ОнеДриве, сачувајте га тамо да би функција АутоСаве(AutoSave ) радила.

Када је радна свеска сачувана, кликните на картицу Подаци(Data) .

На траци картице Подаци кликните на (Data)Са веба(From Web) .

Отвориће се прозор Чаробњака са веба . (From Web )Овде стављамо веб адресу или УРЛ(URL) веб локације са које желимо да извучемо податке. Пређите на свој веб претраживач и копирајте(copy) УРЛ.

Налепите УРЛ у УРЛ(URL) поље чаробњака Са веба . (From Web)Могли бисмо изабрати да користимо ово у основном(Basic) или напредном(Advanced) режиму. Напредни режим нам даје много више опција како да приступимо подацима са веб локације . (Advanced)За ову вежбу потребан нам је само основни режим. Кликните (Click) на ОК(OK) .

Екцел(Excel) ће сада покушати да се повеже на веб локацију. Ово може потрајати неколико секунди. Видећемо прозор напретка, ако јесте.

Прозор Навигатор(Navigator) ће се отворити и видећемо листу табела са веб локације са леве стране. Када га одаберемо, видећемо преглед табеле са десне стране. Хајде да изаберемо табелу Често коришћене пречице .(Frequently used shortcuts )

Можемо да кликнемо на картицу Веб приказ(Web View) да видимо стварну веб локацију, ако треба да потражимо табелу коју желимо. Када га пронађемо, можемо кликнути на њега и биће изабран за увоз.

Сада кликнемо на дугме Учитај(Load) на дну овог прозора. Постоје и друге опције које можемо изабрати, које су сложеније и ван оквира нашег првог прегледа. Само будите свесни да су они тамо. Ексцел-ове могућности веб сцрапинг-а су веома моћне.

Веб табела ће се учитати у Екцел(Excel) након неколико секунди. Видећемо податке са леве стране, где је број 1 на слици испод. Број 2 истиче упит(Query) који се користи за добијање података са веб локације. Када имамо више упита у радној свесци, овде бирамо онај који треба да користимо.

Обратите пажњу(Notice) да подаци долазе у табелу као Екцел(Excel) табела. Већ је подешено да можемо да филтрирамо или сортирамо податке.

Овај процес можемо поновити за све друге веб странице које имају Оффице(Office) пречице које желимо за Оутлоок(Outlook) , Ворд(Word) , Аццесс(Access) , ПоверПоинт(PowerPoint) и било коју другу Оффице(Office) апликацију.

Одржавање ажурираних података(Scraped Data Current) у Екцел -у(Excel)

Као бонус за вас, научићемо како да сачувамо ажуриране податке у Екцел(Excel) -у . Ово је одличан начин да се илуструје колико је Екцел(Excel) моћан за сцрапинг података. Чак и са овим, радимо само најосновније стругање које Екцел(Excel) може да уради.

За овај пример, користимо веб страницу са информацијама о акцијама као што је https://www.cnbc.com/stocks/ .

Прођите кроз оно што смо раније радили и копирајте и налепите нови УРЛ(URL) са траке за адресу.

Доћи ћете до прозора Навигатора(Navigator) и видети доступне табеле. Хајде да изаберемо главне америчке берзанске индексе(Major U.S. Stock Indices) .

Када се подаци извуку, видећемо следећу табелу.

На десној страни видимо упит за главне америчке берзанске индексе(Major U.S. Stock Indexes) . Изаберите(Select) то тако да буде истакнуто. Уверите(Make) се да смо на картици Алатке за табеле(Table Tools) и у области Дизајн(Design) . Затим кликните на стрелицу надоле испод Освежи(Refresh) . Затим кликните на Својства везе(Connection Properties) .

У прозору Својства упита , на картици (Query Properties )Употреба(Usage) , можемо да контролишемо како се ове информације освежавају. Можемо да подесимо одређени временски период за освежавање или за освежавање када следећи пут отворимо радну свеску, или за освежавање у позадини, или било коју комбинацију овога. Када изаберемо шта нам треба, кликните на ОК(OK) да затворите прозор и наставите.

То је то! Сада можете пратити цене акција, спортске резултате или било које друге податке који се често мењају из Екцел(Excel) табеле. Ако сте добри са Екцел једначинама и функцијама(Excel equations and functions) , са подацима можете да радите скоро све што желите.

Можда покушајте да идентификујете трендове акција, водите фантастични спортски базен на послу или можда само пратите временске прилике. Ко зна? Ваша машта и подаци доступни на Интернету(Internet) су једина ограничења.



About the author

Ја сам софтверски инжењер и истраживач. Имам искуства са Мицрософт Ксбок 360 и Гоогле Екплорер-ом. У могућности сам да пружим стручне препоруке за одређене алате за развој софтвера, као и да помогнем људима да отклоне уобичајене грешке у програму Екплорер.



Related posts