Webové škrábání je úkon získávání dat, informací nebo obrázků z webových stránek pomocí automatizované metody. Přemýšlejte o tom jako kopírování a vkládání na plně automatické.
Budeme buď psát nebo používat aplikaci jít na webové stránky, které chceme, a vytvořit kopii konkrétní věci, které chceme z těchto webových stránek. Je to mnohem přesnější než stahování celé webové stránky.
Stejně jako jakýkoli jiný nástroj může být web škrábání použito pro dobro nebo zlo.
Některé z lepších důvodů pro škrábání webové stránky by bylo pořadí v
vyhledávače založené na jeho obsahu, nákupech cenového srovnání nebo sledování
informace o akciovém trhu. Můžete ji dokonce použít jako výzkumný nástroj.
Jak mohu Scrape webové stránky s aplikací Excel?
Věřte tomu nebo ne, Excel má schopnost extrahovat data
z webových stránek po dlouhou dobu, alespoň od Excelu 2003. Je to jen ten web
škrábání je něco, co si většina lidí nemyslí, natož přemýšlet o použití
práci s tabulkovým procesorem. Ale je to překvapivě snadné a mocné.
Pojďme se dozvědět, jak se to dělá tak, že vytvoříte sbírku klávesnice Microsoft Office
zkratky.
Najít stránky, které chcete škrábat
První věc, kterou budeme dělat, je najít konkrétní webové stránky, ze kterých chceme získat informace. Pojďme se podívat na zdroj a hledat https://support.office.com/. Použijeme hledaný výraz „často používané zkratky“. Můžeme to učinit konkrétnější pomocí názvu konkrétní aplikace, jako je aplikace Outlook, Excel, Word a tak dále. Může být vhodné si stránku s výsledky označit záložkou, abychom se tam mohli snadno dostat.
Klikněte na výsledek hledání „Klávesové zkratky v aplikaci Excel pro
Windows“. Na této stránce najděte seznam verzí aplikace Excel a klikněte na Novější verze. Nyní pracujeme
nejnovější a největší.
Mohli bychom se vrátit na stránku s výsledky vyhledávání a otevřít stránku
Výsledky pro všechny ostatní aplikace sady Office v jejich vlastních záložkách a jejich záložky. To je
dobrý nápad, dokonce i pro toto cvičení. Tam by se většina lidí zastavila
sbírání zástupců Office, ale ne nás. Dáme je do Excelu, takže my
Můžeme s nimi dělat, co chceme, kdykoliv chceme.
Otevřete Excel a Scrape
Otevřete aplikaci Excel a spusťte nový sešit. Uložte sešit jako Klávesové zkratky sady Office. Pokud máte OneDrive,
zachránit to tam AutoSave vlastnost
bude pracovat.
Jakmile je sešit uložen, klepněte na tlačítko Data Karta.
Na pásu karet Data klepněte na z webu.
Projekt z webu kouzelník
se otevře okno. Zde umístíme webovou adresu nebo adresu URL webové stránky
z nichž chceme data oškrabat. Přepněte do webového prohlížeče a kopie adresu URL.
Vložte adresu URL do pole URL
v Průvodci webem. Mohli bychom se rozhodnout, že to použijeme Basic or pokročilý režimu. Pokročilý režim nám poskytuje mnohem více možností, jak
přístup k datům z webových stránek. Pro toto cvičení potřebujeme jen Basic
režimu. Klikněte na OK.
Excel se nyní pokusí připojit k webu. To může
trvat několik sekund. Pokud ano, zobrazí se okno s průběhem.
Projekt Navigator
Otevře se okno a zobrazí se seznam tabulek z webové stránky vlevo.
Když ho vybereme, na pravé straně se zobrazí náhled tabulky. Pojďme si vybrat Často používané zkratky tabulka.
Můžeme kliknout na Web
Pohled Chcete-li zobrazit tabulku, podívejte se na kartu
chceme. Když ho najdeme, můžeme na něj kliknout a bude vybrán pro
import.
Nyní klikneme na Zatížení
v dolní části tohoto okna. Existují i další možnosti, které bychom si mohli vybrat,
které jsou složitější a nad rámec našeho prvního škrábání. Být jen
vědomi, že tam jsou. Excel je web škrabání schopnosti jsou velmi silné.
Po několika sekundách bude webová tabulka načtena do Excelu.
Uvidíme data vlevo, kde je číslo 1 je na obrázku níže. Číslo 2 zdůrazňuje Dotaz
slouží k získávání dat z webových stránek. Když máme v práci více dotazů
kniha, to je místo, kde vybereme ten, který potřebujeme použít.
Všimněte si, že data přichází do tabulky jako Excel
stůl. Je již nastaveno, abychom mohli data filtrovat nebo třídit.
Tento proces můžeme opakovat pro všechny ostatní webové stránky, které
mít zástupce aplikace Office, které chceme pro aplikaci Outlook, Word, Access, PowerPoint,
a jakékoli jiné aplikace Office.
Udržování aktuálních dat v aplikaci Excel
Jako bonus pro vás se budeme učit, jak udržet naše
scraped data čerstvá v aplikaci Excel. To je skvělý způsob, jak ilustrovat, jak
výkonný Excel je pro škrábání dat. I s tím děláme jen nejvíce
základní škrábání, které Excel může udělat.
Pro tento příklad použijte webovou stránku s informacemi o akciích https://www.cnbc.com/stocks/.
Projděte to, co jsme udělali dříve, a zkopírujte a vložte novou adresu URL z adresního řádku.
Dostanete se do okna Navigátor a uvidíte dostupné tabulky. Pojďme si vybrat hlavní americké akciové indexy.
Jakmile jsou data seškrabána, uvidíme následující
tabulky.
Vpravo vidíme dotaz na Hlavní americké akciové indexy.
Vyberte, aby byla zvýrazněna. Ujistěte se, že jsme v Nástroje tabulky a na kartě Design
plocha. Poté klikněte na šipku dolů Obnovit.
Pak klikněte na Vlastnosti připojení.
v Dotaz
Nemovitosti okno, pod Používání
Na této záložce můžeme řídit, jak se tyto informace obnovují. Můžeme nastavit konkrétní čas
nebo aktualizovat při dalším otevření sešitu nebo
aktualizovat na pozadí nebo jakoukoliv jejich kombinací. Jakmile si vybereme to, co my
potřebujete, klikněte na OK zavřít
a pokračujte.
A je to! Nyní můžete sledovat ceny akcií, sportovní výsledky nebo jiná data, která se často mění z tabulky aplikace Excel. Jestli je to dobré Excel rovnice a funkce, s daty můžete dělat téměř vše, co chcete.
Možná se snažíte identifikovat akciové trendy, provozovat fantasy sportovní bazén v práci, nebo možná jen sledovat počasí. Kdo ví? Vaše představivost a data dostupná na internetu jsou jedinými limity.