Najlepsze wtyczki WordPress Scraper – jak automatycznie zeskrobać zawartość?

Opublikowany: 2021-02-09

Jeśli chcesz stworzyć porównywarkę cen lub sklep dropshipping, wtyczki skrobaka WordPress mogą być bardzo przydatne. Web scraping polega na zbieraniu informacji z sieci. Informacje te są następnie porządkowane lub importowane.

Niektórzy ludzie uważają skrobanie za nieetyczne lub wątpliwe działanie . W rzeczywistości web scraping może pomóc Ci być na bieżąco ze zmianami. Witryny porównujące ceny mogą wykorzystywać zeskrobane dane, aby zapewnić odwiedzającym najdokładniejsze dostępne informacje.

Dostępnych jest wiele wtyczek do skrobania WordPress. W tym poście wymienię niektóre z najlepszych wtyczek do indeksowania treści WordPress i ich funkcje, abyś mógł wybrać odpowiednie narzędzie do swoich potrzeb.

Spis treści

Najlepsze wtyczki WordPress Scraper

Oto niektóre z najlepszych wtyczek do skrobania treści WordPress, których możesz użyć. Chociaż są to opcje płatne, wszystkie są wyposażone w przydatne funkcje.

Zadrapania Octolooka

Octolooks Scrapes to zdecydowanie najbardziej zaawansowany przeszukiwacz treści i wtyczka skrobaka WordPress. Używa wizualnego selektora do automatycznego usuwania treści z dowolnej witryny. Aby pracować, musisz dopasować wizualny selektor do odpowiedniego pola WordPress na stronie docelowej. Nie potrzebujesz żadnej wiedzy programistycznej ani doświadczenia.

Łatwy w użyciu interfejs wtyczki został stworzony, aby zapewnić jak najlepsze wrażenia użytkownika. Konfiguracja odbywa się w zaledwie kilku podstawowych krokach. Możesz zostawić to w tle, a informacje będą pobierane ze stron źródłowych.

Możesz utworzyć nowe zadania do indeksowania lub użyć ustawień domyślnych. Możesz również użyć tej wtyczki jako wtyczki do agregatora RSS WordPress .

Scrapes automatycznie wypełnia wszystkie obsługiwane pola. Wtyczka skrobaka Octolooks WordPress automatycznie dopasuje następną stronę, polecany obraz, treść i inne ważne informacje do odpowiednich pól witryny źródłowej.

Wtyczka do indeksowania treści dla WordPress.

Możesz użyć opcji szablonu, aby spersonalizować układy postów i wybrać, w jakiej kolejności zbierane informacje będą pojawiać się w Twojej witrynie.

Funkcja znajdowania i zastępowania wyrażeń regularnych może usuwać określone słowa lub frazy z zeskrobanego tekstu. Możesz również użyć własnych słów, aby je zastąpić. Nie ma ograniczeń co do liczby reguł, które możesz uruchomić.

Można wykonywać odejmowanie, dodawanie, dzielenie, mnożenie i inne operacje matematyczne . Ta wtyczka do indeksowania treści WordPress może tworzyć nowe formuły i łączyć liczby w różnych niestandardowych polach.

Tłumacz Yandex, Tłumacz DeepL, Tłumacz Bing Microsoft lub Tłumacz Google mogą automatycznie tłumaczyć pobrane treści . Lub możesz automatycznie przetłumaczyć witrynę WordPress za pomocą wtyczek takich jak Weglot (sprawdź recenzję Weglot) i WPML (patrz recenzja WPML).

Możesz użyć jednej z wtyczek WordPress auto spinner, aby zmienić zeskrobaną zawartość lub pozwolić zewnętrznym usługom spinner , takim jak WordAi (zobacz recenzję WordAi) i Spin Rewriter (sprawdź recenzję Spin Rewriter), wykonać pracę za Ciebie.

Informacje pozyskane z witryn źródłowych można filtrować, aby upewnić się, że spełniają ustalone zasady. Monitoruj zawartość, aby upewnić się, że pomyślnie przechodzi z filtrów do Twojej witryny.

Obsługa pól niestandardowych i niestandardowy typ postu ze sklepu WooCommerce mogą być używane do zeskrobywania treści w postaci produktów.

Zewnętrzny importer profesjonalny

Wtyczka External Importer Pro umożliwia wyodrębnienie danych produktów ze stron internetowych eCommerce i zaimportowanie ich do witryny WooCommerce. Nie jest potrzebny dostęp do interfejsu API, kanały CSV ani XML.

Wtyczka pobiera pełne dane produktów bezpośrednio ze stron sklepów. Wszystko, co musisz zrobić, to wpisać konkretny adres URL aukcji lub produktu. Nie ma do czynienia z obszernymi plikami CSV ani dostępem do interfejsu API . Dostępność produktów i ceny są aktualizowane automatycznie . Możesz zarządzać każdym aspektem importowanych informacji.

Przykład importu listy produktów zewnętrznego importera.

Twój istniejący identyfikator partnerski zostanie automatycznie użyty (jeśli dodałeś je za pomocą opcji ustawień) podczas tworzenia linków partnerskich. Możesz nawet ustawić marże na produkty dropshipping, jeśli chcesz importować produkty do celów dropshipping.

Cechy:

  • Automatyczna synchronizacja — informacje o dostępności produktów i cenach są aktualizowane automatycznie. Wszelkie produkty, których aktualnie nie ma w magazynie, mogą zostać automatycznie usunięte. Aktualizacje są planowane w tle, aby nie zakłócały innych operacji.
  • Import automatyczny — Gdy nowe produkty pojawią się na stronie z listą witryny docelowej, zostaną one również automatycznie zaimportowane do Twojej witryny. Zawsze będziesz mieć najnowsze produkty w swoim sklepie.
  • Nieograniczone produkty – możliwość importowania tylu produktów, ile chcesz. Możesz importować nieograniczoną liczbę przedmiotów z dowolnej liczby witryn sklepów internetowych.
  • Unikaj blokowania — wtyczka będzie czytać i przestrzegać sesji cookie, dziennych limitów zapytań, losowych interwałów zapytań, prawdziwych nagłówków przeglądarek, reguł robots.txt, rotacji agentów użytkownika, ograniczania żądań itp., dzięki czemu nie otrzymasz zablokowany.
  • Korzystaj z sieci afiliacyjnych – Używaj głębokich linków lub dynamicznie zmieniaj je, aby generować linki afiliacyjne.
  • Funkcje dropshipping – Możesz stworzyć sklep dropshipping, a przedmioty można dodawać jako „proste” produkty WooCommerce. Można ustawić elastyczne zasady dla narzutów cenowych.
  • Atrybuty lokalne i globalne — można określić specyfikacje produktu przypisane jako atrybuty globalne (lub taksonomie). Następnie możesz zaimplementować różne filtry i widżety katalogu WooCommerce.
  • Obrazy zewnętrzne według adresu URL — możliwość wyświetlania obrazów zewnętrznych bez zapisywania ich w lokalnej bibliotece multimediów. Zewnętrzne witryny źródłowe można zeskrobać, aby pobrać polecane galerie i obrazy, które chcesz pokazać w swojej witrynie. To znacznie zmniejszy ilość miejsca na dysku twardym na serwerze.
  • Kategorie dynamiczne – Produkty z wyodrębnionymi ścieżkami kategorii zostaną automatycznie zaimportowane do odpowiedniej kategorii.

Aby uzyskać więcej informacji o tej wtyczce do indeksowania treści dla WordPress, możesz zapoznać się z moją recenzją External Importer Pro.

Przeszukiwacz treści WP

Wtyczka WP Content Crawler może automatycznie wyodrębniać informacje z prawie każdej witryny. Używa selektorów CSS do wyszukiwania treści. Wykorzystuje narzędzie Visual Inspector, które upraszcza znajdowanie selektorów CSS, klikając odpowiednie elementy w docelowych witrynach.

Wtyczka do indeksowania treści WordPress.

Cechy:

  • Inspektor wizualny — kliknięcie elementu zidentyfikuje selektor CSS dla tego elementu. Możesz także znaleźć alternatywne selektory CSS, których można użyć. Nie musisz wychodzić z panelu administracyjnego, aby wykonać te zadania.
  • Indeksuj posty (zdrap, chwyć i zapisz) – Po zdefiniowaniu adresów URL postów ten robot indeksujący treści WordPress będzie je automatycznie indeksował w tle. Nastąpi to po skonfigurowaniu ustawień.
  • Ponowne indeksowanie (aktualizacja) postów — posty mogą być ponownie indeksowane automatycznie, aby zapewnić najbardziej aktualną treść. Możesz zdecydować się na ignorowanie starszych postów, wybrać interwał aktualizacji i ograniczyć liczbę aktualizacji danego posta.
  • Szablony treści — skrótów można używać do tworzenia galerii, elementu listy, tytułu, treści postu i szablonów fragmentów. Możesz użyć pola opcji, aby utworzyć szablony dla wszystkich wartości selektora CSS.
  • Posty podzielone na stronyposty podzielone na strony można również zapisywać. Nie musisz już ograniczać wyszukiwania do postów na jednej stronie.
  • Niestandardowe ustawienia ogólne dla każdej witryny — niestandardowe ustawienia ogólne można ustawić dla każdego posta.
  • Zapisz wszystkie obrazy — możesz zapisać wszystkie obrazy w treści posta.
  • Zapisz obrazy jako galerię — obrazy znalezione na stronie docelowej można zapisać jako galerię.
  • Opcje proxy — jeśli Twój adres IP nie ma dostępu do określonej witryny, możesz użyć jednego lub więcej serwerów proxy do pobierania informacji z witryn docelowych.
  • Automatyczne tłumaczenie – Amazon Translate API, Google Cloud Translation API, Microsoft Translator Text API lub Yandex Translate API mogą być używane do automatycznego tłumaczenia postów.
  • Automatyczne wirowanie — wirowanie może automatycznie przepisać zindeksowaną zawartość. Może to pomóc w zwiększeniu rankingu w wyszukiwarkach. Wtyczka oferuje integrację z płatnymi usługami, takimi jak Turkce Spin API i Spin Rewriter API.
  • Oszczędzaj produkty WooCommerce — można zapisać atrybuty, opcje zaawansowane, zapasy, wysyłkę i ceny produktów. Pozycje można zapisywać jako produkty zewnętrzne lub proste. Możesz również zdefiniować elementy jako wirtualne lub utworzyć opcję pliku do pobrania.
  • Wyrażenia regularnewyrażenia regularne można określić w opcjach „znajdź-zamień”. Ułatwia to znalezienie i zastąpienie czegokolwiek. Można również zaimplementować modyfikatory i ograniczniki w celu dalszego zawężenia wyszukiwania.
  • Zapisz atrybuty „alt” i „title” – wszystkie atrybuty „title” i „alt” są automatycznie pobierane z witryny docelowej podczas zapisywania obrazów. Te atrybuty są następnie przypisywane do odpowiednich zapisanych obrazów. Szablony można tworzyć w celu dostosowania do strategii optymalizacji wyszukiwarek.
  • Narzędzie do ręcznego indeksowania — możesz wprowadzić różne adresy URL, aby jednocześnie zapisać więcej niż jeden post, korzystając z narzędzia do ręcznego indeksowania. Adresy URL kategorii można również wprowadzić, aby narzędzie uzyskało odpowiednie adresy URL postów. Możesz ustawić robota indeksującego, aby jednocześnie indeksował różne posty.

Scraper – wtyczka Content Crawler dla WordPress

Wtyczka Scraper Content Crawler do WordPressa to wtyczka, która automatycznie kopiuje treści i publikuje z dowolnej witryny. Przenosi tworzenie treści na wyższy poziom dzięki swoim unikalnym cechom i funkcjom.

Wtyczka do skrobania treści WordPress.

Cechy:

  • Każda witryna może zostać zeskrobana – użycie metod Regex i Xpath oznacza, że ​​możesz zeskrobać dowolną witrynę.
  • Możesz zeskrobać atrybuty – Scraper może również pobierać atrybuty elementów. Oznacza to, że możesz uzyskać linki, źródła obrazów, źródła wideo.
  • Polecany obraz — dowolny obraz można wyodrębnić i ustawić jako polecany obraz.
  • Pokrętło zawartości — wtyczka AI Spinner jest w pełni obsługiwana. Możesz użyć tej wtyczki do tworzenia unikalnych treści.
  • Tłumaczenie na język — skrobak automatycznie wykryje treść, którą można następnie przetłumaczyć na dowolny preferowany język.
  • Obrazy z galerii — można przeanalizować dowolny obraz. Możesz użyć tych obrazów do tworzenia galerii obrazów.
  • Produkty WooCommerce – Obsługiwane są również wszystkie tagi WooCommerce. Upraszcza to dodawanie produktów WooCommerce do Twojego sklepu.
  • Obliczenia matematyczne — funkcje matematyczne mogą odejmować, dodawać, dzielić lub mnożyć liczby. Może się to przydać w kalkulacji cen.
  • Zaplanuj zadania — możesz przypisywać zadania do wykonania w różnych odstępach czasu.
  • Usuń linki — usuń linki z oryginalnej treści posta.
  • Wsparcie proxy — możesz używać serwerów proxy do scrapingu.

Zgarniacz wielostanowiskowy Crawlomatic

Wtyczka Crawlomatic Multisite Scraper to wtyczka do indeksowania i skrobania stron internetowych, wtyczka do autoblogowania generatora postów. Nie potrzebujesz API do scrapowania treści.

Ta wtyczka zaindeksuje adres URL (przeszuka wszystkie linki na stronie), odwiedzi i wyodrębni zawartość z każdego zindeksowanego adresu URL. Proces indeksowania można dostosować . Ustawiasz głębokość indeksowania, szybkość indeksowania, maksymalną liczbę indeksowanych artykułów, indeksujesz tylko linki o określonej klasie lub identyfikatorze itp.

Wtyczka skrobaka internetowego WordPress.

Możesz zeskrobać treści z prawie każdej witryny. Jeśli treść jest ładowana za pomocą JavaScript, wtyczka może być połączona z PhantomJS, aby zeskrobać treść wygenerowaną przez JavaScript.

Cechy:

  • Indeksowanie map witryn jest w pełni obsługiwane.
  • Obsługa wizualnego selektora treści.
  • Indeksowanie witryny można podzielić na strony. Indeksowanie artykułów zostanie wznowione na następnej stronie witryny docelowej.
  • Możesz importować ceny dla wszystkich indeksowanych produktów (dla witryn zgodnych z WooCommerce). Ceny dropshippingu są automatycznie dostosowywane.
  • Możesz podnieść ceny importowanych towarów o predefiniowaną liczbę. Możesz również pomnożyć kwotę przez ustaloną liczbę, co jest użyteczną opcją dla dropshipperów.
  • Do indeksowania można używać serwerów proxy.
  • Jeśli nie możesz indeksować bezpośrednio (jeśli na przykład jesteś zablokowany), zawsze możesz zaindeksować konkretną stronę z pamięci podręcznej Google.
  • Obsługiwany jest Tłumacz Google. Możesz wybrać język, w którym mają się pojawiać artykuły w Twojej witrynie.
  • W pełni obsługiwane są również przędzarki tekstowe. Możesz zmienić tekst, który jest generowany automatycznie. Słowa można zmienić wraz z ich synonimami, jeśli wolisz. Można użyć SpinRewriter, The Best Spinner, TurkceSpin, WordAI i innych.
  • Pobieranie i indeksowanie witryn można skonfigurować w taki sposób, aby uwzględniały nagłówki HTML robotów ze skanowanych stron i pliki robots.txt ze skanowanych witryn.
  • Tagi i kategorie postów produktów mogą być tworzone automatycznie.
  • Indeksowanie i skrobanie witryn internetowych może być używane do osadzania filmów DailyMotion, Flickr, IGN, Ustream.tv, Vimeo lub YouTube.

Skrobak WP Pro

Wtyczka WP Scraper Pro może wyodrębniać treści z różnych stron internetowych, które można następnie zaimportować do swoich postów i stron WordPress. Funkcja wielokrotnego zdrapywania umożliwia jednoczesne zbieranie treści z setek witryn. Można to zrobić w witrynie WordPress za pomocą interfejsu wizualnego.

Wizualne interfejsy pomagają wybrać dane przy użyciu z góry określonej konfiguracji lub pojedynczego zadrapania. Aby wybrać zawartość, zaznacz i zaznacz lub odznacz informacje, które chcesz zaimportować. Może to wyeliminować wszelkie bloki danych, które są nieistotne lub niepotrzebne.

Kategorie, obrazy, tagi i tytuły będą się wielokrotnie automatyzować w oparciu o przypisane reguły lub preselekcję. Pobiera również wszystkie adresy URL z wybranych witryn docelowych.

Automatyczna wtyczka WordPress

Wtyczka WordPress Automatic to wygodne narzędzie, które może automatycznie wysyłać do WordPressa z prawie każdej witryny. Istnieje wiele opcji importu.

Oprócz zwykłych artykułów możesz również importować następujące treści: produkty Amazon i Walmart, filmy z YouTube, Vimeo i DailyMotion, obrazy Flickr i Instagram, aukcje eBay, posty w mediach społecznościowych (tweety, szpilki, posty Reddit i Facebook), ogłoszenia z Craigslist, zawartość iTunes (taka jak utwory, podcasty, aplikacje, e-booki), utwory SoundCloud, a nawet elementy Envato.

Wordpress Automatic Plugin automatycznie publikuje posty z prawie każdej witryny do WordPressa.

Możesz wybrać źródło treści i zastosować opcje filtrowania według tagu, autora i kategorii. Oznacza to, że nie wszystkie informacje docelowe zostaną zaimportowane.

Możesz wybrać obrazy, format, szablon postu, typ i status, które pobierze wtyczka. Dostępne są również zaawansowane opcje tłumaczenia i przepisywania . Możesz nawet automatycznie zastąpić niektóre słowa, których nie chcesz wyświetlać w swojej witrynie.

Możesz ustawić statusy postów na opublikowane lub wersje robocze. Niektóre wyrażenia lub słowa można wykluczyć. Możesz także usunąć wszystkie linki przed opublikowaniem posta. Polecane obrazy mogą być ustawiane automatycznie.

Ustawienia można zmieniać, więc zduplikowane tytuły, posty w języku innym niż angielski i posty bez obrazów są pomijane. Pola niestandardowe są automatycznie dodawane do postów, a obsługa wielu witryn jest obsługiwana.

Robot WP

WP Robot to wtyczka do autoblogowania i kuracji treści . Umożliwia automatyczne tworzenie postów na blogu WordPress poprzez zbieranie treści z innych witryn. Kroplówka dostarcza informacje związane z twoją konkretną specjalnością lub niszą. Gwarantuje to, że zawsze będziesz mieć najbardziej aktualną zawartość.

opcje źródła robota wp
Po włączeniu źródła treści jego karta ustawień pojawi się powyżej.

Obsługiwanych jest ponad 30 źródeł treści , a każde źródło treści jest zautomatyzowane. Mogą być używane w dowolnej kombinacji, którą wolisz, aby znaleźć wysokiej jakości treści dla swojej witryny. W zależności od potrzeb istnieje wiele sposobów, w jakie to narzędzie może pomóc.

WP Robot może pobierać treści z witryn e-commerce, jeśli chcesz publikować produkty z Amazon, AliExpress, Etsy itp. Wtyczka może pobierać obrazy z Flickr i Pixabay, utwory z iTunes, YouTube, filmy Vimeo itp.

Commission Junction i Linkshare to niektóre z sieci afiliacyjnych obsługiwanych przez WP Robot i możesz automatycznie publikować z nich oferty. Treść kanału RSS można również dodać do swojej witryny. Jeśli chcesz więcej niż to, co zapewniają istniejące moduły, może to dać ci dodatkową swobodę. Aby uzyskać więcej informacji, sprawdź moją recenzję robota WP.

Podsumowanie wtyczek WordPress Scraper

Web scraping (znany również jako web harvesting, ekstrakcja danych z sieci i screen scraping) pozyskuje ogromne ilości informacji z różnych witryn. Dane te są następnie zapisywane na innej stronie internetowej lub w bazie danych. Wiele rozwiązań web scrapingu wymaga dodatkowej wiedzy i może być dość skomplikowanych. Korzystając ze wspomnianych wtyczek do skrobania WordPress, skrobanie treści jest bardzo łatwe.

Jeśli chcesz utworzyć sklep partnerski, porównywarkę cen, witrynę z ofertami lub sklep dropshipping, musisz dodać produkty do swojej witryny. Jest to lepszy sposób na zautomatyzowanie tego procesu zamiast ręcznego dodawania produktów.

W tym celu będziesz potrzebować dobrej wtyczki do importowania produktów . Chociaż dostępnych jest wiele rozwiązań, większość z nich wymaga posiadania pliku danych lub API, które będą używane do importowania produktów.

Ale co, jeśli nie masz kanału? Co wtedy? Jak zaimportować produkty do serwisu, jeśli nie masz dostępu do feedów? W takim przypadku będziesz potrzebować wtyczki skrobaka internetowego WordPress.