أفضل ملحقات مكشطة ووردبريس - كيفية كشط المحتوى تلقائيًا؟
نشرت: 2021-02-09إذا كنت ترغب في إنشاء موقع لمقارنة الأسعار أو متجر دروبشيبينغ ، يمكن أن تكون الإضافات مكشطة WordPress مفيدة للغاية. يتألف تجريف الويب من جمع المعلومات من الويب. ثم يتم تنظيم هذه المعلومات أو استيرادها.
يعتبر بعض الناس القشط نشاطًا غير أخلاقي أو مشكوك فيه . في الواقع ، يمكن أن يساعدك تجريف الويب في البقاء مطلعًا على التغييرات. يمكن لمواقع مقارنة الأسعار استخدام البيانات المقتبسة لتزويد الزائرين بالمعلومات الأكثر دقة المتاحة.
هناك الكثير من ملحقات WordPress للتخلص من الملفات الإضافية المتاحة. في هذا المنشور ، سوف أذكر بعضًا من أفضل المكونات الإضافية لتتبع ارتباطات محتوى WordPress وميزاتها حتى تتمكن من اختيار الأداة المناسبة لاحتياجاتك.
أفضل ملحقات مكشطة ووردبريس
فيما يلي بعض من أفضل مكونات مكشطة محتوى WordPress التي يمكنك استخدامها. على الرغم من أنها خيارات مدفوعة ، إلا أنها مليئة بالميزات المفيدة.
كشط Octolooks
Octolooks Scrapes هو أكثر برامج زحف المحتوى تقدمًا ومكوِّن مكشطة WordPress الإضافي إلى حد بعيد. يستخدم محددًا مرئيًا لإلغاء المحتوى من أي موقع تلقائيًا. للعمل ، تحتاج إلى مطابقة المحدد المرئي مع حقل WordPress المقابل في الصفحة الهدف. لا تحتاج إلى أي معرفة أو خبرة برمجية.
تم إنشاء واجهة البرنامج سهلة الاستخدام لتوفير أفضل تجربة مستخدم ممكنة. يتم الانتهاء من التكوين في بضع خطوات أساسية فقط. يمكنك تركها في الخلفية ، وسيتم سحب المعلومات من مواقع الويب المصدر.
يمكنك إنشاء مهام جديدة للزحف أو استخدام الإعدادات الافتراضية. يمكنك أيضًا استخدام هذا البرنامج المساعد كمكوِّن إضافي لمجمع WordPress RSS.
تملأ القصاصات تلقائيًا جميع الحقول المدعومة. سيتطابق المكون الإضافي مكشطة Octolooks WordPress تلقائيًا مع الصفحة التالية والصورة المميزة والمحتوى والمعلومات المهمة الأخرى مع الحقول المقابلة لمواقع الويب المصدر.
يمكنك استخدام خيار النموذج لتخصيص تخطيطات المنشور واختيار الترتيب الذي ستظهر به المعلومات التي تزيلها على موقع الويب الخاص بك.
يمكن لميزة البحث والاستبدال للتعبير العادي إزالة كلمات أو عبارات معينة من النص المقتطع. يمكنك أيضًا استخدام كلماتك الخاصة لاستبدالها. لا توجد حدود لعدد القواعد التي يمكنك تشغيلها.
يمكن إجراء عمليات الطرح والجمع والقسمة والضرب والعمليات الحسابية الأخرى. يمكن لهذا المكون الإضافي لبرنامج زاحف محتوى WordPress إنشاء صيغ جديدة ودمج الأرقام في حقول مخصصة مختلفة.
يمكن لـ Yandex Translate أو DeepL Translate أو Bing Microsoft Translate أو Google Translate ترجمة المحتوى المسروق تلقائيًا . أو يمكنك ترجمة موقع WordPress تلقائيًا باستخدام ملحقات مثل Weglot (راجع مراجعة Weglot) و WPML (راجع مراجعة WPML).
يمكنك استخدام أحد مكونات WordPress auto spinner الإضافية لتغيير المحتوى المسروق أو السماح لخدمة spinner لجهة خارجية مثل WordAi (راجع مراجعة WordAi) و Spin Rewriter (راجع مراجعة Spin Rewriter) للقيام بالعمل نيابة عنك.
يمكن تصفية المعلومات المأخوذة من مواقع الويب المصدر للتأكد من أنها تفي بالقواعد المحددة. راقب المحتوى للتأكد من أنه يمر بنجاح من عوامل التصفية إلى موقعك.
يمكن استخدام دعم الحقول المخصصة ونوع المنشور المخصص من متجر WooCommerce لكشط المحتوى في شكل منتجات.
المستورد الخارجي Pro
يسمح لك المكون الإضافي External Importer Pro باستخراج بيانات المنتج من مواقع التجارة الإلكترونية واستيرادها إلى موقع WooCommerce. لا يلزم الدخول إلى واجهة برمجة التطبيقات أو خلاصات CSV أو XML.
يستخرج المكون الإضافي بيانات المنتج الكاملة مباشرة من مواقع المتجر. كل ما عليك فعله هو إدخال القائمة المحددة أو عنوان URL للمنتج. لا توجد ملفات CSV ضخمة أو وصول لواجهة برمجة التطبيقات للتعامل معها. يتم تحديث توفر المنتج والأسعار تلقائيًا . يمكنك إدارة كل جانب من جوانب المعلومات المستوردة.
سيتم استخدام IDS الحالي الخاص بك تلقائيًا (إذا قمت بإضافتها عبر خيارات الإعداد) عند إنشاء روابط تابعة. يمكنك حتى تعيين هوامش منتج دروبشيبينغ إذا كنت ترغب في استيراد المنتجات لأغراض دروبشيبينغ.
سمات:
- المزامنة التلقائية - يتم تحديث معلومات الأسعار وتوافر المنتج تلقائيًا. يمكن إزالة أي منتجات غير متوفرة حاليًا تلقائيًا. تتم جدولة التحديثات في الخلفية حتى لا تتداخل مع أي عمليات أخرى.
- الاستيراد التلقائي - بمجرد ظهور المنتجات الجديدة على صفحة قائمة الموقع المستهدف ، سيتم أيضًا استيرادها تلقائيًا إلى موقع الويب الخاص بك. سيكون لديك دائمًا أحدث المنتجات في متجرك.
- منتجات غير محدودة - القدرة على استيراد أي عدد تريده من المنتجات. يمكنك استيراد عدد غير محدود من العناصر من أي عدد تريده من مواقع المتاجر عبر الإنترنت.
- تجنب الحظر - سيقرأ البرنامج المساعد ويلتزم بجلسات ملفات تعريف الارتباط ، وحصص الاستعلام اليومية ، وفترات الاستعلام العشوائية ، ورؤوس المتصفحات الحقيقية ، وقواعد robots.txt ، وتناوب وكلاء المستخدم ، وتقييد الطلبات ، وما إلى ذلك ، حتى لا تحصل على منعت.
- استخدم الشبكات التابعة - استخدم روابط عميقة أو قم بتغييرها ديناميكيًا لإنشاء روابط تابعة.
- ميزات دروبشيبينغ - يمكنك إنشاء متجر دروبشيبينغ ، ويمكن إضافة العناصر كمنتجات WooCommerce "بسيطة". يمكن وضع قواعد مرنة لعلامات الأسعار.
- السمات المحلية والعالمية - يمكنك تحديد مواصفات المنتج المعينة كسمات عامة (أو تصنيفات). يمكنك بعد ذلك تنفيذ عوامل تصفية وعناصر واجهة مستخدم كتالوج WooCommerce المختلفة.
- الصور الخارجية حسب URL - القدرة على عرض الصور الخارجية دون حفظها في مكتبة وسائط محلية. يمكن كشط مواقع المصادر الخارجية لسحب المعارض والصور المميزة التي تريد عرضها على موقعك. سيؤدي ذلك إلى تقليل مقدار تخزين القرص الصلب على الخادم الخاص بك بشكل كبير.
- الفئات الديناميكية - سيتم استيراد المنتجات ذات مسارات الفئات المستخرجة تلقائيًا إلى الفئة المقابلة.
لمزيد من المعلومات حول هذا المكون الإضافي لزاحف المحتوى لـ WordPress ، يمكنك التحقق من مراجعة External Importer Pro الخاصة بي.
زاحف محتوى WP
يمكن للمكون الإضافي WP Content Crawler استخراج المعلومات تلقائيًا من أي موقع تقريبًا. يستخدم محددات CSS للعثور على المحتوى. يستخدم أداة Visual Inspector التي تبسط العثور على محددات CSS من خلال النقر على العناصر المعنية في المواقع المستهدفة.
سمات:
- الفاحص المرئي - سيؤدي النقر فوق أحد العناصر إلى تحديد محدد CSS لهذا العنصر. يمكنك أيضًا العثور على محددات CSS بديلة يمكن استخدامها. لست مضطرًا إلى مغادرة لوحة الإدارة لإنجاز هذه المهام.
- الزحف إلى المنشورات (كشط ، انتزاع وحفظ) - بمجرد تحديد عناوين URL المنشورة ، سيقوم زاحف محتوى WordPress بالزحف إليها تلقائيًا في الخلفية. سيحدث هذا بعد تكوين الإعدادات.
- إعادة الزحف (تحديث) المنشورات - يمكن إعادة الزحف إلى المنشورات تلقائيًا للتأكد من أن لديك أحدث محتوى. يمكنك اختيار تجاهل المنشورات القديمة وتحديد الفاصل الزمني للتحديث وتحديد عدد المرات التي يمكن فيها تحديث منشور معين.
- قوالب المحتوى - يمكن استخدام الرموز القصيرة لإنشاء معرض ، وعنصر قائمة ، وعنوان ، ومحتوى منشور ، وقوالب مقتطفات. يمكنك استخدام مربع الخيارات لإنشاء قوالب لجميع قيم محدد CSS.
- المشاركات المرقمة - يمكن أيضًا حفظ المشاركات المرقمة. ليس عليك قصر عمليات البحث على منشورات صفحة واحدة بعد الآن.
- إعدادات عامة مخصصة لكل موقع - يمكن ضبط الإعدادات العامة المخصصة لكل منشور.
- حفظ جميع الصور - يمكنك حفظ جميع الصور في محتوى المنشور.
- حفظ الصور كمعرض - يمكن حفظ الصور الموجودة على الصفحة المستهدفة كمعرض.
- خيارات الوكيل - إذا لم يكن لدى IP الخاص بك حق الوصول إلى موقع معين ، فيمكنك استخدام وكيل واحد أو أكثر لسحب المعلومات من المواقع المستهدفة.
- الترجمة التلقائية - يمكن استخدام Amazon Translate API أو Google Cloud Translation API أو Microsoft Translator Text API أو Yandex Translate API لترجمة المنشورات تلقائيًا.
- التدوير التلقائي - يمكن للدوران إعادة كتابة المحتوى الذي تم الزحف إليه تلقائيًا. هذا يمكن أن يساعد في زيادة تصنيفات محرك البحث الخاص بك. يوفر المكون الإضافي التكامل مع الخدمات المدفوعة مثل Turkce Spin API و Spin Rewriter API.
- حفظ منتجات WooCommerce - يمكن حفظ السمات والخيارات المتقدمة والمخزون والشحن وأسعار المنتجات. يمكن حفظ العناصر كمنتجات خارجية أو بسيطة. يمكنك أيضًا تحديد العناصر كعناصر افتراضية أو إنشاء خيار ملف قابل للتنزيل.
- التعبيرات العادية - يمكن تحديد التعبيرات العادية في خيارات "البحث عن الاستبدال". هذا يجعل من السهل العثور على أي شيء واستبداله. يمكن أيضًا تنفيذ المُعدِّلات والمحددات لتحسين عمليات البحث بشكل أكبر.
- حفظ سمات "alt" و "title" - يتم استرداد جميع سمات "title" و "alt" تلقائيًا من الموقع الهدف عند حفظ الصور. ثم يتم تعيين هذه السمات للصور المحفوظة المعنية. يمكن إنشاء القوالب لتتماشى مع استراتيجيات تحسين محرك البحث لديك.
- أداة الزحف اليدوي - يمكنك إدخال عناوين URL مختلفة لحفظ أكثر من منشور واحد في كل مرة باستخدام أداة الزحف اليدوية المساعدة. يمكن أيضًا إدخال عناوين URL الخاصة بالفئات للأداة للحصول على عناوين URL المناسبة للنشر. يمكنك ضبط الزاحف على الزحف إلى مشاركات مختلفة في وقت واحد.
مكشطة - مكون زاحف المحتوى لبرنامج WordPress
المكوّن الإضافي Scraper Content Crawler لـ WordPress هو مكون إضافي يقوم تلقائيًا بنسخ المحتوى والنشر من أي موقع. يأخذ إنشاء المحتوى إلى مستوى آخر بميزاته ووظائفه الفريدة.
سمات:
- يمكن كشط أي موقع ويب - يعني استخدام أساليب Regex و Xpath أنه يمكنك كشط أي موقع تريده.
- يمكنك كشط السمات - يمكن للمكشطة أيضًا استرداد سمات العنصر. هذا يعني أنه يمكنك الحصول على روابط ومصادر صور ومصادر فيديو.
- صورة مميزة - يمكن استخراج أي صورة وتعيينها كصورة مميزة.
- أداة تدوير المحتوى - المكون الإضافي AI Spinner مدعوم بالكامل. يمكنك استخدام هذا البرنامج المساعد لإنشاء محتوى فريد.
- ترجمة اللغة - ستكتشف أداة الكشط المحتوى تلقائيًا ، والذي يمكن بعد ذلك ترجمته إلى أي لغة تفضلها.
- صور المعرض - يمكن تحليل أي صورة. يمكنك استخدام هذه الصور لإنشاء معارض الصور.
- منتجات WooCommerce - جميع علامات WooCommerce مدعومة أيضًا. هذا يبسط إضافة منتجات WooCommerce إلى متجرك.
- الحسابات الرياضية - يمكن للوظائف الرياضية طرح أو جمع أو تقسيم أو ضرب الأرقام. قد يكون هذا مفيدًا في حسابات الأسعار.
- جدولة المهام - يمكنك تعيين المهام التي يتعين إجراؤها على فترات زمنية مختلفة.
- روابط الشريط - نزع الروابط من محتوى المنشور الأصلي.
- دعم الوكيل - يمكنك استخدام الوكلاء لأغراض التجريف.
مكشطة متعددة المواقع الزاحفة
البرنامج المساعد Crawlomatic Multisite Scraper هو عبارة عن مكشطة تزحف إلى مواقع الويب وتجريفها ، ومكوِّن إضافي للمدونات التلقائية. لا تحتاج لواجهة برمجة التطبيقات لتتخلص من المحتوى.
سيقوم هذا المكون الإضافي بالزحف إلى عنوان URL (سيبحث في جميع الروابط الموجودة على الصفحة) ، ويزور ويستخرج المحتوى من كل عنوان URL تم الزحف إليه. عملية الزحف قابلة للتخصيص . يمكنك تعيين عمق الزحف ، ومعدل الزحف ، والحد الأقصى لعدد المقالات التي تم الزحف إليها ، والزحف فقط إلى الروابط ذات فئة أو معرف معين ، وما إلى ذلك.
يمكنك كشط المحتوى من كل موقع تقريبًا. إذا تم تحميل المحتوى باستخدام JavaScript ، فيمكن دمج المكون الإضافي مع PhantomJS لكشط المحتوى الذي تم إنشاؤه بواسطة JavaScript.
سمات:
- يتم دعم الزحف إلى ملفات Sitemap بشكل كامل.
- دعم محدد المحتوى المرئي.
- يمكنك ترقيم صفحات الزحف إلى الموقع. سيتم استئناف تتبع ارتباطات المقالة في الصفحة التالية من الموقع المستهدف.
- يمكنك استيراد أسعار جميع المنتجات التي تم الزحف إليها (للمواقع المتوافقة مع WooCommerce). يتم تعديل أسعار دروبشيبينغ تلقائيًا وفقًا لذلك.
- يمكنك رفع أسعار الأصناف المستوردة برقم محدد مسبقًا. يمكنك أيضًا مضاعفة المبلغ برقم محدد ، وهو خيار مفيد للمتسربين.
- يمكن استخدام الوكلاء للزحف.
- إذا لم تتمكن من توجيه الزحف (إذا كنت محظورًا ، على سبيل المثال) ، فيمكنك دائمًا الزحف إلى صفحة معينة من ذاكرة التخزين المؤقت لـ Google.
- جوجل دعم الترجمة. يمكنك اختيار اللغة التي تريد أن تظهر بها مقالات موقعك.
- كما يتم دعم المراوح النصية بشكل كامل. يمكنك تغيير النص الذي يتم إنشاؤه تلقائيًا. يمكن تغيير الكلمات بمرادفاتها إذا كنت تفضل ذلك. يمكن استخدام SpinRewriter و The Best Spinner و TurkceSpin و WordAI وغيرها.
- يمكن تكوين كشط الموقع والزحف لاحترام رؤوس HTML الخاصة بالروبوتات للصفحات المقطوعة وملفات robots.txt للمواقع التي تم كشطها.
- يمكن إنشاء العلامات ونشر فئات المنتجات تلقائيًا.
- يمكن استخدام الزحف إلى موقع الويب وكشطه لتضمين مقاطع فيديو DailyMotion أو Flickr أو IGN أو Ustream.tv أو Vimeo أو YouTube.
مكشطة الفسفور الابيض
البرنامج المساعد التلقائي ووردبريس
يعد WordPress Automatic plugin أداة ملائمة يمكنها النشر تلقائيًا على WordPress من أي موقع تقريبًا. هناك الكثير من تحديدات الاستيراد.
إلى جانب المقالات المعتادة ، يمكنك أيضًا استيراد المحتوى التالي: منتجات Amazon و Walmart ، YouTube ، Vimeo ، ومقاطع فيديو DailyMotion ، صور Flickr و Instagram ، مزادات eBay ، منشورات الوسائط الاجتماعية (التغريدات ، الدبابيس ، منشورات Reddit و Facebook) ، الإعلانات المبوبة من Craigslist ومحتوى iTunes (مثل الأغاني والبودكاست والتطبيقات والكتب الإلكترونية) وأغاني SoundCloud وحتى عناصر Envato.
يمكنك تحديد مصدر المحتوى وتطبيق خيارات التصفية حسب العلامة والمؤلف والفئة. هذا يعني أنه لن يتم استيراد كافة معلومات الهدف.
يمكنك اختيار الصور والتنسيق ونموذج المنشور والنوع والحالة التي سيحضرها المكون الإضافي. هناك أيضًا خيارات متقدمة للترجمة وإعادة الكتابة . يمكنك أيضًا استبدال بعض الكلمات تلقائيًا التي لا تريد عرضها على موقعك.
يمكنك تعيين حالات النشر سواء تم نشرها أو مسودة. يمكن استبعاد عبارات أو كلمات معينة. يمكنك أيضًا إزالة جميع الروابط قبل نشر أي منشور. يمكن ضبط الصور المميزة تلقائيًا.
يمكن تغيير الإعدادات ، لذلك يتم تخطي العناوين المكررة والمشاركات غير الإنجليزية والمشاركات بدون أي صور. تتم إضافة الحقول المخصصة تلقائيًا إلى المشاركات ، ويتم دعم المواقع المتعددة.
الفسفور الابيض روبوت
WP Robot هو مكون إضافي للتدوين التلقائي وتنظيم المحتوى . يسمح لك بإنشاء منشورات مدونة WordPress تلقائيًا عن طريق كشط المحتوى من المواقع الأخرى. إنه يغذي المعلومات المتعلقة بتخصصك أو مكانتك الخاصة. هذا يضمن أنك ستحصل دائمًا على أحدث محتوى.
يتم دعم أكثر من 30 مصدر محتوى ، ويتم تشغيل كل مصدر محتوى تلقائيًا. يمكن استخدامها في أي مجموعة تفضلها للعثور على محتوى عالي الجودة لموقعك على الويب. وفقًا لما تحتاجه ، هناك العديد من الطرق التي يمكن أن تساعدك بها هذه الأداة.
يمكن لـ WP Robot سحب المحتوى من مواقع التجارة الإلكترونية إذا كنت تبحث عن نشر منتجات من Amazon و AliExpress و Etsy وما إلى ذلك. يمكن للمكون الإضافي سحب الصور من Flickr و Pixabay والأغاني من iTunes و YouTube ومقاطع الفيديو Vimeo وما إلى ذلك.
Commission Junction و Linkshare هي بعض من الشبكات التابعة التي يدعمها WP Robot ، ويمكنك نشر العروض تلقائيًا منها. يمكن أيضًا إضافة محتوى موجز RSS إلى موقعك. إذا كنت تريد أكثر مما توفره الوحدات النمطية الحالية ، فيمكن أن يمنحك ذلك بعض الحرية الإضافية. لمزيد من المعلومات ، تأكد من مراجعة تقييم WP Robot الخاص بي.
خاتمة ملحقات مكشطة ووردبريس
يكتسب تجريف الويب (المعروف أيضًا باسم حصاد الويب ، واستخراج بيانات الويب ، وكشط الشاشة) معلومات واسعة من مواقع مختلفة. ثم يتم حفظ هذه البيانات في موقع ويب آخر أو قاعدة بيانات. تتطلب العديد من حلول تجريف الويب معرفة إضافية ويمكن أن تكون معقدة نوعًا ما. باستخدام المكونات الإضافية مكشطة WordPress المذكورة ، يعد تجريف المحتوى أمرًا سهلاً للغاية.
إذا كنت ترغب في إنشاء متجر تابع أو موقع مقارنة أسعار أو موقع صفقات أو متجر دروبشيبينغ ، فستحتاج إلى إضافة منتجات إلى موقعك. إنها طريقة أفضل لأتمتة هذه العملية بدلاً من إضافة المنتجات يدويًا.
لهذا الغرض ، ستحتاج إلى مكون إضافي جيد لاستيراد المنتجات . في حين أن هناك العديد من الحلول المتاحة ، فإن معظمها يتطلب أن يكون لديك موجز أو واجهة برمجة تطبيقات سيتم استخدامها لاستيراد المنتجات.
ولكن ماذا لو لم يكن لديك تغذية؟ ماذا بعد؟ كيف تستورد المنتجات إلى الموقع إذا لم يكن لديك حق الوصول إلى الخلاصات؟ في هذه الحالة ، ستحتاج إلى مكون إضافي مكشطة ويب WordPress.