Bạn vừa tạo dựng một trang web? Tiếp đến bạn cần một Plugin có thể giúp bạn lấy nội dung từ các website khác. WP Content Crawler là phần mềm hữu ích dành cho bạn. Plugin Content Crawler có hơn 200 cài đặt để cho phép bạn không chỉ truy xuất nội dung mà còn truy xuất chúng theo cách bạn muốn. Chẳng hạn như có thể thay đổi HTML của các phần tử hiện có trong mã nguồn, xóa phần tử, thay đổi thuộc tính của phần tử, trao đổi giá trị của hai thuộc tính của một phần tử, tìm và thay thế bất kỳ thứ gì trong mã nguồn, gán các phần tử nhất định cho một mã ngắn và sử dụng chúng trong các mẫu. Để tìm hiểu nhiều hơn về công cụ này hãy xem bài viết bên dưới của chúng tôi!
WP Content Crawler là gì?
WP Content Crawler là một plugin WordPress lấy nội dung từ các website khác một cách dễ dàng và nhanh chóng (quét, lấy, truy xuất) thông tin từ hầu hết mọi trang web hiện có trên Internet. Nó sử dụng các bộ chọn CSS để định vị và truy xuất nội dung trong mã nguồn của trang web đích.
WP Content Crawler lấy dữ liệu bài viết từ các trang web về wordpress phù hợp với những trang tin tức hoặc mục đích lấy nội dung dữ liệu sản phẩm, dịch vụ từ các trang web của các đối thủ cạnh tranh để sửa lại và thay đổi cho phù hợp với yêu cầu bản thân, đỡ mất thời gian nhập thủ công.
Plugin đi kèm với trình kiểm tra trực quan mà bạn có thể sử dụng để nhấp vào một phần tử để tìm bộ chọn CSS của nó. Công cụ này cũng có khả năng tìm một bộ chọn CSS để tìm các mục tương tự như mục bạn nhấp vào. Tính năng này khá hữu ích nếu bạn muốn truy xuất, ví dụ, tất cả các URL trong một trang danh mục.
Ưu điểm nổi bật của WP Content Crawler
- Có thể lấy nội dung của bất kỳ trang web nào.
- Lấy sản phẩm từ trang web khác qua trang web mình hoàn toàn tự động.
- File hướng dẫn share trong phần ghi chú.
Nhược điểm
- Chính sách về tốc độ và bảo vệ
- Phân tích dữ liệu chậm
- Cần lập trình nâng cao
Tính năng của WP Content Crawler
- Tìm kiếm, thay thế các cụm từ một cách tự động.
- Xóa những thành phần không cần thiết của dữ liệu cần lấy.
- Tự động cập nhật dữ liệu mới hoặc dữ liệu sửa đổi theo trang nguồn.
- Tùy chỉnh mẫu đăng (template) để nội dung đăng tải khác so với trang nguồn.
- Lấy dữ liệu nhanh hơn so với việc đăng bài thủ công. Trung bình 12 bài/ phút có thể nhanh hơn nếu hosting khỏe hoặc làm trên localhost.
- Thay đổi giá sản phẩm tự động theo công thức đặt trước giảm/ tăng so với trang nguồn theo phần trăm hoặc số cố định.
Plugin Content Crawler hoạt động như thế nào?
Plugin Content Crawler hoạt động bằng cách sử dụng WP-Cron. Tính năng này của WordPress cho phép các plugin và chủ đề xác định các công việc nhất định sẽ được kích hoạt vào những thời điểm nhất định. Các công việc này được chạy ở chế độ nền. Plugin xác định các công việc để tự động thu thập thông tin, thu thập lại thông tin (cập nhật) và xóa bài đăng. Bằng cách này, plugin có thể chạy ở chế độ nền và tự động thực hiện tất cả các công việc của nó. Do đó, một WP-Cron hoạt động là một yêu cầu của plugin.
Những đặc điểm chính Plugin Content Crawler
Thu thập thông tin (quét, lấy, lưu) bài đăng
Sau khi cài đặt được định cấu hình, plugin sẽ tìm url của các bài đăng và tự động thu thập dữ liệu chúng trong nền.
Xóa bài viết
Bạn muốn xóa các bài đăng cũ đã được thu thập thông tin? plugin content crawler có thể xóa chúng tự động.
Lưu danh mục
Danh mục mục tiêu không tồn tại trong trang web của bạn? không vấn đề gì. plugin content crawler có thể tạo các danh mục mục tiêu cho bạn. chỉ cần xác định các bộ chọn css để tìm tên danh mục. chúng thậm chí có thể được tạo dưới dạng danh mục con.
Lưu các đơn vị phân loại
Lưu các giá trị phân loại bằng cách truy xuất chúng từ trang web đích hoặc nhập thủ công. lưu chi tiết của các loại bài đăng tùy chỉnh dễ dàng hơn bao giờ hết.
Meta bài đăng tùy chỉnh
Lưu bất cứ thứ gì dưới dạng meta bài đăng tùy chỉnh. bạn có thể sử dụng bộ chọn css hoặc chỉ nhập giá trị.
Bộ chọn thay thế
Bạn có thể viết các bộ chọn thay thế để lấy dữ liệu ngay cả khi trang web đích có các trang đăng được thiết kế khác nhau.
các bài đăng được phân trang. Mục tiêu bài viết có nhiều hơn một trang? đừng lo lắng. bạn cũng có thể lưu các bài đăng được phân trang.
Loại bỏ các yếu tố không cần thiết
Đôi khi bạn cần phải loại bỏ một số yếu tố, chẳng hạn như quảng cáo, bình luận, bạn đặt tên cho nó. chỉ cần viết bộ chọn css của nó và nó sẽ bị xóa.
Các loại bài đăng
Nó có thể là một bài đăng, một trang, một sản phẩm hoặc bất kỳ loại bài đăng nào khác có sẵn trong cài đặt wordpress của bạn.
Mật khẩu bảo vệ
Bạn có thể đặt mật khẩu cho các bài đăng để chỉ hiển thị chúng cho những người dùng có mật khẩu.
Kiểm tra mọi thứ một cách nhanh chóng
Kiểm tra thu thập thông tin bài đăng, thu thập url, bộ chọn css, biểu thức chính quy, tìm và thay thế các tùy chọn và proxy một cách nhanh chóng. bạn cũng có thể kích hoạt bộ nhớ đệm để thực hiện các bài kiểm tra nhanh hơn nhiều và giảm các yêu cầu được gửi đến trang web mục tiêu.
Công cụ
Bằng cách sử dụng các công cụ, bạn có thể lưu các bài đăng theo cách thủ công với url của chúng, thu thập lại thông tin các bài đăng bằng id của chúng hoặc xóa các url đã được lưu.
Trạng thái bài đăng
Bạn có thể trực tiếp xuất bản các bài đăng đã lưu hoặc giữ chúng dưới dạng bản nháp để kiểm tra chúng trước khi xuất bản.
Lưu hình ảnh dưới dạng thư viện
Bạn có thể lưu hình ảnh trong trang đích dưới dạng thư viện và cung cấp mẫu cho mỗi hình ảnh để làm cho hình ảnh phù hợp với thư viện thư viện mà bạn sử dụng trên giao diện người dùng. bạn cũng có thể lưu hình ảnh dưới dạng thư viện woocommerce chỉ bằng cách chọn một hộp kiểm.
Ủy quyền
Sử dụng proxy hoặc các proxy để lấy nội dung từ các trang web mà ip của bạn không có quyền truy cập.
Thu thập thông tin bao nhiêu bài đăng bạn muốn
Bạn có thể đặt số lần các sự kiện cron thu thập dữ liệu bài đăng hoặc thu thập url sẽ chạy. bằng cách này, bạn có thể lưu 100 bài viết mỗi phút. chỉ cần cẩn thận và xem xét công suất máy chủ của bạn.
Nhận dữ liệu từ json
Khi bạn bật phân tích cú pháp json cho bộ chọn css, bạn có thể lấy các giá trị từ json một cách dễ dàng.
Bản dịch tự động
Sử dụng trí thông minh nhân tạo của google cloud translate api, microsoft translator text api, yandex translate api hoặc amazon translate api để tự động dịch các bài đăng. lưu ý rằng đây là các dịch vụ trả phí, ngoại trừ yandex translate api. những người trả phí cũng cung cấp dịch vụ miễn phí trong một khoảng thời gian giới hạn. bạn có thể xem các trang định giá của họ để tìm hiểu thêm.
Kéo lại tự động
sử dụng tính năng quay để tự động viết lại nội dung của các bài đăng được thu thập thông tin nhằm cải thiện việc tối ưu hóa công cụ tìm kiếm. plugin content crawler hiện đang triển khai api spin rewriter và türkçe spin api, là các dịch vụ trả phí. bạn có thể truy cập trang web của họ để tìm hiểu chi tiết về giá cả.
Kiểm tra bài trùng lặp
Plugin content crawler kiểm tra các bài đăng trùng lặp theo url, tiêu đề bài đăng hoặc nội dung bài đăng. nếu bạn đang sử dụng woocommerce, các sản phẩm có sku đã tồn tại được coi là trùng lặp và chúng sẽ không được thêm vào trang web của bạn.
Lưu các sản phẩm woocommerce
Tiết kiệm giá, khoảng không quảng cáo, giao hàng, thuộc tính và các tùy chọn nâng cao. bạn có thể lưu sản phẩm dưới dạng đơn giản hoặc sản phẩm bên ngoài. bạn cũng có thể đặt các tùy chọn tệp có thể tải xuống và xác định sản phẩm là ảo. các tùy chọn có sẵn cho các phiên bản woocommerce lớn hơn hoặc bằng 3.3.
Xử lý các tập tin như một người chuyên nghiệp
đổi tên, sao chép và di chuyển các tệp đã lưu một cách dễ dàng. bạn cũng có thể xác định tiêu đề, mô tả, chú thích và văn bản thay thế cho các tệp phương tiện đã lưu bằng cách sử dụng các mẫu mà bạn có thể sử dụng bất kỳ mã ngắn nào. cũng có thể đặt tên ngẫu nhiên cho các tệp đã lưu.
Lưu nhanh
Với nút lưu nhanh, bạn có thể lưu cài đặt nhanh hơn nhiều. không cần đợi trang tải lại.
Lưu thuộc tính “srcset”
Khi các kích thước thay thế của hình ảnh đã lưu có sẵn, plugin sẽ gán chúng vào thuộc tính srcset của phần tử img để các trang của bạn sẽ tải nhanh hơn ở các kích thước màn hình khác nhau.
Cảnh báo
Tìm hiểu khi có vấn đề. plugin content crawler sẽ hiển thị cho bạn thông tin chi tiết về lỗi để bạn có thể khắc phục ngay lập tức.
Điều hướng giữa các cài đặt dễ dàng
Sửa điều hướng lên đầu! plugin content crawler lưu trữ vị trí của bạn trước khi chuyển sang tab mới và khôi phục vị trí trước đó của bạn khi bạn kích hoạt lại tab đó. không còn bị lạc giữa các cài đặt.
Thêm url vào cơ sở dữ liệu
plugin content crawler thu thập url tự động. tuy nhiên, nếu bạn muốn nó chỉ thu thập thông tin các url nhất định, bạn có thể thêm chúng vào cơ sở dữ liệu theo cách thủ công bằng cách sử dụng công cụ thu thập thông tin thủ công. bằng cách này, các url được chỉ định sẽ được tự động thu thập thông tin bằng cách sử dụng các tùy chọn lập lịch của bạn.
Nhập khẩu xuất khẩu
Bạn có thể nhập và xuất các cài đặt trang web một cách dễ dàng. chỉ cần sao chép và dán mã được tạo bởi plugin content crawler.
Bảng điều khiển chi tiết của plugin content crawler
xem những gì đang xảy ra trong nền. các trang web đang hoạt động, số lượng bài đăng được thu thập thông tin, số lượng bài đăng được cập nhật, bài đăng được thu thập thông tin cuối cùng và cập nhật, url được thêm lần cuối, sự kiện cron lần cuối và tiếp theo, bài đăng và url hiện đang được lưu…
Lời kết
Chúng tôi hy vọng bạn sẽ thích bài viết về Plugin WP Content Crawler. Nếu mua WP Content Crawler thì hãy mua tại AEDIGI với giá rẻ – uy tín để đảm bảo không bị nhiễm mã độc thay vì tải miễn phí từ những địa chỉ website không rõ ràng, chính chủ nhé. Chúc các bạn may mắn, thành công!
Chưa có đánh giá nào.