Giới Thiệu Về Google Sheets Và AI
Việc trích xuất dữ liệu từ các trang web là một nhiệm vụ tương đối phức tạp mà cho đến gần đây, đòi hỏi một mức độ kỹ năng kỹ thuật. Việc phải đào sâu vào mã code hoặc script để trích xuất dữ liệu đã từng khiến nhiều người cảm thấy áp đảo, bản thân tôi cũng vậy.
Web scraping có thể hỗ trợ nhiều công việc SEO, như kiểm tra, phân tích đối thủ, và xem xét cấu trúc trang web và dữ liệu.
Google Sheets cung cấp những giải pháp đơn giản để giúp.
Một trong những giải pháp đó là hàm IMPORTXML cho phép người dùng trích xuất dữ liệu trang web chỉ với vài tham số. Nó giúp việc trích xuất dữ liệu trở nên dễ tiếp cận với đông đảo người dùng, đặc biệt là với những người không thành thạo về ngôn ngữ lập trình.
Trong hướng dẫn này, chúng tôi sẽ hướng dẫn bạn cách sử dụng Google Sheets và AI, đặc biệt là ChatGPT, cho web scraping mà không cần kỹ năng lập trình nâng cao.
ChatGPT trích xuất
Công Cụ: AI Và Chatbots
Chúng ta hiện nay đều quen thuộc với AI, ChatGPT, và các chatbot tương tự.
Thực tế, nhiều người trong chúng ta sử dụng các giải pháp như ChatGPT để viết mã code, script, và chương trình mà không cần hoặc chỉ với kiến thức lập trình hạn chế.
Chỉ cần cung cấp hướng dẫn chi tiết dưới dạng thông điệp và làm việc với chatbot để xây dựng các công cụ mà cho đến gần đây chúng ta tin rằng đã vượt quá khả năng của mình.
Nhưng quan trọng nhất, đây là những công cụ đang thay đổi sâu sắc cách chúng ta tiếp cận công việc hàng ngày của mình.
ChatGPT trích xuất từ 30 bài viết
Nhiệm Vụ
Vậy làm thế nào nếu chúng ta muốn trích xuất dữ liệu mà không phải là thông tin chuẩn so với một tiêu đề trang hoặc mô tả?
Ví dụ, làm thế nào nếu chúng ta muốn trích xuất dữ liệu sau từ trang chính PPC của Search Engine Journal?
Liệt kê tất cả các bài viết nổi bật, tác giả của họ, các liên kết URL, và mô tả bài viết cho các cột được liệt kê trên https://www.searchenginejournal.com/category/paid-media/pay-per-click/.
Chúng ta có thể làm điều đó trực tiếp với ChatGPT không?
ChatGPT hướng dẫn trích xuất
Thực Hiện Với ChatGPT
Khi tạo các yêu cầu, cần một số lần thử để cung cấp hướng dẫn đủ chi tiết để chatbot hiểu đúng mục tiêu của nhiệm vụ và trả về kết quả tốt.
Trong nhiều trường hợp, cảm giác như AI đang gặp áp lực để trả kết quả nhanh chóng mặc dù độ chính xác của chúng.
Nhưng hãy để tôi giải thích.
Nhiệm vụ là phân tích trang và liệt kê tất cả các bài viết nổi bật, tác giả của họ, liên kết URL, và mô tả cho mỗi trong số 30 bài viết được liệt kê trên trang. Sau đó tổng hợp dữ liệu vào một bảng và cuối cùng xuất nó vào một tệp CSV.
Đơn giản phải không?
Ban đầu, ChatGPT chỉ trả lại mẫu của bảy bài viết và chỉ tiêu đề và liên kết URL; sau khi điều chỉnh yêu cầu, nó đã quản lý liệt kê và xuất tất cả 30 bài viết và liên kết của chúng.
ChatGPT trích xuất từ 30 bài viết
Kết Luận
Vậy làm thế nào ChatGPT so với ChatGPT + Google Sheets IMPORTXML?
Trong trải nghiệm của tôi, tôi không tìm thấy cách dễ dàng và nhanh chóng để sử dụng ChatGPT để trích xuất dữ liệu mà tôi đang tìm kiếm - đó không có nghĩa là điều này không thể, và có thể có nhiều cách để làm điều này, nhưng tôi không tìm thấy.
Điều hoạt động cho tôi là sự kết hợp của các công cụ khác nhau, và điều đó đã phục vụ tôi rất tốt cho mục đích dự định của mình.
ChatGPT rất hữu ích để viết các công thức IMPORTXML mà tôi cần sử dụng trong Google Sheets, và những công thức đó đã làm phần còn lại.
Google Sheets trích xuất kết quả
Kết Luận Quan Trọng
Điều này làm nổi bật một khía cạnh quan trọng của cách AI đã biến đổi cách chúng ta suy nghĩ và làm việc.
Công cụ tốt nhất cho công việc không chỉ đơn thuần là sử dụng AI, Google Sheets, hoặc bất kỳ phần mềm cụ thể nào một mình mà là sự kết hợp của các công cụ và kỹ năng.
Là trong sự tiếp cận tích hợp này mà chúng ta phát triển quy trình làm việc hiệu quả và hiệu quả, từ đó cải thiện năng suất tổng thể của chúng ta.