Trình duyệt AI được cho là tương lai của web. Lời quảng cáo như sau: Những trang web sẽ ngừng được thiết kế cho con người và bắt đầu được thiết kế cho các AI agent, với cấu trúc gọn gàng, các nút dễ dự đoán và ý định có thể đọc được bằng máy. Bạn sẽ không còn duyệt web nữa, mà sẽ ra lệnh. Agent sẽ quét, nhấp chuột, so sánh và quyết định thay mặt bạn. Tương lai đó có thể sẽ đến, nhưng hiện tại vẫn còn rất xa vời.
Hai trong số những nỗ lực nổi bật nhất hướng tới ý tưởng trình duyệt agentic là Comet của Perplexity và Atlas của OpenAI. Cả hai đều hứa hẹn sẽ hành động thay mặt bạn ngay trong trình duyệt. Vì vậy, hãy thử nghiệm chúng song song, sử dụng cùng một prompt, trên cùng một trang web, với cùng các ràng buộc. Cái nào hoạt động tốt nhất? Câu trả lời ngắn gọn: Chúng không giống nhau. Một trong số chúng luôn hoạt động tốt, nhanh và ít lỗi hơn.
Mục lục bài viết
Mua kính râm
Hiếm khi có lỗi, kích thước không chắc chắn

Nhiệm vụ khá đơn giản nhưng thực tế. Tác giả bài viết đã upload lên bức ảnh một cặp kính râm và yêu cầu agent tìm các sản phẩm trông tương tự trên một trang web mua sắm. Các ràng buộc rất rõ ràng: Thương hiệu uy tín, ít nhất xếp hạng 4 sao với 500 đánh giá trở lên, dưới 100 USD, cùng 3 lựa chọn cụ thể với liên kết và giá cả.
Atlas hoàn thành nhiệm vụ trong 1 phút 58 giây. Atlas đã phân tích hình ảnh, tạo ra mô tả bằng văn bản về chiếc kính râm và sử dụng mô tả đó để tìm kiếm trên Amazon. Nó trả về ba liên kết sản phẩm, đúng như yêu cầu. Thoạt nhìn, điều này có vẻ thành công. Nhưng khi tìm hiểu sâu hơn, mọi thứ lại không như ý. 2 trong số 3 liên kết bị hỏng. Tìm kiếm thủ công tên sản phẩm cho thấy không có sản phẩm nào thực sự gần giống với chiếc kính gốc trong ảnh. Atlas đã hoàn thành quy trình, nhưng khả năng phán đoán còn yếu.
Comet không hoàn thành nhiệm vụ và phải dừng lại ở phút thứ 5. Trong khi Atlas phân tích hình ảnh và hành động dựa trên sự hiểu biết đó, Comet dường như hoàn toàn mất phương hướng. Nó bị kẹt trong vòng cuộn vô tận của Amazon, liên tục load thêm các mặt hàng mà không tìm thấy bất kỳ thứ gì hữu ích. Nó cứ tiếp tục chạy cho đến khi tác giả yêu cầu nó dừng lại ở mốc 5 phút. Thay vì xác định sản phẩm, Comet lại tạo ra các liên kết đến trang kết quả tìm kiếm của Amazon thay vì những danh sách sản phẩm riêng lẻ. Kiểm tra thủ công các kết quả đó cho thấy không có sản phẩm nào giống với hình ảnh tham khảo.
Agent | Thời gian | Có hoàn thành nhiệm vụ không? | Kết quả |
|---|---|---|---|
Atlas | 1:58 | Có | Tệ |
Comet | 5:00 (buộc dừng) | Không | Kinh khủng |
Phân tích bảng tính và lập biểu đồ
Số liệu cần được tôn trọng

Tiếp theo là một nhiệm vụ về năng suất. Sử dụng một bảng tính đã mở sẵn, agent phải tóm tắt dữ liệu, chọn loại biểu đồ chính xác để hiển thị mối quan hệ giữa trọng lượng, mã lực và gia tốc từ 0 – 100, và sau đó thực sự xây dựng biểu đồ đó.
Atlas hoàn thành nhiệm vụ trong 2 phút 13 giây. Nó đã chọn biểu đồ bong bóng, ánh xạ chính xác trục X và Y, và đặt kích thước bong bóng phù hợp. Điều thú vị là, Atlas không dừng lại sau khi biểu đồ xuất hiện. Nó nhận thấy biểu đồ đang che khuất dữ liệu hiện có và đã cố gắng di chuyển nó. Nỗ lực đó đã thất bại. Nó đã dành gần 1 phút để cố gắng định vị lại biểu đồ, bị nhầm lẫn và cuối cùng bỏ cuộc - nhưng không phải trước khi quyết định di chuyển biểu đồ sang một trang tính mới. Quyết định đó thật kỳ lạ, mang đậm tính nhân văn. Kết quả cuối cùng gọn gàng, dễ đọc và chính xác.
Comet hoàn thành nhiệm vụ trong 4 phút 5 giây. Nó cũng chọn biểu đồ bong bóng, đó là lựa chọn đúng. Tuy nhiên, nó để tất cả các nhãn dữ liệu được hiển thị, khiến biểu đồ gần như không thể đọc được. Mặc dù nó tuyên bố thiết lập kích thước bong bóng dựa trên trọng lượng, nhưng trường kích thước thực tế lại trống - tất cả các bong bóng đều trông giống hệt nhau. Phần lớn sự chậm trễ đến từ việc Comet gặp khó khăn trong việc chọn đúng cột trong bảng tính. Về mặt kỹ thuật, chương trình đã hoàn thành nhiệm vụ, nhưng kết quả đầu ra cần được chỉnh sửa thủ công để có thể sử dụng được.
Agent | Thời gian | Có hoàn thành nhiệm vụ không? | Kết quả |
|---|---|---|---|
Atlas | 2:13 | Có | Tốt |
Comet | 4:05 | Có | Tệ |
Lên lịch họp
Chủ yếu là nhờ vào sự hỗ trợ của lịch

Nhiệm vụ này kiểm tra khả năng phối hợp nhiều bước giữa các dịch vụ. Nhân viên cần tạo sự kiện trên Google Calendar cho ngày hôm sau lúc 9:00 sáng, đặt tên phù hợp, đính kèm bảng tính đang được thảo luận, viết mô tả ngắn gọn giải thích về bảng tính, và sau đó xác nhận sự kiện đã được tạo.
Atlas hoàn thành trong 2 phút 48 giây. Nó mở Google Calendar trong một tab mới, tạo sự kiện đúng giờ và đặt tên là “Cars & Specs Discussion". Nó mở bảng đính kèm, tìm thấy bảng tính trong Google Drive, đính kèm, viết mô tả ngắn gọn và lưu sự kiện. Mọi thứ hoạt động như mong đợi, từ đầu đến cuối.
Comet hoàn thành trong 2 phút 53 giây. Nó thực hiện theo quy trình tương tự, đặt tên sự kiện là “Car Engines and Specs Review”. Nó viết mô tả bằng các gạch đầu dòng, điều này không được yêu cầu nhưng cũng không gây hại. Tuy nhiên, thay vì đính kèm trực tiếp file, nó đã dán liên kết đến bảng tính vào phần mô tả. Về mặt kỹ thuật, nhiệm vụ đã hoàn thành, nhưng kém trau chuốt hơn một chút.
Agent | Thời gian | Có hoàn thành nhiệm vụ không? | Kết quả |
|---|---|---|---|
Atlas | 2:48 | Có | Tuyệt vời |
Comet | 2:53 | Có | Tốt |
Tóm tắt email
Mục tiêu ở đây là phân loại. Công cụ cần xem hộp thư đến của bạn, tóm tắt những email chưa đọc gần nhất không phải là thông báo tự động, nhóm chúng theo chủ đề hoặc người gửi, đánh dấu bất kỳ email nào khẩn cấp và liệt kê các hành động được đề xuất.
Atlas hoàn thành nhiệm vụ trong 2 phút 18 giây. Nó sử dụng phương pháp "cưỡng chế", nhấp chuột vào từng email chưa đọc một. Điều gây khó chịu là hệ thống sẽ nhận diện một email là email tự động, rồi lại tiếp tục mở một email khác từ cùng người gửi với cùng tiêu đề - dường như không hề biết rằng email đó cũng chắc chắn là email tự động. Bỏ qua điểm thiếu hiệu quả đó, bản tóm tắt cuối cùng ngắn gọn, dễ đọc, và nó thực sự giống như bản tóm tắt hơn là một đống thông tin.
Comet hoàn thành nhiệm vụ trong 4 phút 43 giây. Nó bắt đầu bằng cách chọn tất cả email, sau đó dành cả 1 phút để tìm cách bỏ chọn chúng. Nó tìm kiếm từ khóa `is:unread`, bị choáng ngợp bởi số lượng email chưa đọc từ Asana, cố gắng lọc chúng ra, rồi nhận ra Asana không phải là nguồn gửi tự động duy nhất. Cuối cùng, nó từ bỏ hoàn toàn việc lọc và bắt đầu mở email thủ công - đánh dấu chúng là đã đọc trong quá trình này. Nó dừng lại sớm, sau đó tạo ra một bản tóm tắt chủ yếu là các email tự động đã được yêu cầu loại trừ một cách rõ ràng.
Agent | Thời gian | Có hoàn thành nhiệm vụ không? | Kết quả |
|---|---|---|---|
Atlas | 2:18 | Có | Tốt |
Comet | 4:43 | Có | Tệ |
Thêm sách vào Goodreads

Đây là nhiệm vụ đơn giản nhất: Thêm một cuốn sách cụ thể vào danh sách “Want to Read” trên Goodreads.
Atlas hoàn thành trong 54 giây. Ban đầu, nó tìm kiếm bằng tiêu đề đầy đủ và tên tác giả, kết quả hiển thị là các tài liệu hướng dẫn học tập thay vì chính cuốn sách. Sau đó, nó thử tìm kiếm chính xác tiêu đề nhưng không thành công, trước khi cuối cùng chỉ tìm kiếm "Neuromancer", tìm thấy kết quả chính xác và thêm nó vào danh sách. Hơi vòng vo, nhưng hiệu quả.
Comet hoàn thành trong 59 giây. Nó mở Goodreads, tìm kiếm “Neuromancer”, chọn kết quả đầu tiên và thêm vào. Ít lỗi hơn Atlas, nhưng vẫn mất thời gian lâu hơn một chút. Mô hình này đã trở nên quen thuộc: Hành động của Comet diễn ra chậm chạp, bất kể lý lẽ của nó có hợp lý hay không.
Agent | Thời gian | Có hoàn thành nhiệm vụ không? | Kết quả |
|---|---|---|---|
Atlas | 00:54 | Có | Xuất sắc |
Comet | 00:59 | Có | Xuất sắc |
Perplexity đã làm điều đó trước, nhưng OpenAI làm tốt hơn
Comet là một trong những trình duyệt agentic AI đầu tiên. Nhiều người không thích thuật ngữ đó - nó nghe giống như từ ngữ sáo rỗng của doanh nghiệp được ngụy trang thành sự đổi mới - nhưng đó là danh mục mà chúng ta buộc phải sử dụng. Ở trạng thái hiện tại, các agent này bị hạn chế rất nhiều. Chúng có thể thực hiện các tác vụ, nhưng trong hầu hết mọi trường hợp, bạn sẽ nhanh hơn và ít bực bội hơn nếu tự mình làm việc đó.
Ngay cả khi một agent về mặt kỹ thuật tiết kiệm thời gian, thì chi phí phải viết một prompt chính xác thường làm mất đi lợi ích đó. Bạn có thể tự vẽ biểu đồ bong bóng này trong chưa đến 10 giây. Không có tác vụ nào ở đây mà Atlas hay Comet hoàn thành trong vòng chưa đến 50 giây. Việc thêm sách vào Goodreads thì gần bằng, nhưng bạn có thể thêm thủ công trong 5 giây.
Chúng thú vị như những thử nghiệm, và hấp dẫn như những ý tưởng, nhưng chúng chưa sẵn sàng. Trong hai công cụ này, Atlas của OpenAI rõ ràng là tùy chọn chiến thắng - không phải vì nó hoàn hảo, mà vì nó ít gặp sự cố nghiêm trọng hơn, phục hồi mượt mà hơn và cho ra kết quả thường xuyên hơn, sát với những gì bạn thực sự yêu cầu. Đây chưa phải là tương lai của việc duyệt web, nhưng nó đang tiến gần hơn đến điều đó!
Hướng dẫn AI
Học IT










Hàm Excel
Download