Nếu làm việc chuyên nghiệp với Excel, có lẽ bạn đã từng thử nghiệm tạo công thức bằng AI. Thông thường, ChatGPT được khuyến nghị, và nó thực sự tốt. Nhưng ChatGPT không còn là lựa chọn duy nhất nữa, và nó không phải lúc nào cũng là lựa chọn tốt nhất - đặc biệt nếu bạn muốn một thứ gì đó miễn phí, riêng tư hoặc có thể chạy trên phần cứng của riêng bạn.
Gemma 4 của Google, GPT-4o của OpenAI (phiên bản miễn phí) và Llama 4 của Meta đều đại diện cho thế hệ mô hình AI mới có thể xử lý các yêu cầu công thức Excel với hiệu quả đáng ngạc nhiên. Sau khi dành hai tuần qua để chạy các thử nghiệm có cấu trúc trên cả 3 tùy chọn để tìm ra mô hình nào thực sự cho ra kết quả Excel đáng tin cậy nhất, hướng dẫn này chia sẻ kết quả, bao gồm cả các câu lệnh chính xác đã được sử dụng và những công thức mà mỗi mô hình trả về.
So sánh trực tiếp: 5 bài toán công thức Excel thực tế
Đưa cho mỗi mô hình 5 bài toán giống nhau, sử dụng cùng một từ ngữ và ngữ cảnh. Mỗi bài toán mô tả một tình huống Excel thực tế với các tham chiếu cột và kết quả mong đợi. Kết quả được đánh giá dựa trên 3 tiêu chí: Tính chính xác của công thức (nó có cho ra kết quả đúng không?), chất lượng giải thích (mô hình có giải thích logic rõ ràng không?), và khả năng xử lý các trường hợp ngoại lệ (nó có tính đến các ô trống, lỗi hoặc đầu vào bất thường không?).
Bài kiểm tra 1: Hàm SUMIFS với nhiều điều kiện
Prompt:
Tôi có một bảng doanh số bán hàng trong Excel. Cột A là tên người bán hàng, cột B là khu vực (North, South, East, West), cột C là danh mục sản phẩm và cột D là số tiền bán hàng. Viết công thức cho ô F2 để tính tổng tất cả doanh số bán hàng từ khu vực North cho danh mục Electronics.Gemma 4: Trả về =SUMIFS(D:D, B:B, "North", C:C, "Electronics"). Chính xác ngay lần đầu tiên. Đã giải thích rõ ràng cách SUMIFS đánh giá nhiều tiêu chí cùng lúc. Cũng đề xuất sử dụng định dạng tham chiếu bảng như một phương án thay thế.
GPT-4o: Trả về =SUMIFS(D:D, B:B, "North", C:C, "Electronics"). Công thức chính xác giống hệt. Đã thêm phần giải thích dài hơn với phân tích từng bước của mỗi đối số. Cũng chủ động đề cập rằng SUMIFS không phân biệt chữ hoa chữ thường.
Llama 4: Trả về =SUMIFS(D:D, B:B, "North", C:C, "Electronics"). Chính xác. Phần giải thích đầy đủ nhưng ngắn gọn hơn hai tùy chọn kia. Không đề cập đến tính phân biệt chữ hoa chữ thường hoặc các phương án thay thế.
Kết luận: Cả 3 đều làm đúng bài này. SUMIFS được sử dụng rộng rãi trong dữ liệu huấn luyện, vì vậy điều này rất dễ hiểu. GPT-4o đã đưa ra lời giải thích kỹ lưỡng nhất.
Bài kiểm tra 2: Hàm IF lồng nhau để phân loại
Prompt:
Cột E chứa điểm thi (0-100). Viết công thức cho ô F2 để phân loại từng điểm: 90 trở lên là Distinction, 75-89 là Merit, 60-74 là Pass, dưới 60 là Fail.Gemma 4: Trả về =IF(E2>=90, "Distinction", IF(E2>=75, "Merit", IF(E2>=60, "Pass", "Fail"))). Chính xác. Cũng đề xuất sử dụng IFS như một phương án thay thế gọn gàng hơn cho người dùng Microsoft 365 và đề cập đến việc bao bọc công thức trong IFERROR để xử lý các ô trống.
GPT-4o: Trả về cấu trúc IF lồng nhau tương tự. Cũng đề xuất phương án IFS. Đi xa hơn bằng cách đề xuất phương pháp dựa trên SWITCH và giải thích lý do tại sao các hàm IF lồng nhau đánh giá từ trên xuống dưới, điều này quan trọng đối với thứ tự ngưỡng.
Llama 4: Trả về một hàm IF lồng nhau chính xác. Không đề cập đến IFS hoặc SWITCH. Phần giải thích khá cơ bản nhưng không đề cập đến các trường hợp ngoại lệ như ô trống hoặc dữ liệu không phải số.
Kết luận: Tất cả đều đúng. Gemma 4 và GPT-4o đều đưa ra các gợi ý xử lý trường hợp ngoại lệ thực tế. Phần giải thích của GPT-4o mang tính giáo dục nhất.
Bài kiểm tra 3: INDEX-MATCH với nhiều tiêu chí
Prompt:
Tôi có một bảng giá. Cột A là tên sản phẩm, cột B là kích thước (Small, Medium, Large), và cột C là giá. Viết công thức cho ô G2 để tra cứu giá của sản phẩm trong E2 và kích thước trong F2. Có thể có các tên sản phẩm trùng lặp với các kích thước khác nhau.Gemma 4: Trả về công thức =INDEX(C:C, MATCH(1, (A:A=E2)*(B:B=F2), 0)) kèm theo ghi chú rằng đây là công thức mảng và cần được nhập bằng tổ hợp phím Ctrl + Shift + Enter trong các phiên bản Excel cũ hơn, hoặc sẽ hoạt động bình thường trong Microsoft 365. Chính xác và giải thích rõ ràng.
GPT-4o: Trả về cùng phương pháp INDEX-MATCH. Cũng đề xuất một phương án XLOOKUP sử dụng cột phụ trợ và phương pháp dựa trên FILTER cho Microsoft 365. Rất kỹ lưỡng, nhưng các tùy chọn bổ sung có thể làm người mới bắt đầu cảm thấy choáng ngợp.
Llama 4: Trả về công thức =INDEX(C:C, MATCH(E2&F2, A:A&B:B, 0)). Phương pháp nối chuỗi này hoạt động nhưng kém mạnh mẽ hơn - nó có thể tạo ra các kết quả khớp sai khi tên sản phẩm và kích thước trùng khớp với cùng một chuỗi (ví dụ: "LargeBox" + "Small" khớp với "Large" + "BoxSmall"). Mô hình không chỉ ra hạn chế này.
Kết luận: Cả Gemma 4 và GPT-4o đều tạo ra phương pháp mảng dựa trên phép nhân mạnh mẽ hơn. Phương pháp nối chuỗi của Llama 4 hoạt động trong hầu hết các trường hợp nhưng có một lỗi nhỏ mà nó không đề cập đến. Đây là loại trường hợp ngoại lệ quan trọng trong các bảng tính sản xuất.
Bài kiểm tra 4: Trích xuất văn bản giữa các dấu phân cách
Prompt:
Cột A chứa mã đơn hàng được định dạng như 'ORD-12345-UK'. Viết công thức cho ô B2 để trích xuất chỉ phần số (12345) từ mã, giả sử định dạng luôn là TIỀN TỐ-SỐ-HẬU TỐ với dấu gạch ngang làm dấu phân cách.Gemma 4: Trả về =MID(A2, FIND("-",A2)+1, FIND("-",A2,FIND("-",A2)+1)-FIND("-",A2)-1). Chính xác. Giải thích rõ ràng logic FIND lồng nhau, lưu ý rằng lệnh FIND thứ hai bắt đầu tìm kiếm sau dấu gạch ngang đầu tiên.
GPT-4o: Trả về công thức MID-FIND giống hệt. Cũng đề xuất một phương án TEXTSPLIT cho Microsoft 365: =TEXTSPLIT(A2,"-",,2) để lấy đoạn thứ hai. Ngoài ra, đề xuất sử dụng hàm VALUE() để chuyển đổi văn bản được trích xuất thành số nếu cần cho các phép tính.
Llama 4: Trả về công thức MID-FIND tương tự nhưng với tên biến hơi khác trong phần giải thích, khiến việc theo dõi khó khăn hơn. Bản thân công thức thì đúng.
Kết luận: Cả ba đều đưa ra công thức chính xác. Đề xuất TEXTSPLIT của GPT-4o là một bổ sung thực sự hữu ích cho người dùng Microsoft 365. Phần giải thích của Gemma 4 là rõ ràng nhất.
Bài kiểm tra 5: Tổng lũy kế đặt lại hàng tháng
Prompt:
Cột A chứa ngày tháng và cột B chứa số tiền doanh thu hàng ngày. Viết công thức cho C2 tạo tổng lũy kế doanh thu reset về 0 vào đầu mỗi tháng.Gemma 4: Trả về =SUMIFS(B$2:B2, MONTH(A$2:A2), MONTH(A2), YEAR(A$2:A2), YEAR(A2)). Chính xác và thanh lịch. Phạm vi mở rộng với hàng bắt đầu cố định tạo ra tổng lũy kế, và tiêu chí MONTH/YEAR đảm bảo nó được reset mỗi tháng. Cũng cần lưu ý rằng dữ liệu phải được sắp xếp theo ngày để điều này hoạt động chính xác.
GPT-4o: Trả về phương pháp dựa trên SUMPRODUCT: =SUMPRODUCT((MONTH(A$2:A2)=MONTH(A2))*(YEAR(A$2:A2)=YEAR(A2))*B$2:B2). Cũng chính xác, và tránh được các biến chứng tiềm ẩn của công thức mảng trong những phiên bản Excel cũ hơn. Đã đưa ra lời giải thích tốt nhưng không đề cập đến yêu cầu sắp xếp theo ngày.
Llama 4: Trả về =SUMPRODUCT((MONTH($A$2:A2)=MONTH(A2))*($B$2:B2)). Công thức này bỏ qua kiểm tra YEAR, nghĩa là nó sẽ kết hợp sai tháng 1 năm 2025 với tháng 1 năm 2026 nếu dữ liệu trải dài nhiều năm. Đây là một lỗi đáng kể đối với bất kỳ tập dữ liệu nào dài hơn 12 tháng.
Kết luận: Gemma 4 là mô hình sạch sẽ và hoàn chỉnh nhất. GPT-4o chính xác nhưng thiếu sót ở phần sắp xếp. Llama 4 có một lỗi logic nghiêm trọng. Bài kiểm tra này đã cho thấy khoảng cách chất lượng lớn nhất giữa các mô hình.
Mô hình nào xử lý các trường hợp ngoại lệ tốt hơn?
Sự khác biệt thực sự nằm ở khả năng xử lý các trường hợp ngoại lệ. Các công thức đơn giản - SUMIFS, IF cơ bản, VLOOKUP - hoạt động tốt trên cả ba mô hình. Vấn đề bắt đầu khi yêu cầu liên quan đến logic nhiều bước, giới hạn ngày tháng, khả năng không nhất quán dữ liệu hoặc những hàm dành riêng cho từng phiên bản.
Gemma 4 hoạt động nhất quán nhất trong việc chủ động cảnh báo các vấn đề tiềm ẩn. Khi tạo công thức tổng lũy kế, nó đã lưu ý yêu cầu sắp xếp theo ngày mà không cần được hỏi. Khi sử dụng mẫu công thức mảng, nó đã đề cập đến yêu cầu Ctrl + Shift + Enter đối với Excel phiên bản cũ. Khả năng nhận biết ngữ cảnh này tạo ra sự khác biệt thực sự khi bạn xây dựng các bảng tính mà người khác sẽ sử dụng.
GPT-4o vượt trội trong việc cung cấp các phương pháp thay thế. Đối với hầu hết mọi yêu cầu, nó đưa ra hai hoặc ba cách để giải quyết cùng một vấn đề, thường bao gồm các hàm Microsoft 365 hiện đại cùng với những phiên bản tương thích với phiên bản cũ. Điều này cực kỳ hữu ích nếu bạn đang làm việc với các nhóm có nhiều phiên bản Excel khác nhau. Tuy nhiên, đôi khi nó bỏ sót các lưu ý thực tế (như yêu cầu sắp xếp) trong khi vẫn đảm bảo tính đầy đủ về cú pháp.
Llama 4 yếu nhất ở các trường hợp ngoại lệ. Phương pháp nối chuỗi cho INDEX-MATCH và việc thiếu kiểm tra YEAR trong tổng tích lũy chính là những lỗi thoạt nhìn có vẻ đúng nhưng lại gây ra vấn đề thực sự trong quá trình sản xuất. Nếu bạn sử dụng Llama 4 cho các công thức Excel, hãy lên kế hoạch xem xét kỹ lưỡng hơn mọi kết quả đầu ra.
Mô hình AI miễn phí nào chính xác nhất cho các công thức Excel?
Trong quá trình thử nghiệm trên 5 loại công thức phổ biến, cả Gemma 4 và GPT-4o (phiên bản miễn phí) đều đạt điểm cao về độ chính xác. Gemma 4 nhỉnh hơn ở các logic lồng nhau phức tạp và tra cứu đa tiêu chí, trong khi GPT-4o cung cấp những giải thích bằng ngôn ngữ đơn giản tốt hơn một chút. Llama 4 cạnh tranh tốt ở các công thức đơn giản hơn nhưng gặp khó khăn với những trường hợp ngoại lệ trong các tình huống nâng cao.
Hướng dẫn AI
Học IT










Hàm Excel