Các thuật ngữ liên quan tới trí tuệ nhân tạo (AI) giờ đây đã vượt ra ngoài lĩnh vực khoa học máy tính và dần trở thành một phần trong ngôn ngữ hàng ngày. Rất nhiều khái niệm từng chỉ xuất hiện trong giáo trình kỹ thuật giờ đã được nhắc tới liên tục trong công việc và đời sống.
Bài viết dưới đây sẽ giải thích những thuật ngữ AI phổ biến nhất hiện nay theo cách dễ hiểu hơn, đồng thời đưa thêm ví dụ thực tế trong lĩnh vực kế toán và doanh nghiệp để giúp hình dung rõ hơn cách các công nghệ này hoạt động.
Artificial Intelligence (AI) là gì?
Khái niệm Artificial Intelligence — hay trí tuệ nhân tạo — được đặt ra từ năm 1955 và phổ biến rộng hơn vào năm 1956, dù ý tưởng về máy móc có khả năng “suy nghĩ” đã xuất hiện từ trước đó khá lâu.
Theo từ điển Merriam-Webster, AI là khả năng của hệ thống máy tính hoặc thuật toán trong việc mô phỏng hành vi thông minh của con người.
Tất nhiên, mức độ “thông minh” này đã thay đổi rất nhiều theo thời gian cùng với sự phát triển của công nghệ. Ví dụ, nếu nhìn vào các dây chuyền sản xuất ô tô hiện đại ngày nay, mức độ tự động hóa trong nhà máy có thể từng được xem là “AI cực kỳ tiên tiến” nếu đặt trong bối cảnh vài thập kỷ trước.

Generative AI là gì?
Generative AI là tập hợp nhiều công nghệ AI phát triển liên tục từ sau năm 1956, nhưng bước ngoặt lớn xảy ra vào năm 2017 khi các nhà nghiên cứu của Google công bố paper nổi tiếng mang tên “Attention Is All You Need”.
Công trình này giới thiệu cơ chế cho phép máy tính đọc toàn bộ câu hoặc đoạn văn rồi xác định mức độ quan trọng của từng từ dựa trên các từ xuất hiện trước đó.
Nói đơn giản, AI sẽ hiểu rằng từ “bank” có thể mang nghĩa hoàn toàn khác nhau nếu trước đó xuất hiện từ “river” thay vì “loan”. Tất cả đều phụ thuộc vào context.
Điều này thực chất khá giống cách kế toán viên làm việc hàng ngày. Khi auditor kiểm tra giao dịch để tìm dấu hiệu gian lận, họ cũng luôn đặt dữ liệu trong context cụ thể của doanh nghiệp. Một giao dịch có thể bình thường ở cửa hàng vật liệu xây dựng nhưng lại bất thường ở tổ chức tôn giáo.
Large Language Model (LLM) là gì?
Large Language Model — hay LLM — chính là “xương sống” phía sau generative AI hiện đại.
LLM chứa lượng dữ liệu huấn luyện khổng lồ được thu thập từ internet. Khi người dùng nhập prompt, generative AI sẽ áp dụng xác suất và thống kê trên lượng dữ liệu này để tạo phản hồi phù hợp. Quá trình này giống như việc kế toán viên lấy dữ liệu từ chart of accounts rồi tạo biểu đồ hoặc phân tích xu hướng để tìm outlier.
Nói cách khác, LLM không “suy nghĩ” như con người, mà dự đoán token tiếp theo dựa trên pattern đã học từ dữ liệu huấn luyện.
Prompt là gì?
Prompt đơn giản là đoạn văn bản người dùng nhập vào công cụ AI.
Trước khi AI tạo phản hồi, hệ thống phải phân tích prompt để xác định context và mức độ quan trọng của từng từ. Sau đó, AI mới bắt đầu sinh phản hồi dựa trên chính context đó.
Điểm thú vị là khi tạo từng từ tiếp theo trong câu trả lời, AI cũng tiếp tục dùng context của phần nội dung nó vừa tạo ra trước đó. Điều này giống như khách hàng hỏi kế toán về tờ khai thuế. Kế toán viên sẽ cân nhắc từ ngữ khách hàng dùng, đồng thời kết hợp context từ hồ sơ thuế để đưa ra phản hồi phù hợp.
Token là gì?
Token là đơn vị cơ bản mà AI có thể hiểu được.
Trong nhiều trường hợp, một token tương đương một từ, nhưng đôi khi nó chỉ là một phần của từ dài hơn. AI sử dụng các token cùng thứ tự xuất hiện của chúng để xử lý dữ liệu huấn luyện và tạo phản hồi.
Context, reasoning và prediction của AI đều được xây dựng dựa trên token.
Temperature là gì?
Temperature là tham số quyết định mức độ “sáng tạo” hay “ngẫu nhiên” của AI khi chọn token tiếp theo.
Temperature thấp sẽ khiến AI phản hồi chặt chẽ, cứng hơn và thiên về tính chính xác. Trong khi đó, temperature cao — ví dụ 0.9 — sẽ khiến model thử nhiều khả năng ít phổ biến hơn, phù hợp với công việc sáng tạo nhưng cũng dễ làm tăng nguy cơ sai sót.
Với các công việc kế toán hoặc xử lý dữ liệu factual, temperature thấp thường an toàn hơn.
Foundation Model là gì?
Foundation model là các mô hình nền tảng mà nhiều công ty AI sử dụng để xây dựng sản phẩm của mình.
Đây chính là những cái tên quen thuộc như GPT của OpenAI, Gemini của Google hay Claude của Anthropic.
Thay vì tự xây dựng LLM từ đầu — vốn cực kỳ tốn kém — nhiều doanh nghiệp sẽ license hoặc tích hợp foundation model từ các nhà cung cấp này để bổ sung tính năng AI vào sản phẩm của họ.
Alignment là gì?
Alignment là khả năng AI duy trì đúng mục tiêu mà người dùng đặt ra.
Ví dụ, nếu prompt nói rằng “hãy giúp tôi quản lý inbox nhưng không được xóa email”, thì alignment của AI là hỗ trợ xử lý email nhưng tuyệt đối không được thực hiện hành động xóa.
Trong suốt quá trình làm việc, AI có thể nhận thêm nhiều hướng dẫn khác nhau, nhưng mục tiêu cốt lõi ban đầu vẫn phải được giữ nguyên.
Fine-tuning là gì?
Fine-tuning là quá trình tinh chỉnh foundation model để phù hợp hơn với một nhiệm vụ hoặc phong cách phản hồi cụ thể.
Ví dụ, một nền tảng nghiên cứu thuế có thể fine-tune model để phản hồi theo cấu trúc nhất quán dành cho tax memo hoặc legal research.
Nói cách khác, fine-tuning không chỉ giúp AI trả lời đúng hơn, mà còn giúp định hình cách câu trả lời được trình bày.
Retrieval-Augmented Generation (RAG) là gì?
RAG là phương pháp cung cấp thêm dữ liệu cụ thể cho AI để hệ thống tập trung vào nguồn thông tin đó khi trả lời câu hỏi.
Ví dụ đơn giản là doanh nghiệp lưu toàn bộ SOP nội bộ dưới dạng text rồi kết nối chúng với AI. Nhân viên có thể hỏi AI về quy trình công ty và hệ thống sẽ trả lời dựa trên tài liệu nội bộ thay vì dữ liệu chung trên internet.
Những hệ thống RAG phức tạp hơn có thể dùng chart of accounts hoặc database doanh nghiệp để hỗ trợ phân loại giao dịch hoặc đưa ra recommendation.
Context Window là gì?
AI chỉ có thể “nhớ” một lượng văn bản giới hạn trong cùng một thời điểm. Lượng văn bản này được gọi là context window.
Context window bao gồm toàn bộ prompt và phản hồi xuất hiện trong một cuộc trò chuyện với AI. Ví dụ, một số model của Anthropic có context window khoảng 200.000 token — tương đương gần hai cuốn tiểu thuyết trung bình.
Khi context trở nên quá dài, model sẽ bắt đầu nén hoặc tóm tắt nội dung cũ để tiếp tục xử lý. Tuy nhiên, quá trình này đôi khi khiến AI “quên” những alignment hoặc thông tin quan trọng đã được đề cập trước đó.
Model Context Protocol (MCP) là gì?
Model Context Protocol (MCP) là phương thức cho phép AI kết nối với các công cụ và hệ thống hiện có. Chẳng hạn như việc dùng app trên điện thoại để kết nối với hệ thống kế toán general ledger. Lúc này, điện thoại đóng vai trò giống foundation model, còn app giống MCP server. Hai bên có thể giao tiếp với nhau vì cùng sử dụng “ngôn ngữ chung” — trong trường hợp này là giao thức MCP.
Đây cũng là lý do MCP đang được xem là một trong những nền tảng quan trọng nhất cho AI agent và automation workflow hiện đại.
Agentic AI là gì?
Agentic AI là dạng AI có khả năng tự thực hiện hành động thay vì chỉ tạo văn bản phản hồi.
Ví dụ cơ bản gồm gửi email, nhập dữ liệu hoặc thao tác với phần mềm doanh nghiệp.
AI agent có thể tự xác định cách đạt được mục tiêu mà người dùng giao bằng cách kết hợp nhiều công nghệ đã đề cập phía trên. Ví dụ, người dùng cung cấp hóa đơn PDF rồi yêu cầu AI nhập dữ liệu vào phần mềm kế toán như Xero. Agent sẽ tự đọc PDF, kết nối tới MCP server của Xero, kiểm tra vendor đã tồn tại hay chưa rồi nhập giao dịch vào hệ thống.
Đây chính là hướng phát triển khiến AI dần chuyển từ “công cụ trả lời câu hỏi” sang “hệ thống có khả năng tự vận hành workflow”.
Rất nhiều thuật ngữ AI từng chỉ xuất hiện trong giáo trình kỹ thuật giờ đã trở thành khái niệm phổ biến trong công việc hàng ngày.
Khi AI tiếp tục được tích hợp sâu hơn vào doanh nghiệp, hiểu các khái niệm như LLM, RAG, MCP hay agentic AI sẽ ngày càng quan trọng — không chỉ với developer mà cả kế toán, quản lý và nhân sự văn phòng nói chung. Bởi trong vài năm tới, AI có thể không còn là “công nghệ dành cho dân kỹ thuật”, mà sẽ trở thành một phần rất bình thường trong cách con người làm việc hàng ngày.
Hướng dẫn AI
Học IT










Hàm Excel