LLM như ChatGPT đọc câu thành token, mỗi token "chú ý" tới token khác để hiểu ngữ cảnh, rồi đoán token kế tiếp theo xác suất. Đây là bản trực giác đơn giản hoá của cơ chế attention — không phải toàn bộ kiến trúc.
—
Chọn "Kịch bản" để đổi cách xem (đường chú ý · ma trận · đa đầu · sinh văn bản · nhiệt độ · ngữ cảnh xa) · kéo Nhiệt độ để thấy phân bố nhọn/phẳng · bấm khái niệm để xem chi tiết
Trình duyệt chưa bật canvas.
Xác suất token đỉnh & nhiệt độ theo thời gianxác suất đỉnhnhiệt độ T